Une approche fondamentalement nouvelle pour explorer et classer la diversité fonctionnelle des séquences génomiques
En génomique, les séquences naturelles issues de milliards d’années d’évolution représentent un immense réservoir de diversité. Cependant, il reste encore peu exploré en raison, d’une part, des informations biochimiques, fonctionnelles et structurelles trop limitées dont on dispose et, d’autre part, d’un manque d’algorithmes puissants pour classifier les fonctions protéiques. Une équipe de recherche du Laboratoire de biologie computationnelle et quantitative (Sorbonne Université, CNRS), en collaboration avec le laboratoire Biologie du chloroplaste et perception de la lumière chez les microalgues (Sorbonne Université, CNRS), a développé une approche computationnelle inédite pour la classification fonctionnelle de familles protéiques. Présentée dans un article publié le 30 mars 2022 dans Molecular Biology and Evolution, cette approche vise à permettre la découverte de protéines jouant des rôles fonctionnels clés dans des domaines très variés tels que la biologie, la santé humaine ou les biotechnologies.
Multiple probabilistic models extract features from protein sequence data and resolve functional diversity of very different protein families. Vicedomini, R., Bouly, J. P., Laine, E., Falciatore, A., & Carbone, A. Molecular Biology and Evolution, 30 mars 2022. https://doi.org/10.1093/molbev/msac070