En toute chose, il faut considérer le génome accessoire…
Pour une espèce donnée, certains gènes vont être présents chez tous les individus (appelé le génome core) alors que d’autres ne seront présents que chez certains individus (appelé le génome accessoire). L’impact et le poids du génome accessoire sur la diversité des caractères observée dans une population reste peu connu. Dans une étude publiée dans la revue Nature Genetics, des scientifiques ont entrepris la caractérisation systématique de l’impact du génome accessoire sur l’expression des gènes et ceci en utilisant la levure de boulanger, Saccharomyces cerevisiae, comme organisme modèle.
Le génome accessoire n’est pas si accessoire !
La régulation de l'expression génique est une étape essentielle mettant en relation le génotype (information portée par le génome d’un individu) et le phénotype (ensemble des caractères observables). Cependant, on ne connait que très peu de choses sur la régulation des gènes et surtout son origine génétique à l’échelle d’une population. La levure Saccharomyces cerevisiae, ou la levure de boulanger, est un organisme modèle de choix pour ce genre d’étude de par son génome de petite taille (12 Mb, soit ~300 fois moins grand que le génome humain) et de par sa diversité génétique élevée entre les individus au sein de l’espèce (0.8% en moyenne, soit ~10 fois plus élevé qu’entre les êtres humains). En utilisant plus de 1000 isolats naturels de cette levure, les chercheurs ont déterminé le transcriptome (c’est-à-dire le niveau d’expression de l’ensemble des gènes présent dans un génome) de chaque isolat de cette grande population et ont procédé à une analyse de l’ensemble de ces données. Ils contiennent les niveaux d’expression des gènes du génome core, représentant 4977 gènes qui sont invariablement présents dans tous les isolats, ainsi que celui des 1468 gènes du génome accessoire, présents uniquement chez certains isolats. En regardant le patron d’expression de ces deux ensembles de gènes, les scientifiques ont constaté que les gènes accessoires, comparés aux gènes cores, représentent un facteur clé sous-estimé de la variation de l'expression des gènes au niveau de l'espèce.
Dans cet article publié dans la revue Nature Genetics, les scientifiques montrent également que le paysage transcriptionnel correspond à une architecture à deux niveaux. Premièrement, un réseau de co-expression de 1797 gènes montre une expression coordonnée de certains gènes à travers des différents isolats, reflétant ainsi l’organisation fonctionnelle (processus biologiques) et topologique (organelles et autres structures subcellulaires) de la cellule . Ce réseau de co-expression, conservé au niveau de la population, représente le niveau central du paysage transcriptionnel de l’espèce.
Deuxièmement, certains gènes différentiellement exprimés sont souvent spécifiques à différentes sous-populations et mettent en évidence des signatures liées aux adaptations, principalement lié aux processus de domestication qui ont ponctués cette espèce. Par exemple, les gènes impliqués dans le métabolisme du galactose sont sur-exprimés de manière spécifique chez les souches isolées à partir de produits laitiers comme le fromage, et d’autres gènes impliqués dans l’utilisation de maltose (sucre dans les grains d’orge) sont sur-exprimés dans les souches isolées de bières. Au total, 2209 gènes sont différentiellement exprimés en fonction des sous-populations.
Enfin, par l’intermédiaire d’analyses pangénomiques d’association (plus communément appelé GWAS pour « Genome-Wide Association Studies »), la liste de variants génétiques ayant un impact sur l'expression des gènes a été déterminée. Les résultats ont souligné que les gènes accessoires sont proportionnellement associés à plus de variants génétiques avec effets importants comparé aux gènes du génome core. Les gènes accessoires étant important dans l’évolution des génomes et l’adaptation de certains sous-populations, ces résultats d’association confirme ainsi le rôle crucial de ces derniers dans l’architecture globale du paysage transcriptionnel au sein des populations naturelles.
Figure : Le réseau de co-expression des gènes basé sur les transcriptomes de 969 d’isolats naturels de la levure S. cerevisiae. L’organisation fonctionnelle des gènes, des complexes protéiques et les compartiments cellulaires est recapitulé par la hiérarchie de ce réseau.
Pour en savoir plus :
Pan-transcriptome reveals a large accessory genome contribution to gene expression variation in yeast.
E. Caudal, V. Loegler, F. Dutreux, N. Vakirlis, É. Teyssonnière, C. Caradec, A. Friedrich, J. Hou & J. Schacherer
Nature Genetics, 22 mai 2024, DOI : https://doi.org/10.1038/s41588-024-01769-9
Contact
Laboratoire
Génétique Moléculaire, Génomique et Microbiologie - GMGM (CNRS / Université de Strasbourg)
4 allée Konrad Roentgen
67000 Strasbourg, France