Lire l’ARN de tout son long, cellule par cellule

Résultats scientifiques Biochimie-biologie structurale

Les scientifiques décrivent une nouvelle méthode pour analyser plus finement la structure des ARN, afin d’y détecter des variations d’épissage ou d’édition avec une résolution allant jusqu’à la cellule unique. Ces approches, qui combinent des outils de microfluidique avec le séquençage des acides nucléiques sur de grandes longueurs, amélioreront la construction des atlas de cellules uniques qui sont en cours de réalisation. Ces résultats sont publiés dans la revue Nature Communications.

Lorsque nous considérons la quantité énorme de cellules présentes dans le corps d'un homme (~1013 cellules) ou même seulement d'une souris (~1010 cellules), il est difficile d’appréhender la diversité des types cellulaires présents, tous pourtant issus du même génome : cellules nerveuses, cellules musculaires, cellules immunitaires,… Chaque type cellulaire va différer des autres par l’expression de certains gènes, l’apparition de variants d’épissage, etc. Acquérir suffisamment d’information sur les différents gènes exprimés dans une cellule peut permettre de l’identifier, mais aussi révéler son fonctionnement ou un état particulier. Une telle information peut être exploitée pour mieux comprendre des étapes clés du développement embryonnaire, ou le déclenchement de certaines maladies. Plusieurs projets internationaux réalisent actuellement des atlas. Ainsi, le « Human Cell Atlas » cherche à cataloguer les types et états cellulaires existants chez l’homme à partir de mesures de l'expression des gènes à la résolution d’une cellule unique. De tels atlas vont bientôt représenter des systèmes de positionnements globaux que les biologistes pourront utiliser pour répondre à toutes sortes de questions : Combien y a-t-il de types cellulaires dans un organe ? Qu’est-ce qui différencie des types cellulaires identiques d’organes différents ? Comment des cellules voisines communiquent-elles ?

Plusieurs percées technologiques permettent l’élaboration de tels atlas : grâce aux progrès de la microfluidique, on sait isoler des milliers de cellules en parallèle ; à partir de ces cellules, des banques d'acide nucléique représentatives de la minuscule quantité de matériel présente dans une seule cellule peut être construite ; les progrès de la biologie computationnelle permettent d'analyser, d'explorer et de visualiser des ensembles de données contenant des milliards de mesures.

Si de nombreux protocoles sont aujourd’hui disponibles pour analyser les mutations somatiques ou la méthylation de l'ADN, l'accessibilité de la chromatine, les profils épigénétiques, les variations du nombre de copies, l'analyse des ARN à la résolution de la cellule unique (scRNA-seq) reste actuellement l'approche "omique" unicellulaire disposant du plus grand débit, et elle permet l'analyse du transcriptome (panorama global des ARN produits) de dizaines, voire de centaines de milliers de cellules.

Une limite actuelle du scRNA-seq réside dans la façon dont s’effectue le séquençage, qui est le plus souvent restreint à l’une des 2 extrémités de chaque ARN. Si ces informations sont suffisantes pour fournir une description quantitative du niveau d’expression des gènes, les informations sur l'épissage et l'hétérogénéité des séquences, réparties sur l’ensemble du transcrit, sont le plus souvent perdues.

Pour obtenir des informations plus complètes sur la séquence du transcriptome, les scientifiques ont utilisé l’ADN complémentaire complet (produit intermédiaire habituellement utilisé dans la fabrication des banques) avant qu'il ne soit fragmenté pour un séquençage à lecture courte (méthode Illumina). Cet ADN complémentaire de pleine longueur a donc été séquencé à l’aide d’un séquenceur à lecture longue (méthode Nanopore).

La méthode mise au point a été baptisée ScNaUmi-seq. La comparaison des séquences Nanopore avec celles fournies par le séquençage Illumina a permis d’identifier précisément chaque cellule et, à l’intérieur de chaque cellule, chaque molécule d’ADN complémentaire (répertoriée avec des codes-barres nucléotidiques baptisés «  unique molecular identifiers », UMI).  

Des expériences réalisées sur du cerveau embryonnaire de souris ont permis de générer de nouvelles informations sur des variations d’épissage des transcrits, et peuvent même détecter, à la résolution d’une seule cellule, des variations sur un seul nucléotide (édition de l'ARN). L'approche est facile à mettre en œuvre puisqu'elle ne fait qu’ajouter un séquençage à longue lecture de la banque non fragmentée au protocole standard d’analyse.

Ces nouvelles informations sur les transcrits enrichiront à coup sûr nos futures études sur cellules uniques. Un impact attendu se situe en cancérologie, puisque le ScNaUmi-seq pourrait permettre d'analyser le paysage mutationnel des tumeurs, mais aussi en biologie du développement, durant lequel l’épissage joue un rôle important. Ce développement ajoute donc une nouvelle couche d'information importante pour améliorer notre définition des différents types cellulaires. 

figure
© Kévin Lebrigand, Rainer Waldmann, Pascal Barbry
 
Figure : Profils d’expression de plusieurs isoformes d’un gène à la résolution de la cellule unique.
Haut : représentation des profils d’expression de cellules de cerveau de souris (18 jours après fertilisation) pour les deux principales isoformes de la clathrine (Clta 204 et Clta206).
Bas : structure des gènes (exons/introns) des 2 principales isoformes de Clta. L'abondance des différentes isoformes dans les différents types de cellules est représentée sous forme de diagramme à barres. Chaque ligne représente un type cellulaire différent : 1, Cajal-Retzius ; 2, glie radiaire; 3, glie radiaire proliférative ; 4, progéniteur intermédiaire ; 5, neurone GABAergique immature ; 6, GABAergique mature ; 7, neurone glutamatergique immature ; 8, neurone glutamatergique mature.

 

Pour en savoir plus:

High throughput error corrected Nanopore single cell transcriptome sequencing.
Lebrigand K, Magnone V, Barbry P, Waldmann R.

Nat Commun. 2020 Aug 12;11(1):4025. doi: 10.1038/s41467-020-17800-6.

Contact

Pascal Barbry
Chercheur CNRS à l'Institut de pharmacologie moléculaire et cellulaire (IPMC)

Laboratoire

Institut de Pharmacologie Moléculaire et Cellulaire (IPMC) - (CNRS/Université Côte d’Azur)
660, route des lucioles F06560 Sophia Antipolis