La transcription est la synthèse d’ARN à partir d’une matrice d’ADN, la première étape de l’expression génique. Chez les eucaryotes, le transcrit primaire subit une maturation extensive pour produire des molécules d’ARN fonctionnelles. Les transcrits peuvent être analysés par séquençage d’ARN et amplifiés par transcription inverse PCR.
ARN polymérases
Les procaryotes ont une seule ARN polymérase, une enzyme multi-sous-unités qui synthétise tous les types d’ARN. L’enzyme centrale se compose de sous-unités alpha, bêta et bêta-prime, et s’associe à un facteur sigma qui reconnaît les séquences promotrices. Le facteur sigma-70 reconnaît les promoteurs bactériens standard avec des séquences consensus -10 et -35.
Les eucaryotes ont trois ARN polymérases nucléaires. L’ARN polymérase I transcrit les gènes d’ARN ribosomique dans le nucléole. L’ARN polymérase II transcrit les gènes codant pour les protéines pour produire l’ARNm et de nombreux ARN non codants, avec son grand domaine CTD contenant des répétitions heptadiques qui sont phosphorylées pendant la transcription. L’ARN polymérase III transcrit les petits ARN, notamment l’ARNt, l’ARNr 5S et l’ARNsn.
Initiation de la transcription
La transcription commence au niveau de séquences promotrices qui dirigent l’ARN polymérase vers le site de départ correct. Chez les eucaryotes, l’ARN polymérase II nécessite l’assemblage de facteurs de transcription généraux au niveau du promoteur central. TFIID, contenant la protéine de liaison à TATA, reconnaît la boîte TATA, et d’autres facteurs recrutent la Pol II. Le complexe médiateur intègre les signaux régulateurs des facteurs de transcription liés aux enhancers. La sortie du promoteur suit, avec le CTD devenant phosphorylé à la sérine 5 par TFIIH, libérant la Pol II du complexe d’initiation.
Élongation
Pendant l’élongation, l’ARN polymérase se déplace le long du brin matrice, synthétisant l’ARN dans la direction 5-prime vers 3-prime. Le site actif ajoute des ribonucléotides complémentaires à la matrice, avec le brin d’ARN en croissance formant un hybride temporaire avec la matrice d’ADN. La bulle de transcription se déplace avec la polymérase, l’ADN se renroulant derrière et se déroulant devant. Au fur et à mesure de l’élongation, le CTD devient phosphorylé à la sérine 2, recrutant les facteurs de maturation de l’ARN. Des pauses et des reculs peuvent se produire, fournissant des points de contrôle régulateurs.
Terminaison
Les mécanismes de terminaison diffèrent selon les polymérases. L’ARN polymérase bactérienne se termine au niveau de structures en épingle à cheveux qui déstabilisent le complexe d’élongation, ou par le facteur Rho qui dissocie activement le complexe. L’ARN polymérase I se termine à des séquences spécifiques reconnues par les terminateurs. La terminaison de l’ARN polymérase II est couplée à la polyadénylation, le clivage du pré-ARNm déclenchant la libération du transcrit. L’ARN polymérase III se termine au niveau d’une série de résidus thymine dans la matrice.
Coiffe en 5-prime
L’extrémité 5-prime des transcrits de la Pol II est modifiée de manière co-transcriptionnelle. Une coiffe 7-méthylguanosine est ajoutée en orientation inverse par une liaison triphosphate 5-prime vers 5-prime. L’enzyme de coiffage est recrutée au CTD phosphorylé. La coiffe protège le transcrit des exonucléases 5-prime, améliore la traduction en se liant à eIF4E et facilite l’exportation nucléaire. La coiffe est également importante pour un épissage et une polyadénylation efficaces.
Épissage de l’ARN
La plupart des gènes eucaryotes contiennent des introns qui doivent être éliminés du pré-ARNm. L’épissage est catalysé par le splicéosome, un complexe dynamique de cinq snRNP et de nombreuses protéines. La réaction implique deux étapes de transestérification. Premièrement, l’hydroxyle 2-prime de l’adénosine du point de branchement attaque le site d’épissage 5-prime, formant un intermédiaire en lasso. Deuxièmement, l’hydroxyle 3-prime libre de l’exon 5-prime attaque le site d’épissage 3-prime, joignant les exons et libérant l’intron en lasso.
L’épissage alternatif permet à un seul gène de produire de multiples variants d’ARNm. Plus de 95 % des gènes humains subissent un épissage alternatif, élargissant considérablement le protéome. L’épissage est régulé par des séquences activatrices et inhibitrices qui lient respectivement les protéines SR et les hnRNP.
Maturation en 3-prime
Le pré-ARNm est clivé au site de polyadénylation, et une queue poly-A de 100 à 250 résidus d’adénine est ajoutée par la poly-A polymérase. Le facteur de spécificité de clivage et de polyadénylation reconnaît le signal de polyadénylation AAUAAA, tandis que le facteur de stimulation du clivage se lie aux éléments riches en GU en aval. Les facteurs de clivage I et II effectuent le clivage endonucléolytique. La protéine de liaison poly-A recouvre la queue, protégeant l’ARNm de la dégradation et favorisant la traduction.