Le gène (ou cistron) est un segment d’ADN qui constitue l’unité d’expression menant à la formation d’un produit fonctionnel qui peut être sous la forme d’ARN ou de polypeptide.
Chez les procaryotes plusieurs gènes peuvent faire partie d’une même unité de transcription, on parle d’unité polycistronique dont l’exemple le plus classique est l’opéron lactose (cf. chapitre de régulation de l’expression des gènes).
Chez les eucaryotes les unités de transcription sont monocistronique (exception chez certains vertébrés).
Les gènes eucaryotes sont départagés dans 3 classes :
L’ARN polymérase est une protéine ADN dépendante, multimérique possédant les sous-unités α, β, β’ et σ. Elle est présente sous deux formes l’enzyme-cœur (α2ββ’) et l’holoenzyme (α2ββ’σ). Les ARN polymérases ne nécessitent pas d’amorce et ne possèdent pas d’activité exo-nucléasique et donc de correction d’erreur, le taux d’erreur est ainsi plus important que pour les ADN-polymérases, mais ce taux est supporté.
Les nucléotides triphosphates sont additionnés à l’extrémité 3’ de la chaîne en cours de synthèse par complémentarité de la matrice d’ADN. L’hydrolyse de la liaison anhydride fournit l’énergie pour la synthèse de la liaison phosphodiester.
La réaction est réalisée en milieu tamponné à pH neutre, contenant du sel de Mg2+, un agent de protection des groupements SH de l’enzyme (agent réducteur comme le β-mercaptoéthanol), les 4 ribonucléotides (rNTP) et de l’ADN bicaténaire contenant un promoteur comme matrice.
La molécule d’ADN est composée d’un brin matriciel (ou brin anti-codant) dirigé par définition de 3’ vers 5’ et servant comme son nom l’indique de matrice à l’ARN-polymérase, ainsi que d’un brin codant dirigé par définition de 5’ vers 3’ et ayant une séquence identique à l’ARN transcrit mise à part le fait que la thymine est changée par l’uridine. L’ARN messager est lui monocaténaire et dirigé tout comme le brin codant de 5’ vers 3’.
Chez E-coli, une seule ARN-polymérase catalyse la synthèse de tous les ARN de la cellule (en mettant à part l’ARN des amorces nécessaire à la réplication de l’ADN).
La transcription est divisée en plusieurs étapes : la pré-initiation, l’initiation, l’élongation et la terminaison.
Le promoteur est une séquence d’une centaine de nucléotides située dans la région régulatrice et désignant le début de la transcription. Il est situé en amont du site d’initiation et porte des éléments de séquence reconnus par l’ARN-polymérase et déterminant le sens de la transcription.
Le promoteur est constitué de courtes séquences conservées d’une unité de transcription à l’autre et appelées séquences consensus :
La force (ou efficacité) intrinsèque d’un promoteur est définie par le nombre relatif d’initiation par unité de temps (vitesse de la transcription). Elle dépend de la proportion des paires de bases A-T par rapport aux paires de bases C-G, de la position des séquences en -35 et en -10, en effet plus les séquences consensus sont proches du site d’initiation plus le promoteur sera fort et finalement de la force d’interaction de l’ARN-polymérase avec le promoteur.
Le promoteur agit sur la transcription du segment d’ADN qui lui est adjacent sur le même chromosome, on dit que le promoteur est actif en « cis ». Le promoteur n’est pas actif sur les séquences codantes situées ailleurs sur le chromosome, dans ce cas là on parlerait alors du qualificatif « trans ». Le cis s’oppose au trans.
L’affinité de l’ARN-polymérase pour l’ADN dépend de la forme de l’enzyme : l’enzyme-cœur a une affinité faible et non spécifique, l’holoenzyme a une affinité très forte et spécifique pour le promoteur. On peut faire la remarque que la sous-unité sigma σ à l’état libre ne se fixe pas sur l’ADN. La sous-unité β’ étant basique et l’ADN étant acide, ce sera elle qui facilitera l’interaction du complexe avec le promoteur.
La sous-unité sigma σ permet donc une reconnaissance spécifique du promoteur par l’ARN-polymérase et diminue l’affinité de l’enzyme pour les régions non promotrices. Il agit de manière cyclique, en effet après l’initiation faite, le facteur sigma se détache pour être recyclé et réutilisé pour d’autres initiations de gènes.
L’ARN-polymérase entraîne la dénaturation des deux brins d’ADN sur 14 paires de nucléotides, on parle de complexe ouvert qui augmente encore l’affinité de l’enzyme pour la double hélice.
L’initiation correspond à la synthèse de la première liaison phosphodiester réalisé par la sous-unité β qui correspond à la sous-unité catalytique de l’ARN-polymérase.
L’interaction de cette sous-unité est inhibée par la rifampicine qui inhibe ainsi de manière irréversible la transcription de l’ADN, c’est le cas de la tuberculose. Une mutation dans la SU β induit l’apparition de souches bactériennes résistantes à la rifampicine.
Le déroulement des premières étapes de la transcription est donc :
L’élongation correspond au déplacement de la bulle de transcription le long de la molécule d’ADN. La région désappariée est alors de 70 paires de bases. Pendant la transcription, l’ARN forme un court appariement avec le brin matriciel de l’ADN formant une hélice hybride ADN-ARN sur une dizaine de paires de bases.
L’élongation est inhibée par des aminosides ou amino-glucosides.
La terminaison se fait lorsque l’enzyme arrive au niveau d’une séquence spécifique appelée terminateur.
Le terminateur se présente sous la forme d’un palindrome (cf. lexique) qui peut être parfait ou imparfait. Ce palindrome entraîne une complémentarité de séquence au niveau de l’ARNm qui permet la mise en place d’une structure en épingle à cheveux (ou tige-boucle) qui est un appariement intra-chaîne qui déstabilise l’ARN-polymérase jusqu’à dissociation.
Elle peut être facilitée par un facteur rho ρ suivant la séquence du terminateur, on met ainsi en évidence des terminateurs rho indépendant (environ les 2/3) et des terminateurs rho dépendant (environ 1/3) :
Le transcrit primaire correspond à l’ARN non mature qui nécessite une maturation sous forme de clivages ou de modifications de bases. Cette maturation n’est pas obligatoire. Après maturation on obtient l’ARN mature. On peut prendre quelques exemples comme la maturation du transcrit primaire donnant les ARNr (transcrit primaire 45 S) ou les ARNt par des ribonucléases, ou la maturation du transcrit primaire codant les ARNm. Généralement, il y a peu de modifications pour les ARNm ; beaucoup d’ARNm sont traduits en protéines alors qu’ils sont encore transcrits (Attention : il n’y a pas de noyau chez les procaryotes).
Le transcrit primaire code soit pour un produit, on parle d’ARN monocistronique, soit plusieurs produits, on parlera alors d’ARN polycistronique (cf. début du cours, généralités).
Vidéo résumant les différents mécanismes entrant en jeu dans l’épissage.
Trois ARN-polymérases eucaryote ont été mis en évidence. Elles diffèrent par leur localisation dans le noyau, par la nature des ARN formés et de par leur sensibilité à des inhibiteurs tels que l’α-amanitine.
L’α-amanitine se fixe sur certaine sous-unité de l’ARN-polymérase et inhibe l’élongation de la transcription.
L’actinomycine D inhibe la transcription eucaryote et procaryote en s’intercalant entre certaine base de l’ADN pendant l’élongation.
L’ARN-polymérase II n’étant pas suffisante pour démarrer la transcription, elle nécessite d’autres protéines interagissant avec l’ADN du promoteur, appelées TFII (pour transcription factor II, facteurs de transcriptions interagissant avec l’ARN-polymérase II) :
Les séquences consensus sont plus nombreuses que chez les procaryotes, on trouve :
Le promoteur eucaryote est une structure modulaire. La TATA box et à l’INR box forme le promoteur minimum au niveau duquel se fixe l’ARN-polymérase II via les facteurs généraux de transcription.
On trouve en plus des séquences activatrices et amplificatrices jusqu’à -200 en amont du site d’initiation ; parmi elles on trouve la GC box et la CAAT box. Les séquences activatrices sont très variables et sont plus ou moins présentent à des nombres également variables suivant le promoteur. Ces boîtes constituent les sites de fixation des facteurs de transcription et permettent ainsi la modulation de l’activité du promoteur minimum.
Le terminateur au niveau de l’ARN est constitué de la séquence CPSF (AAUAAA) suivie par un site de poly-adénilation 20 nucléotides en aval, elle-même suivie de la séquence CSTF qui est une séquence riche en G/U qui s’apparie avec la séquence CPSF (formation d’une structure tige-boucle) et après laquelle il y aura clivage (cf. maturation du transcrit primaire, suite du cours).
Les enhancers fixent des protéines qui vont permettre l’amplification de l’expression des gènes de 10 à 100 fois. Ils peuvent agir en trans sur un promoteur hétérologue et sont actifs dans les deux directions. Ils sont généralement situés en amont du site d’initiation mais peuvent également se situer en aval au milieu de l’unité de transcription.
On pourra prendre comme exemple les récepteurs des hormones thyroïdiennes et les récepteurs des hormones stéroïdes (glucocorticoïde, progestérone, œstrogène). Les deux sont des récepteurs nucléaires et il y a ainsi action au niveau du noyau par modulation de l’expression de certains gènes.
Les silencers sont des séquences fixant des protéines qui inhibent l’expression des gènes en agissant à distance.
Les insulators sont des séquences isolantes qui permettent d’isoler certaines régions du génome.
La maturation des transcrits primaires à lieu dans le noyau de la cellule. Chez les procaryotes ce phénomène n’existe pas, le début de la traduction de l’ARNm se faisant avant la fin de la transcription, la cellule procaryote ne possédant pas de noyau.
Les transcrits primaires ne correspondent qu’aux produits de la transcription de l’ARN-polymérase II, ce qui ne veux pas pour autant dire que les produits de la transcription des autres ARN-polymérases ne sont pas soumis à des modifications post-transcriptionnelles. On parle de pré-ARNm, pré-ARNr et pré-ARNt.
La coiffe correspond à l’ajout d’un groupement, dit « m7G », par une liaison 5’-5’ tri-phosphate. Ce groupement m7G correspond à l’addition de trois groupements phosphates et d’une molécule de GTP au niveau de l’extrémité 5’ du transcrit primaire grâce à l’énergie libérée par l’hydrolyse de la molécule de GTP. Le nucléotide G va ensuite être méthylé sur le septième carbone (C7) pour donner la 7-méthyl-guanosine.
La coiffe est ajoutée grâce à un complexe protéique appelé « Cap-Binding-Complex » qui possédant une activité triphosphatase, une activité guanylyl-transférase et une activité méthyl-transférase.
La poly-adénilation correspond à l’ajout de jusqu’à 200 adénines à l’extrémité 3’ du transcrit primaire et ceci sans matrice par la poly-A-polymérase. La poly-A-polymérase reconnaît le signal de poly-adénilation qui n’est autre que la séquence CPSF (AAUAAA). 20 nucléotides en aval de cette séquence la poly-A-polymérase utilise sont activité endo-nucléasique et son activité A-polymérasique.
Après l’addition de la coiffe et la poly-adénilation, le transcrit primaire est encore soumis à l’excision des introns et l’épissage des exons ; les introns sont ainsi éliminés. Ceci est possible par la présence de site donneur d’épissage (dinucléotide GU) à l’extrémité 5’ des introns et de site accepteur d’épissage (dinucléotide CAG) à l’extrémité 3’ des introns.
Les jonctions d’épissage sont reconnues par les snRNPs (ou snurps pour Small-Nuclear-Ribonucleo-protein-Particules). Les snRNP correspondent à l’association de snRNA (snRNA U1, U2, U3, U4, U5, U6) et de protéines et l’ensemble des snRNPs s’appelle le spliceosome. Le snRNP U1 reconnaît le site donneur et le snRNP U2 reconnaît le site de branchement et le site accepteur.
L’excision des introns et l’épissage des exons se fait en plusieurs étapes :
Remarque :
Il existe certains ARN qui possèdent des introns auto-catalytiques qui ne nécessitent ainsi aucune protéine, l’activité enzymatique est portée par l’ARN lui-même, on parle de ribozymes.
Vidéo résumant les différents mécanismes entrant en jeu dans l’épissage.
A partir d’un transcrit primaire on peut avoir deux ou plus ARNm matures qui seront à l’origine de la formation des protéines-isoformes. Ceci est possible grâce à l’épissage alternatif qui consiste en l’élimination de certains exons. En effet certains exons sont constants au niveau des différents ARNm matures et d’autres sont variables et spécifiques du tissu dans lequel se trouve la protéine isoforme.
Exemple :
Au niveau du gène de la tropomyosine on met en évidence 12 exons au total dont 7 sont constants et 5 sont alternatifs.
Pathologies liées à un épissage anormal suite à des mutations :
On prendra pour exemple les β-thalassémies qui correspondent à des anémies héréditaires transmises sur le mode dominant dues à des anomalies dans la production de l’hémoglobine adulte. Certaines mutations induisent un épissage anormal du transcrit primaire (au niveau des sites donneurs, sites de branchement ou sites accepteurs).
Matthieu SIMON
Fondateur et rédacteur principal de Cours-Pharmacie