Genuttrykk - Gene expression

utvidet sentralt dogme
Det utvidede sentrale dogmet om molekylærbiologi inkluderer alle cellulære prosesser som er involvert i strømmen av genetisk informasjon

Genuttrykk er prosessen der informasjon fra et gen brukes til syntese av et funksjonelt genprodukt som gjør det mulig å produsere sluttprodukter, protein eller ikke-kodende RNA , og til slutt påvirke en fenotype , som den endelige effekten. Disse produktene er ofte proteiner , men i ikke-proteinkodende gener som overførings-RNA (tRNA) og lite kjernefysisk RNA (snRNA) er produktet et funksjonelt, ikke-kodende RNA . Genuttrykk er oppsummert i det sentrale dogmet i molekylærbiologi som først ble formulert av Francis Crick i 1958, videreutviklet i artikkelen hans fra 1970 og utvidet med de påfølgende funnene av revers transkripsjon og RNA -replikasjon .

Prosessen med genuttrykk brukes av alle kjente liv - eukaryoter (inkludert flercellede organismer ), prokaryoter ( bakterier og archaea ) og brukes av virus - for å generere makromolekylære maskineri for livet.

I genetikk er genuttrykk det mest grunnleggende nivået som genotypen gir opphav til fenotypen , dvs. observerbar egenskap. Den genetiske informasjonen lagret i DNA representerer genotypen, mens fenotypen er resultatet av "tolkningen" av denne informasjonen. Slike fenotyper kommer ofte til uttrykk ved syntese av proteiner som styrer organismens struktur og utvikling, eller som fungerer som enzymer som katalyserer spesifikke metabolske veier.

Alle trinn i genuttrykksprosessen kan moduleres (reguleres), inkludert transkripsjon , RNA-spleising , translasjon og post-translasjonell modifikasjon av et protein. Regulering av genuttrykk gir kontroll over tidspunktet, plasseringen og mengden av et gitt genprodukt (protein eller ncRNA) som er tilstede i en celle og kan ha en dyp effekt på mobilstrukturen og funksjonen. Regulering av genuttrykk er grunnlaget for celledifferensiering , utvikling , morfogenese og allsidigheten og tilpasningsevnen til enhver organisme . Genregulering kan derfor tjene som et underlag for evolusjonær endring.

Mekanisme

Transkripsjon

RNA -polymerase beveger seg langs en DNA -strekning og etterlater nylig syntetisert RNA -streng.
Transkripsjonsprosessen utføres av RNA -polymerase (RNAP), som bruker DNA (svart) som mal og produserer RNA (blått).

Fremstillingen av en RNA-kopi fra et DNA-tråd kalles transkripsjon , og er utført av RNA polymeraser , som legger man ribo nukleotid på en gang til en voksende RNA-tråden i henhold til komplementaritet lov av nukleotidbasene. Dette RNA komplementerer malen 3 ′ → 5 ′ DNA -streng, med unntak av at tyminer (T) erstattes med uraciler (U) i RNA.

I prokaryoter utføres transkripsjon av en enkelt type RNA -polymerase, som må binde en DNA -sekvens som kalles en Pribnow -boks ved hjelp av sigmafaktorproteinet (σ -faktor) for å starte transkripsjon. I eukaryoter utføres transkripsjon i kjernen av tre typer RNA-polymeraser, som hver trenger en spesiell DNA-sekvens kalt promotoren og et sett med DNA-bindende proteiner- transkripsjonsfaktorer-for å starte prosessen (se regulering av transkripsjon nedenfor) . RNA -polymerase I er ansvarlig for transkripsjon av ribosomale RNA (rRNA) gener. RNA-polymerase II (Pol II) transkriberer alle proteinkodende gener, men også noen ikke-kodende RNA ( f.eks . SnRNA, snoRNA eller lange ikke-kodende RNA). RNA-polymerase III transkriberer 5S rRNA, overfører RNA (tRNA) gener og noen små ikke-kodende RNA ( f.eks . 7SK ). Transkripsjon slutter når polymerasen møter en sekvens som kalles terminatoren .

mRNA -behandling

Mens transkripsjon av prokaryote proteinkodende gener skaper messenger-RNA (mRNA) som er klar for oversettelse til protein, etterlater transkripsjon av eukaryote gener en primær transkripsjon av RNA ( pre-RNA ), som først må gjennomgå en rekke modifikasjoner for å bli en modent RNA. Typer og trinn involvert i modningsprosessene varierer mellom kodende og ikke-kodende preRNA; dvs. selv om preRNA -molekyler for både mRNA og tRNA gjennomgår spleising, er trinnene og maskineriet involvert forskjellige. Behandlingen av ikke-kodende RNA er beskrevet nedenfor (ikke-kjernende RNA-modning).

Behandlingen av premRNA inkluderer 5 ′ capping , som er sett med enzymatiske reaksjoner som tilfører 7-metylguanosin (m 7 G) til 5 ′ enden av pre-mRNA og dermed beskytter RNA mot nedbrytning av eksonukleaser . M 7 G -hetten blir deretter bundet av hettebindende kompleks heterodimer (CBC20/CBC80), som hjelper til med mRNA -eksport til cytoplasma og også beskytter RNA mot decapping.

En annen modifikasjon er 3 ′ spaltning og polyadenylering . De oppstår hvis polyadenyleringssignalsekvens (5'-AAUAAA-3 ') er tilstede i pre-mRNA, som vanligvis er mellom proteinkodende sekvens og terminator. Pre-mRNA spaltes først, og deretter tilsettes en serie på ~ 200 adeniner (A) for å danne poly (A) hale, som beskytter RNA mot nedbrytning. Poly (A) halen er bundet av flere poly (A) -bindende proteiner (PABP) som er nødvendige for mRNA-eksport og re-initiering av translasjon. I den inverse prosessen med deadenylering, blir poly (A) haler forkortet av CCR4-Not 3′-5 'eksonuklease, noe som ofte fører til full transkripsjonsforfall.

Pre-mRNA er spleiset til form av modent mRNA.
Illustrasjon av eksoner og introner i pre-mRNA og dannelse av modent mRNA ved spleising. UTR-ene (i grønt) er ikke-kodende deler av eksoner i endene av mRNA.

En veldig viktig modifikasjon av eukaryote pre-mRNA er RNA-spleising . Flertallet av eukaryote pre-mRNA består av alternerende segmenter kalt eksoner og introner . Under spleiseprosessen katalyserer et RNA-proteinkatalytisk kompleks kjent som spliceosome to transesterifiseringsreaksjoner, som fjerner et intron og frigjør det i form av lariatstruktur, og deretter spleiser naboeksoner sammen. I visse tilfeller kan noen introner eller eksoner enten fjernes eller beholdes i modent mRNA. Denne såkalte alternative spleisen skaper en rekke forskjellige transkripsjoner som stammer fra et enkelt gen. Fordi disse transkripsjonene potensielt kan oversettes til forskjellige proteiner, utvider spleising kompleksiteten til eukaryot genuttrykk og størrelsen på et artproteom .

Omfattende RNA -prosessering kan være en evolusjonær fordel som er mulig av kjernen av eukaryoter. I prokaryoter skjer transkripsjon og oversettelse sammen, mens kjernemembranen skiller de to prosessene i eukaryoter , noe som gir tid for RNA -prosessering.

Ikke-kodende RNA-modning

I de fleste organismer transkriberes ikke-kodende gener (ncRNA) som forløpere som gjennomgår videre behandling. Når det gjelder ribosomale RNA (rRNA), blir de ofte transkribert som et pre-rRNA som inneholder ett eller flere rRNA. Pre-rRNA spaltes og modifiseres (2'-O-metylering og pseudouridin- dannelse) på spesifikke steder av omtrent 150 forskjellige små nukleol-begrensede RNA-arter, kalt snoRNA. SnoRNA forbinder seg med proteiner og danner snoRNP. Mens snoRNA -delen basepareres med mål -RNA og dermed plasserer modifikasjonen på et presist sted, utfører proteindelen den katalytiske reaksjonen. I eukaryoter, spesielt en snoRNP kalt RNase, klyver MRP 45S pre-rRNA inn i 28S, 5.8S og 18S rRNA. RRNA- og RNA -behandlingsfaktorene danner store aggregater som kalles nucleolus .

Ved overførings-RNA (tRNA), for eksempel, fjernes 5'- sekvensen med RNase P , mens 3'-enden fjernes av tRNase Z- enzymet og den ikke- templerte 3'-CCA-halen blir tilsatt av en nukleotidyltransferase . Når det gjelder mikro-RNA (miRNA) , blir miRNAer først transkribert som primære transkripsjoner eller pri-miRNA med hette og poly-A-hale og behandlet til korte, 70-nukleotid stamme-sløyfestrukturer kjent som pre-miRNA i cellekjernen av enzymene Drosha og Pasha . Etter å ha blitt eksportert, blir den deretter behandlet til modne miRNA i cytoplasma ved interaksjon med endonuklease Dicer , som også starter dannelsen av det RNA-induserte silencing-komplekset (RISC) , sammensatt av Argonaute- proteinet.

Selv snRNA og snoRNA selv gjennomgår en rekke modifikasjoner før de blir en del av funksjonelt RNP -kompleks. Dette gjøres enten i nukleoplasma eller i de spesialiserte avdelingene kalt Cajal -legemer . Basene deres er metylert eller pseudouridinilert av en gruppe små Cajal kroppsspesifikke RNA (scaRNA) , som strukturelt ligner snoRNA.

RNA -eksport

I eukaryoter må det mest modne RNA eksporteres til cytoplasma fra kjernen . Mens noen RNA fungerer i kjernen, blir mange RNA transportert gjennom atomporene og inn i cytosolen . Eksport av RNA krever tilknytning til spesifikke proteiner kjent som eksportiner. Spesifikke eksportmolekyler er ansvarlig for eksport av en gitt RNA -type. mRNA -transport krever også riktig tilknytning til Exon Junction Complex (EJC), som sikrer at korrekt behandling av mRNA er fullført før eksport. I noen tilfeller transporteres RNA i tillegg til en bestemt del av cytoplasma, for eksempel en synapse ; de blir deretter slept av motorproteiner som binder gjennom linkerproteiner til spesifikke sekvenser (kalt "postnummer") på RNA.

Oversettelse

For noe RNA (ikke-kodende RNA) er det modne RNA det siste genproduktet. Når det gjelder messenger RNA (mRNA) er RNA en informasjonsbærer som koder for syntese av ett eller flere proteiner. mRNA som bærer en enkelt proteinsekvens (vanlig i eukaryoter) er monocistronisk, mens mRNA som bærer flere proteinsekvenser (vanlig i prokaryoter) er kjent som polycistronic .

Ribosom som oversetter messenger -RNA til kjede av aminosyrer (protein).
Under oversettelsen kommer tRNA ladet med aminosyre inn i ribosomet og retter seg etter riktig mRNA -triplett. Ribosom tilfører deretter aminosyre til den voksende proteinkjeden.

Hvert mRNA består av tre deler: en 5'-oversatt region (5'UTR), en proteinkodende region eller åpen leseramme (ORF) og en 3'-oversatt region (3'UTR). Koderegionen bærer informasjon for proteinsyntese kodet av den genetiske koden for å danne trillinger. Hver trilling av nukleotider i den kodende regionen kalles et kodon og tilsvarer et bindingssted som er komplementært til en antikodontriplett i overførings -RNA. Overførings -RNA med samme antikodonsekvens har alltid en identisk type aminosyre . Aminosyrer blir deretter lenket sammen av ribosomet i henhold til rekkefølgen til trillinger i kodeområdet. Ribosomet hjelper til med å overføre RNA for å binde seg til messenger-RNA og tar aminosyren fra hvert overførings-RNA og lager et protein-mindre protein ut av det. Hvert mRNA -molekyl blir oversatt til mange proteinmolekyler, i gjennomsnitt ~ 2800 hos pattedyr.

I prokaryoter forekommer oversettelse vanligvis på transkripsjonspunktet (co-transkripsjonelt), ofte ved bruk av et messenger-RNA som fremdeles er i ferd med å bli opprettet. I eukaryoter kan oversettelse forekomme i en rekke områder av cellen, avhengig av hvor proteinet som skrives skal være. De viktigste stedene er cytoplasma for oppløselige cytoplasmatiske proteiner og membranen i det endoplasmatiske retikulum for proteiner som er til eksport fra cellen eller innsetting i en cellemembran . Proteiner som skal uttrykkes i det endoplasmatiske retikulum gjenkjennes delvis gjennom oversettelsesprosessen. Dette styres av signalgjenkjenningspartikkelen - et protein som binder seg til ribosomet og leder det til det endoplasmatiske retikulum når det finner et signalpeptid på den voksende (gryende) aminosyrekjeden.

Folding

Prosessen med proteinfolding.
Protein før (venstre) og etter (høyre) bretting

Hvert protein eksisterer som et utfoldet polypeptid eller tilfeldig spole når det translateres fra en sekvens av mRNA til en lineær kjede av aminosyrer . Dette polypeptidet mangler noen utviklet tredimensjonal struktur (venstre side av nabofiguren). Polypeptidet bretter seg deretter inn i sin karakteristiske og funksjonelle tredimensjonale struktur fra en tilfeldig spole . Aminosyrer interagerer med hverandre for å produsere en veldefinert tredimensjonal struktur, det brettede proteinet (høyre side av figuren) kjent som native state . Den resulterende tredimensjonale strukturen bestemmes av aminosyresekvensen ( Anfinsens dogme ).

Den riktige tredimensjonale strukturen er avgjørende for å fungere, selv om noen deler av funksjonelle proteiner kan forbli utfoldet . Unnlatelse av å brette seg inn i den tiltenkte formen produserer vanligvis inaktive proteiner med forskjellige egenskaper, inkludert giftige prioner . Flere nevrodegenerative og andre sykdommer antas å skyldes akkumulering av feilfoldede proteiner. Mange allergier er forårsaket av folding av proteinene, for immunsystemet produserer ikke antistoffer for visse proteinstrukturer.

Enzymer som kalles chaperones hjelper det nydannede proteinet til å oppnå ( brette seg inn i) den tredimensjonale strukturen den trenger for å fungere. På samme måte hjelper RNA -chaperoner RNA med å oppnå sine funksjonelle former. Bistandende proteinfolding er en av hovedrollene til det endoplasmatiske retikulumet i eukaryoter.

Translokasjon

Sekretoriske proteiner av eukaryoter eller prokaryoter må translokeres for å komme inn i sekretorisk vei. Nysyntetiserte proteiner dirigeres til den eukaryote Sec61 eller prokaryote SecYEG -translokasjonskanalen av signalpeptider . Effektiviteten av proteinsekresjon i eukaryoter er svært avhengig av signalpeptidet som har blitt brukt.

Proteintransport

Mange proteiner er bestemt for andre deler av cellen enn cytosolen, og et bredt spekter av signalsekvenser eller (signalpeptider) brukes til å lede proteiner dit de skal være. I prokaryoter er dette normalt en enkel prosess på grunn av begrenset deling av cellen. Imidlertid er det i eukaryoter et stort utvalg av forskjellige målrettingsprosesser for å sikre at proteinet kommer til riktig organell.

Ikke alle proteiner forblir i cellen, og mange eksporteres, for eksempel fordøyelsesenzymer , hormoner og ekstracellulære matriksproteiner . I eukaryoter er eksportveien godt utviklet, og hovedmekanismen for eksport av disse proteinene er translokasjon til det endoplasmatiske retikulum, etterfulgt av transport via Golgi -apparatet .

Regulering av genuttrykk

En katt med flekker av oransje og svart pels.
De flekkete fargene på en skilpaddeskatt er et resultat av forskjellige nivåer av uttrykk for pigmenteringsgener i forskjellige områder av huden .

Regulering av genuttrykk er kontrollen av mengden og tidspunktet for utseendet til det funksjonelle produktet av et gen. Kontroll av uttrykk er avgjørende for at en celle skal kunne produsere genproduktene den trenger når den trenger dem; på sin side gir dette cellene fleksibilitet til å tilpasse seg et variabelt miljø, eksterne signaler, skade på cellen og andre stimuli. Mer generelt gir genregulering cellen kontroll over all struktur og funksjon, og er grunnlaget for celledifferensiering , morfogenese og allsidigheten og tilpasningsevnen til enhver organisme.

Mange termer brukes for å beskrive typer gener avhengig av hvordan de er regulert; disse inkluderer:

  • Et konstitutivt gen er et gen som transkriberes kontinuerlig i motsetning til et fakultativt gen, som bare transkriberes ved behov.
  • Et husholdningsgen er et gen som er nødvendig for å opprettholde grunnleggende mobilfunksjon og uttrykkes vanligvis i alle celletyper av en organisme. Eksempler inkluderer aktin , GAPDH og ubiquitin . Noen husholdningsgener transkriberes med en relativt konstant hastighet, og disse genene kan brukes som referansepunkt i eksperimenter for å måle ekspresjonshastigheten til andre gener.
  • Et fakultativt gen er et gen som bare transkriberes ved behov i motsetning til et konstitutivt gen.
  • Et induserbart gen er et gen hvis uttrykk enten reagerer på miljøendringer eller er avhengig av posisjonen i cellesyklusen.

Et hvilket som helst trinn med genuttrykk kan moduleres, fra DNA-RNA-transkripsjonstrinnet til post-translasjonell modifikasjon av et protein. Stabiliteten til det endelige genproduktet, enten det er RNA eller protein, bidrar også til ekspresjonsnivået til genet - et ustabilt produkt resulterer i et lavt ekspresjonsnivå. Generelt reguleres genuttrykk gjennom endringer i antall og type interaksjoner mellom molekyler som kollektivt påvirker transkripsjon av DNA og translasjon av RNA.

Noen enkle eksempler på hvor genuttrykk er viktig er:

Transkripsjonsregulering

Når laktose er tilstede i en prokaryote, virker den som en induktor og inaktiverer repressoren slik at genene for laktosemetabolisme kan transkriberes.

Regulering av transkripsjon kan deles inn i tre hovedinnflytelsesveier; genetisk (direkte interaksjon mellom en kontrollfaktor og genet), modulasjonsinteraksjon mellom en kontrollfaktor og transkripsjonsmaskinen og epigenetisk (ikke-sekvensendringer i DNA-strukturen som påvirker transkripsjonen).

Bånddiagram over lambda -repressordimeren bundet til DNA.
Den lambda-repressor transkripsjonsfaktor (grønn) binder seg som en dimer til hovedsporet av DNA-mål (rød og blå) og deaktiverer initiering av transkripsjon. Fra PDB : 1LMB .

Direkte interaksjon med DNA er den enkleste og mest direkte metoden der et protein endrer transkripsjonsnivåer. Gener har ofte flere proteinbindingssteder rundt kodingsområdet med den spesifikke funksjonen å regulere transkripsjon. Det er mange klasser av regulatoriske DNA -bindingssteder kjent som forsterkere , isolatorer og lyddempere . Mekanismene for å regulere transkripsjon er varierte, fra blokkering av viktige bindingssteder på DNA for RNA -polymerase til å fungere som en aktivator og fremme transkripsjon ved å hjelpe RNA -polymerase -binding.

Transkripsjonsfaktorers aktivitet moduleres ytterligere av intracellulære signaler som forårsaker protein post-translasjonell modifikasjon inkludert fosforylerte , acetylerte eller glykosylerte . Disse endringene påvirker en transkripsjonsfaktors evne til å binde, direkte eller indirekte, til promotor -DNA, for å rekruttere RNA -polymerase eller for å favorisere forlengelse av et nysyntetisert RNA -molekyl.

Kjernemembranen i eukaryoter tillater ytterligere regulering av transkripsjonsfaktorer etter varigheten av deres tilstedeværelse i kjernen, som reguleres av reversible endringer i strukturen og ved binding av andre proteiner. Miljøstimuli eller endokrine signaler kan forårsake endring av regulatoriske proteiner og fremkalle kaskader av intracellulære signaler, noe som resulterer i regulering av genuttrykk.

Mer nylig har det blitt tydelig at det er en signifikant påvirkning av ikke-DNA-sekvens-spesifikke effekter på transkripsjon. Disse effektene kalles epigenetiske og involverer strukturen av høyere orden av DNA, ikke-sekvensspesifikke DNA-bindende proteiner og kjemisk modifikasjon av DNA. Generelt endrer epigenetiske effekter tilgjengeligheten til DNA for proteiner og modulerer transkripsjonen på denne måten.

En tegneserie av nukleosomstrukturen.
I eukaryoter er DNA organisert i form av nukleosomer . Legg merke til hvordan DNA (blå og grønn) er tett pakket rundt proteinkjernen av histon- oktamer (båndspoler), å begrense tilgangen til DNA. Fra PDB : 1KX5 .

I eukaryoter regulerer kromatinstrukturen , kontrollert av histonkoden , tilgangen til DNA med vesentlig innvirkning på ekspresjon av gener i eukromatin og heterochromatin -områder.

Forsterkere, transkripsjonsfaktorer, mediatorkompleks og DNA -sløyfer i pattedyrstranskripsjon

Regulering av transkripsjon hos pattedyr . En aktiv forsterkerreguleringsregion er i stand til å samhandle med promotorregionen til dets målgen ved dannelse av en kromosomsløyfe. Dette kan starte messenger RNA (mRNA) syntese av RNA polymerase II (RNAP II) bundet til promotoren på transkripsjon startstedet til genet. Sløyfen stabiliseres av ett arkitektonisk protein forankret til forsterkeren og en forankret til promotoren, og disse proteinene er sammenføyet for å danne en dimer (røde sikksakk). Spesifikke regulatoriske transkripsjonsfaktorer binder seg til DNA -sekvensmotiver på forsterkeren. Generelle transkripsjonsfaktorer binder seg til promotoren. Når en transkripsjonsfaktor aktiveres av et signal (her angitt som fosforylering vist av en liten rød stjerne på en transkripsjonsfaktor på forsterkeren) aktiveres forsterkeren og kan nå aktivere målpromotoren. Den aktive forsterkeren transkriberes på hver DNA -streng i motsatte retninger av bundne RNAP II -er. Mediator (et kompleks som består av omtrent 26 proteiner i en interagerende struktur) kommuniserer regulatoriske signaler fra forsterkerens DNA-bundne transkripsjonsfaktorer til promotoren.

Genuttrykk hos pattedyr er regulert av mange cis-regulatoriske elementer , inkludert kjernepromotorer og promoter-proksimale elementer som er lokalisert nær transkripsjonens startsteder for gener, oppstrøms på DNA (mot 5'-regionen i sansestrengen ). Andre viktige cis-regulerende moduler er lokalisert i DNA-regioner som er fjernt fra transkripsjonsstartstedene. Disse inkluderer forsterkere , lyddempere , isolatorer og bindingselementer. Enhancers og deres assosierte transkripsjonsfaktorer har en ledende rolle i reguleringen av genuttrykk.

Forsterkere er genomregioner som regulerer gener. Forsterkere kontrollerer celletypespesifikke genuttrykksprogrammer, oftest ved å sløyfe gjennom lange avstander for å komme i fysisk nærhet med promotorene til målgenene. Flere forsterkere, hver ofte titusenvis eller hundretusener av nukleotider fjernt fra målgenene, går til målgenpromotorer og koordinerer med hverandre for å kontrollere genuttrykk.

Illustrasjonen viser en forsterker som løkker rundt for å komme i nærheten av promotoren for et målgen. Sløyfen stabiliseres av en dimer av et koblingsprotein (f.eks. Dimer av CTCF eller YY1 ). Det ene elementet i dimeren er forankret til dets bindingsmotiv på forsterkeren og det andre elementet er forankret til dets bindingsmotiv på promotoren (representert med de røde sikksakkene på illustrasjonen). Flere cellefunksjonsspesifikke transkripsjonsfaktorer (blant de cirka 1600 transkripsjonsfaktorene i en menneskelig celle) binder seg generelt til spesifikke motiver på en forsterker. En liten kombinasjon av disse forsterkerbundne transkripsjonsfaktorene, når den bringes nær en promoter av en DNA-sløyfe, styrer transkripsjonsnivået til målgenet. Mediator (et kompleks som vanligvis består av omtrent 26 proteiner i en interagerende struktur) kommuniserer regulatoriske signaler fra forsterker-DNA-bundne transkripsjonsfaktorer direkte til RNA-polymerase II (pol II) enzymet bundet til promotoren.

Forsterkere, når de er aktive, blir generelt transkribert fra begge DNA -strenger med RNA -polymeraser som virker i to forskjellige retninger, og produserer to eRNA som vist på figuren. En inaktiv forsterker kan være bundet av en inaktiv transkripsjonsfaktor. Fosforylering av transkripsjonsfaktoren kan aktivere den, og den aktiverte transkripsjonsfaktoren kan deretter aktivere forsterkeren som den er bundet til (se liten rød stjerne som representerer fosforylering av transkripsjonsfaktor bundet til forsterker i illustrasjonen). En aktivert forsterker begynner transkripsjon av dets RNA før aktivering av transkripsjon av messenger -RNA fra målgenet.

DNA -metylering og demetylering i transkripsjonell regulering

DNA -metylering er tilsetning av en metylgruppe til DNA som skjer ved cytosin . Bildet viser en cytosin -enkeltringbase og en metylgruppe tilsatt 5 -karbonet. Hos pattedyr skjer DNA -metylering nesten utelukkende ved et cytosin som etterfølges av en guanin .

DNA -metylering er en utbredt mekanisme for epigenetisk innflytelse på genuttrykk og er sett i bakterier og eukaryoter og har roller i arvelig transkripsjonsdemping og transkripsjonsregulering. Metylering skjer oftest på en cytosin (se figur). Metylering av cytosin skjer hovedsakelig i dinukleotidsekvenser der et cytosin etterfølges av en guanin, et CpG -område . Antall CpG -steder i det menneskelige genomet er omtrent 28 millioner. Avhengig av celletype har omtrent 70% av CpG -stedene et metylert cytosin.

Metylering av cytosin i DNA har en viktig rolle i regulering av genuttrykk. Metylering av CpGs i en promotorregion av et gen undertrykker vanligvis gentranskripsjon mens metylering av CpGs i kroppen til et gen øker ekspresjonen. TET -enzymer spiller en sentral rolle i demetylering av metylerte cytosiner. Demetylering av CpG i en genpromotor ved TET -enzymaktivitet øker transkripsjonen av genet.

Transkripsjonell regulering av læring og minne

De identifiserte områdene i den menneskelige hjerne er involvert i minnedannelse.

Hos en rotte er kontekstuell fryktkondisjonering (KFK) en smertefull læringsopplevelse. Bare en episode av KFK kan resultere i en livslang fryktelig hukommelse. Etter en episode av KFK, blir cytosinmetylering endret i promotorregionene på omtrent 9,17% av alle gener i hippocampus nevron -DNA fra en rotte. Den hippocampus er der nye minner er i utgangspunktet lagret. Etter CFC har omtrent 500 gener økt transkripsjon (ofte på grunn av demetylering av CpG-steder i en promoterregion) og omtrent 1000 gener har redusert transkripsjon (ofte på grunn av nydannet 5-metylcytosin på CpG-steder i en promoterregion). Mønsteret av induserte og undertrykte gener i nevroner ser ut til å gi et molekylært grunnlag for å danne det første forbigående minnet om denne treningshendelsen i hippocampus i rottehjernen.

Spesielt er det hjerneavledede nevrotrofiske faktorgenet ( BDNF ) kjent som et "læringsgen". Etter CFC var det oppregulering av BDNF -genuttrykk , relatert til redusert CpG -metylering av visse interne promotorer av genet, og dette var korrelert med læring.

Transkripsjonsregulering ved kreft

Flertallet av genfremmere inneholder en CpG -øy med mange CpG -steder . Når mange av et gens promoter CpG -steder blir metylert, blir genet taus. Kolorektal kreft har typisk 3 til 6 driver mutasjoner og 33 til 66 hitchhiker eller passasjer mutasjoner. Imidlertid kan transkripsjonsdemping være av større betydning enn mutasjon for å forårsake progresjon til kreft. For eksempel, i tykktarmskreft blir omtrent 600 til 800 gener transkripsjonelt dempet av CpG -øyemetylering (se regulering av transkripsjon ved kreft ). Transkripsjonell undertrykkelse ved kreft kan også forekomme ved andre epigenetiske mekanismer, for eksempel endret ekspresjon av mikroRNA . Ved brystkreft kan transkripsjonell undertrykkelse av BRCA1 forekomme oftere ved overuttrykt mikroRNA-182 enn ved hypermetylering av BRCA1-promotoren (se Lavt uttrykk for BRCA1 ved bryst- og eggstokkreft ).

Post-transkripsjonell regulering

I eukaryoter, hvor eksport av RNA er nødvendig før oversettelse er mulig, antas kjernefysisk eksport å gi ytterligere kontroll over genuttrykk. All transport inn og ut av kjernen skjer via kjerneporen og transporten styres av et bredt spekter av importin- og exportinproteiner .

Uttrykk for et gen som koder for et protein er bare mulig hvis messenger -RNA som bærer koden overlever lenge nok til å bli oversatt. I en typisk celle er et RNA -molekyl bare stabilt hvis det er spesielt beskyttet mot nedbrytning. RNA -nedbrytning har spesiell betydning for regulering av ekspresjon i eukaryote celler der mRNA må reise betydelige avstander før det blir oversatt. I eukaryoter stabiliseres RNA ved visse post-transkripsjonelle modifikasjoner, spesielt 5'- hetten og poly-adenylert hale .

Forsiktig nedbrytning av mRNA brukes ikke bare som en forsvarsmekanisme fra fremmed RNA (normalt fra virus), men også som en rute for mRNA -destabilisering . Hvis et mRNA -molekyl har en komplementær sekvens til et lite forstyrrende RNA, er det målrettet mot ødeleggelse via RNA -interferensveien.

Tre primære ikke -oversatte regioner og mikroRNA

Tre primære ikke-oversatte regioner (3'UTR) av messenger-RNA (mRNA) inneholder ofte regulatoriske sekvenser som etter transkripsjonelt påvirker genuttrykk. Slike 3'-UTR inneholder ofte både bindingssteder for mikroRNA (miRNA) så vel som for regulatoriske proteiner. Ved å binde seg til spesifikke steder i 3'-UTR kan miRNA redusere genuttrykk for forskjellige mRNA ved enten å hemme translasjon eller direkte forårsake nedbrytning av transkripsjonen. 3'-UTR kan også ha lyddemperområder som binder repressorproteiner som hemmer ekspresjonen av et mRNA.

3′-UTR inneholder ofte microRNA-responselementer (MRE) . MRE er sekvenser som miRNA bindes til. Dette er utbredte motiver innen 3′-UTR. Blant alle regulatoriske motiver innenfor 3′-UTR (f.eks. Inkludert lyddemperregioner) utgjør MRE omtrent halvparten av motivene.

Fra 2014 oppgav miRBase -nettstedet , et arkiv med miRNA -sekvenser og kommentarer, 28.645 oppføringer i 233 biologiske arter. Av disse var 1 881 miRNA i kommenterte humane miRNA -loci. miRNA ble spådd å ha et gjennomsnitt på omtrent fire hundre mål -mRNA (som påvirker uttrykk for flere hundre gener). Friedman et al. anslår at> 45 000 miRNA-målsteder innenfor humane mRNA 3'UTR er bevart over bakgrunnsnivåer, og> 60% av humane proteinkodende gener har vært under selektivt trykk for å opprettholde sammenkobling med miRNA.

Direkte eksperimenter viser at et enkelt miRNA kan redusere stabiliteten til hundrevis av unike mRNA. Andre eksperimenter viser at et enkelt miRNA kan undertrykke produksjonen av hundrevis av proteiner, men at denne undertrykkelsen ofte er relativt mild (mindre enn 2 ganger).

Effektene av miRNA -dysregulering av genuttrykk synes å være viktige ved kreft. For eksempel, ved gastrointestinale kreftformer, har ni miRNA blitt identifisert som epigenetisk endret og effektivt for å nedregulere DNA -reparasjonsenzymer.

Effektene av miRNA -dysregulering av genuttrykk synes også å være viktige ved nevropsykiatriske lidelser, som schizofreni, bipolar lidelse, alvorlig depresjon, Parkinsons sykdom, Alzheimers sykdom og autismespekterforstyrrelser.

Oversettelsesregulering

En kjemisk struktur av neomycinmolekylet.
Neomycin er et eksempel på et lite molekyl som reduserer uttrykk for alle proteingener som uunngåelig fører til celledød; det fungerer dermed som et antibiotikum .

Direkte regulering av oversettelse er mindre utbredt enn kontroll av transkripsjon eller mRNA -stabilitet, men brukes av og til. Hemming av proteinoversettelse er et hovedmål for toksiner og antibiotika , slik at de kan drepe en celle ved å overstyre den normale genuttrykkskontrollen. Proteinsyntesehemmere inkluderer antibiotikumet neomycin og toksinet ricin .

Ettertranslasjonelle modifikasjoner

Post-translationelle modifikasjoner (PTM) er kovalente modifikasjoner av proteiner. I likhet med RNA -spleising bidrar de til å diversifisere proteomet betydelig. Disse modifikasjonene katalyseres vanligvis av enzymer. I tillegg kan prosesser som kovalente tilsetninger til aminosyresidekjederester ofte reverseres av andre enzymer. Noen, i likhet med proteolytisk spaltning av proteinryggraden, er imidlertid irreversible.

PTM spiller mange viktige roller i cellen. For eksempel er fosforylering først og fremst involvert i aktivering og deaktivering av proteiner og i signalveier. PTM er involvert i transkripsjonsregulering: en viktig funksjon av acetylering og metylering er modifikasjon av histonhale, som endrer hvor tilgjengelig DNA er for transkripsjon. De kan også sees i immunsystemet, der glykosylering spiller en nøkkelrolle. En type PTM kan starte en annen type PTM, som det kan sees på hvordan ubiquitination merker proteiner for nedbrytning gjennom proteolyse. Proteolyse, annet enn å være involvert i å bryte ned proteiner, er også viktig for å aktivere og deaktivere dem, og for å regulere biologiske prosesser som DNA -transkripsjon og celledød.

Mål

Måling av genuttrykk er en viktig del av mange biovitenskap , ettersom evnen til å kvantifisere nivået et bestemt gen uttrykkes i en celle, vev eller organisme kan gi mye verdifull informasjon. For eksempel kan måling av genuttrykk:

På samme måte er analysen av plasseringen av proteinuttrykk et kraftig verktøy, og dette kan gjøres på en organismisk eller mobil skala. Undersøkelse av lokalisering er spesielt viktig for studier av utvikling i flercellede organismer og som en indikator på proteinfunksjon i enkeltceller. Ideelt sett måles ekspresjon ved å påvise det endelige genproduktet (for mange gener er dette proteinet); Imidlertid er det ofte lettere å oppdage en av forløperne, typisk mRNA og å utlede genuttrykksnivåer fra disse målingene.

mRNA -kvantifisering

Nivåer av mRNA kan måles kvantitativt ved Northern Blotting , som gir informasjon om størrelse og sekvens om mRNA -molekylene. En prøve av RNA separeres på en agarosegel og hybridiseres til en radioaktivt merket RNA -probe som er komplementær til målsekvensen. Det radiomerkede RNA blir deretter detektert av en autoradiograf . Fordi bruk av radioaktive reagenser gjør prosedyren tidkrevende og potensielt farlig, har alternative merkings- og deteksjonsmetoder, for eksempel digoksigenin og biotinkjemi, blitt utviklet. Oppfattede ulemper ved Northern blotting er at det kreves store mengder RNA, og at kvantifisering kanskje ikke er helt nøyaktig, da det innebærer måling av båndstyrke i et bilde av en gel. På den annen side tillater tilleggs mRNA -størrelsesinformasjonen fra Northern blot diskriminering av vekslende spleisede transkripsjoner.

En annen tilnærming for å måle mRNA-overflod er RT-qPCR. I denne teknikken blir revers transkripsjon etterfulgt av kvantitativ PCR . Omvendt transkripsjon genererer først en DNA -mal fra mRNA; denne enkeltstrengede malen kalles cDNA . CDNA -malen blir deretter forsterket i det kvantitative trinnet, hvor fluorescensen som sendes ut av merkede hybridiseringsprober eller interkalerende fargestoffer endres etter hvert som DNA -amplifikasjonsprosessen utvikler seg. Med en nøye konstruert standardkurve kan qPCR produsere en absolutt måling av antall kopier av original mRNA, vanligvis i kopienheter per nanoliter homogenisert vev eller kopier per celle. qPCR er veldig sensitiv (deteksjon av et enkelt mRNA -molekyl er teoretisk mulig), men kan være dyrt avhengig av hvilken type reporter som brukes; fluorescerende merkede oligonukleotidprober er dyrere enn uspesifikke interkalerende fluorescerende fargestoffer.

For ekspresjonsprofilering eller høy gjennomstrømmingsanalyse av mange gener i en prøve, kan kvantitativ PCR utføres for hundrevis av gener samtidig i tilfeller av lavdensitets-matriser. En annen tilnærming er hybridiseringsmikroarrayen . En enkelt matrise eller "chip" kan inneholde sonder for å bestemme transkripsjonsnivåer for hvert kjent gen i genomet til en eller flere organismer. Alternativt kan "tag" basert teknologier som serie analyse av genekspresjon (SAGE) og RNA-Seq , som kan gi et relativt mål på den cellulære konsentrasjonen av forskjellige mRNA-er, kan anvendes. En fordel med tagbaserte metoder er den "åpne arkitekturen", som gir mulighet for nøyaktig måling av alle transkripsjoner, med en kjent eller ukjent sekvens. Neste generasjons sekvensering (NGS) som RNA-Seq er en annen tilnærming, som produserer enorme mengder sekvensdata som kan matches med et referansegenom. Selv om NGS er relativt tidkrevende, dyrt og ressurskrevende, kan det identifisere enkeltnukleotidpolymorfier , spleisevarianter og nye gener, og kan også brukes til å profilere uttrykk i organismer som det er lite eller ingen sekvensinformasjon tilgjengelig for. .

RNA -profiler i Wikipedia

Et RNA -ekspresjonsdiagram.
RNA -ekspresjonsprofilen til GLUT4 Transporter (en av de viktigste glukosetransportørene som finnes i menneskekroppen)

Profiler som disse finnes for nesten alle proteiner som er oppført i Wikipedia. De genereres av organisasjoner som Genomics Institute ved Novartis Research Foundation og European Bioinformatics Institute . Ytterligere informasjon kan bli funnet ved å søke i databasene deres (for et eksempel på GLUT4 -transportøren på bildet her, se sitat). Disse profilene indikerer nivået av DNA-ekspresjon (og dermed RNA produsert) av et bestemt protein i et bestemt vev, og er fargekodet deretter på bildene i proteinboksen på høyre side av hver Wikipedia-side.

Proteinkvantifisering

For gener som koder for proteiner, kan ekspresjonsnivået vurderes direkte ved en rekke metoder med noen klare analogier til teknikkene for mRNA -kvantifisering.

En av de mest brukte metodene er å utføre en Western blot mot proteinet av interesse. Dette gir informasjon om proteinets størrelse i tillegg til dets identitet. En prøve (ofte cellelysat ) separeres på en polyakrylamidgel , overføres til en membran og deretter sonderes med et antistoff mot proteinet av interesse. Antistoffet kan enten konjugeres til en fluorofor eller til pepperrotperoksidase for avbildning og/eller kvantifisering. Den gelbaserte naturen til denne analysen gjør kvantifisering mindre nøyaktig, men den har fordelen av å være i stand til å identifisere senere modifikasjoner av proteinet, for eksempel proteolyse eller ubiquitination, fra endringer i størrelse.

mRNA-proteinkorrelasjon

Kvantifisering av protein og mRNA tillater en korrelasjon mellom de to nivåene. Spørsmålet om hvor godt proteinnivåer korrelerer med de tilsvarende transkripsjonsnivåene er sterkt omdiskutert og avhenger av flere faktorer. Regulering på hvert trinn i genuttrykk kan påvirke korrelasjonen, som vist for regulering av translasjon eller proteinstabilitet. Posttranslasjonsfaktorer, for eksempel proteintransport i høypolare celler, kan også påvirke den målte mRNA-proteinkorrelasjonen.

Lokalisering

Visualisering av hunchback mRNA i Drosophila embryo.
In situ-hybridisering av Drosophila- embryoer på forskjellige utviklingstrinn for mRNA som er ansvarlig for uttrykket av knallrygg . Høy intensitet av blå fargemerker steder med høy pukkelrygg -mRNA -mengde.

Analyse av uttrykk er ikke begrenset til kvantifisering; lokalisering kan også bestemmes. mRNA kan påvises med en passende merket komplementær mRNA -streng og protein kan påvises via merkede antistoffer. Den undersøkte prøven blir deretter observert ved mikroskopi for å identifisere hvor mRNA eller protein er.

Et bånddiagram over grønt fluorescerende protein som ligner fatstruktur.
Den tredimensjonale strukturen til grønt fluorescerende protein . Restene i midten av "fatet" er ansvarlige for produksjon av grønt lys etter å ha blitt utsatt for høyere energisk blått lys. Fra PDB : 1EMA .

Ved å erstatte genet med en ny versjon smeltet til et grønt fluorescerende protein (eller lignende) markør, kan ekspresjon kvantifiseres direkte i levende celler. Dette gjøres ved avbildning ved hjelp av et fluorescensmikroskop . Det er veldig vanskelig å klone et GFP-smeltet protein til sitt opprinnelige sted i genomet uten å påvirke ekspresjonsnivåene, så denne metoden kan ofte ikke brukes til å måle endogent genuttrykk. Det er imidlertid mye brukt til å måle ekspresjonen av et gen kunstig introdusert i cellen, for eksempel via en ekspresjonsvektor . Det er viktig å merke seg at ved å fusjonere et målprotein til en fluorescerende reporter, kan proteinets oppførsel, inkludert dets cellulære lokalisering og ekspresjonsnivå, endres betydelig.

Den enzym-bundet immunosorbent assay fungerer ved hjelp av antistoffer immobilisert på en mikrotiterplate for å fange proteiner av interesse fra prøvene ble tilsatt til brønnen. Ved bruk av et deteksjonsantistoff konjugert til et enzym eller fluorofor kan mengden av bundet protein måles nøyaktig ved fluorometrisk eller kolorimetrisk deteksjon. Deteksjonsprosessen er veldig lik den for en Western blot, men ved å unngå geltrinnene kan man oppnå mer nøyaktig kvantifisering.

Uttrykkssystem

Tet-ON induserbart shRNA-system

Et ekspresjonssystem er et system som er spesielt designet for produksjon av et genprodukt etter eget valg. Dette er normalt et protein, men kan også være RNA, for eksempel tRNA eller et ribozym . Et ekspresjonssystem består av et gen, normalt kodet av DNA , og det molekylære maskineriet som kreves for å transkribere DNA til mRNA og oversette mRNA til protein ved hjelp av de medfølgende reagensene. I vid forstand inkluderer dette hver levende celle, men begrepet brukes mer normalt for å referere til uttrykk som et laboratorieverktøy. Et uttrykkssystem er derfor ofte kunstig på en eller annen måte. Uttrykssystemer er imidlertid en grunnleggende naturlig prosess. Virus er et utmerket eksempel hvor de replikerer ved å bruke vertscellen som et ekspresjonssystem for virusproteiner og genom.

Ufremkallelig uttrykk

Doxycyklin brukes også i "Tet-on" og "Tet-off" tetracyklin kontrollert transkripsjonell aktivering for å regulere transgenuttrykk i organismer og cellekulturer .

I naturen

I tillegg til disse biologiske verktøyene omtales visse naturlig observerte konfigurasjoner av DNA (gener, promotorer, forsterkere, repressorer) og tilhørende maskineri i seg selv som et ekspresjonssystem. Dette begrepet brukes vanligvis i tilfelle der et gen eller et sett med gener slås på under veldefinerte forhold, for eksempel det enkle repressorbryteruttrykkssystemet i Lambda -fag og lac -operatørsystemet i bakterier. Flere naturlige ekspresjonssystemer brukes direkte eller modifiseres og brukes for kunstige ekspresjonssystemer som Tet-on og Tet-off uttrykkssystem.

Gen -nettverk

Gener har noen ganger blitt sett på som noder i et nettverk, med innganger som proteiner som transkripsjonsfaktorer , og utganger er nivået av genuttrykk. Noden selv utfører en funksjon, og driften av disse funksjonene har blitt tolket som å utføre en slags informasjonsbehandling i celler og bestemmer mobil oppførsel.

Gennettverk kan også konstrueres uten å formulere en eksplisitt årsaksmodell. Dette er ofte tilfelle når man monterer nettverk fra store uttrykksdatasett. Kovariasjon og korrelasjon av uttrykk beregnes på tvers av et stort utvalg av tilfeller og målinger (ofte transkriptom- eller proteomdata ). Kilden til variasjon kan enten være eksperimentell eller naturlig (observasjonell). Det er flere måter å konstruere genuttrykksnettverk på, men en vanlig tilnærming er å beregne en matrise for alle parvise visuelle korrelasjoner av uttrykk på tvers av forhold, tidspunkter eller individer og konvertere matrisen (etter terskling ved en grenseverdi) til en grafisk fremstilling der noder representerer gener, transkripsjoner eller proteiner og kanter som forbinder disse nodene representerer assosiasjonsstyrken (se [1] ).

Teknikker og verktøy

Følgende eksperimentelle teknikker brukes til å måle genuttrykk og er oppført i omtrent kronologisk rekkefølge, med utgangspunkt i de eldre, mer etablerte teknologiene. De er delt inn i to grupper basert på graden av multiplexitet .

Genuttrykk databaser

Se også

Referanser

Eksterne linker