Gene - Gene

Bildet ovenfor inneholder klikkbare lenker
Et gen er en region av DNA som koder for funksjon. Et kromosom består av en lang DNA -streng som inneholder mange gener. Et menneskelig kromosom kan ha opptil 500 millioner basepar DNA med tusenvis av gener.

I biologien er et gen (fra genos ( gresk ) som betyr generasjon eller fødsel eller kjønn ) en grunnleggende enhet for arvelighet og en sekvens av nukleotider i DNA som koder for syntesen av et genprodukt , enten RNA eller protein .

Under genuttrykk blir DNA først kopiert til RNA . RNA kan være direkte funksjonelt eller være mellomliggende mal for et protein som utfører en funksjon. Overføring av gener til en organismes avkom er grunnlaget for arvingen av fenotypiske egenskaper . Disse genene utgjør forskjellige DNA -sekvenser som kalles genotyper . Genotyper sammen med miljø- og utviklingsfaktorer bestemmer hva fenotypene vil være. De fleste biologiske trekk er påvirket av polygener (mange forskjellige gener) samt gen -miljø -interaksjoner . Noen genetiske trekk er umiddelbart synlige, for eksempel øyefarge eller antall lemmer, og noen er det ikke, for eksempel blodtype , risiko for spesifikke sykdommer eller tusenvis av grunnleggende biokjemiske prosesser som utgjør liv .

Gener kan skaffe mutasjoner i sin sekvens, noe som fører til forskjellige varianter, kjent som alleler , i befolkningen . Disse allelene koder for litt forskjellige versjoner av et protein, som forårsaker forskjellige fenotypiske trekk. Bruk av begrepet "å ha et gen" (f.eks. "Gode gener", "hårfarge -gen") refererer vanligvis til å inneholde en annen allel av det samme, delte genet. Gener utvikler seg på grunn av naturlig seleksjon / overlevelse av de sterkeste og genetiske driften av allelene.

Genbegrepet fortsetter å foredles etter hvert som nye fenomener oppdages. For eksempel kan regulatoriske områder av et gen være langt fjernet fra dets kodingsområder , og kodende regioner kan deles inn i flere eksoner . Noen virus lagrer genomet sitt i RNA i stedet for DNA, og noen genprodukter er funksjonelle ikke-kodende RNA . Derfor er en bred, moderne arbeidsdefinisjon av et gen ethvert diskret sted for arvelig, genomisk sekvens som påvirker organismens egenskaper ved å bli uttrykt som et funksjonelt produkt eller ved regulering av genuttrykk .

Begrepet gen ble introdusert av dansk botaniker , plantefysiolog og genetiker Wilhelm Johannsen i 1909. Det er inspirert av den gamle gresken : γόνος, gonos , det betyr avkom og forplantning.

Historie

Foto av Gregor Mendel
Gregor Mendel

Oppdagelse av diskrete arvede enheter

Eksistensen av diskrete arvelige enheter ble først antydet av Gregor Mendel (1822–1884). Fra 1857 til 1864 studerte han i Brno , Østerrikske imperium (dagens Tsjekkia) arvsmønstre i 8000 vanlige spiselige erteplanter , og sporet forskjellige egenskaper fra foreldre til avkom. Han beskrev disse matematisk som 2 n  kombinasjoner der n er antallet forskjellige egenskaper i de originale erter. Selv om han ikke brukte begrepet gen , forklarte han resultatene sine i form av diskrete arvelige enheter som gir opphav til observerbare fysiske egenskaper. Denne beskrivelsen forhåndsdefinerte Wilhelm Johannsens skille mellom genotype (genetisk materiale til en organisme) og fenotype (de observerbare egenskapene til den organismen). Mendel var også den første som demonstrerte uavhengig sortiment , skillet mellom dominerende og recessive egenskaper, skillet mellom en heterozygot og homozygote og fenomenet diskontinuerlig arv.

Før Mendels arbeid var den dominerende arvelighetsteorien en blanding av arv , noe som antydet at hver forelder bidro med væske til befruktningsprosessen og at foreldrenes egenskaper blandet seg og blandet seg for å produsere avkommet. Charles Darwin utviklet en arvsteori han kalte pangenesis , fra gresk pan ("alt, hel") og genesis ("fødsel") / genos ("opprinnelse"). Darwin brukte begrepet gemmule for å beskrive hypotetiske partikler som ville blandes under reproduksjon.

Mendels arbeid gikk stort sett upåaktet hen etter den første publikasjonen i 1866, men ble gjenoppdaget på slutten av 1800 -tallet av Hugo de Vries , Carl Correns og Erich von Tschermak , som (hevdet å ha) kommet til lignende konklusjoner i sin egen forskning. Spesielt i 1889 publiserte Hugo de Vries boken Intracellular Pangenesis , der han postulerte at forskjellige karakterer har individuelle arvelige bærere og at arv av spesifikke egenskaper hos organismer kommer i partikler. De Vries kalte disse enhetene "pangenes" ( Pangens på tysk), etter Darwins pangeneseteori fra 1868.

Tjue år senere, i 1909, introduserte Wilhelm Johannsen begrepet 'gen' og i 1906, William Bateson , ' genetikk ' mens Eduard Strasburger , blant andre, fremdeles brukte begrepet 'pangene' for den grunnleggende fysiske og funksjonelle arvenheten. .

Oppdagelse av DNA

Fremskritt i forståelsen av gener og arv fortsatte gjennom det 20. århundre. Deoksyribonukleinsyre (DNA) ble vist å være molekylær depot for genetisk informasjon ved eksperimenter på 1940- til 1950 -tallet. Strukturen av DNA ble studert av Rosalind Franklin og Maurice Wilkins ved bruk av røntgenkrystallografi , noe som førte til at James D. Watson og Francis Crick publiserte en modell av det dobbeltstrengede DNA-molekylet hvis parede nukleotidbaser indikerte en overbevisende hypotese for mekanismen for genetisk replikasjon.

På begynnelsen av 1950 -tallet var den rådende oppfatningen at genene i et kromosom virket som diskrete enheter, udelelige ved rekombinasjon og ordnet som perler på en streng. Eksperimentene med Benzer med mutanter defekte i rII -regionen i bakteriofag T4 (1955–1959) viste at individuelle gener har en enkel lineær struktur og sannsynligvis vil være ekvivalent med en lineær seksjon av DNA.

Samlet sett etablerte denne forskningsgruppen det sentrale dogmet i molekylærbiologi , som sier at proteiner blir oversatt fra RNA , som er transkribert fra DNA . Dette dogmet har siden vist seg å ha unntak, for eksempel omvendt transkripsjon i retrovirus . Den moderne studien av genetikk på DNA -nivå er kjent som molekylær genetikk .

I 1972 var Walter Fiers og teamet hans de første som bestemte sekvensen til et gen: sekvensen til Bacteriophage MS2 -kappeprotein . Den påfølgende utviklingen av kjedeavslutning DNA-sekvensering i 1977 av Frederick Sanger forbedret effektiviteten av sekvensering og gjorde den til et rutinemessig laboratorieverktøy. En automatisert versjon av Sanger -metoden ble brukt i tidlige faser av Human Genome Project .

Moderne syntese og dens etterfølgere

Teoriene utviklet på begynnelsen av 1900 -tallet for å integrere mendelsk genetikk med darwinistisk evolusjon kalles den moderne syntesen , et begrep introdusert av Julian Huxley .

Evolusjonære biologer har senere modifisert dette konseptet, for eksempel George C. Williams ' gen-sentriske syn på evolusjon . Han foreslo et evolusjonært konsept av genet som en enhet for naturlig seleksjon med definisjonen: "det som segregerer og rekombinerer med betydelig frekvens." I dette synet transkriberer det molekylære genet som en enhet, og det evolusjonære genet arver som en enhet. Beslektede ideer som understreker sentraliteten til gener i evolusjonen ble populært av Richard Dawkins .

Molekylær basis

DNA-kjemisk strukturdiagram som viser hvordan dobbeltspiralen består av to kjeder med sukker-fosfat-ryggrad med baser som peker innover og spesielt baseparring A til T og C til G med hydrogenbindinger.
Den kjemiske strukturen til et fire basepar fragment av en DNA dobbel helix . De sukker - fosfat- hovedkjeder drives i motsatte retninger med de baser som peker innover, baseparring A til T og C til G med hydrogenbindinger .

DNA

De aller fleste organismer koder for genene sine i lange DNA -deler (deoksyribonukleinsyre). DNA består av en kjede som består av fire typer nukleotidunderenheter , som hver består av: et sukker med fem karbon ( 2-deoksyribose ), en fosfatgruppe og en av de fire basene adenin , cytosin , guanin og tymin .

To kjeder av DNA vrir seg rundt hverandre for å danne en dobbel dobbel spiral med fosfatsukker-ryggraden som spiraler rundt utsiden, og basene peker innover med adeninbase- paring til tymin og guanin til cytosin. Spesifisiteten til baseparring oppstår fordi adenin og tymin justeres for å danne to hydrogenbindinger , mens cytosin og guanin danner tre hydrogenbindinger. De to strengene i en dobbel spiral må derfor være komplementære , med deres sekvens av baser som matcher slik at adeninene til den ene strengen er parret med tyminene til den andre strengen, og så videre.

På grunn av den kjemiske sammensetningen av pentoserestene i basene, har DNA -tråder retning. Den ene enden av en DNA -polymer inneholder en eksponert hydroksylgruppedeoksyribosen ; dette er kjent som 3' -enden av molekylet. Den andre enden inneholder en eksponert fosfatgruppe ; dette er 5' -enden . De to trådene i en dobbel-helix går i motsatte retninger. Nukleinsyresyntese, inkludert DNA -replikasjon og transkripsjon skjer i 5 '→ 3' -retningen, fordi nye nukleotider tilsettes via en dehydratiseringsreaksjon som bruker det eksponerte 3' -hydroksylet som en nukleofil .

Den ekspresjon av gener som er kodet i DNA begynner med å transkribere genet inn i RNA , en andre type nukleinsyre som er svært lik DNA, men hvis monomerer inneholder sukker- ribose i stedet for deoksyribose . RNA inneholder også base uracil i stedet for tymin . RNA-molekyler er mindre stabile enn DNA og er vanligvis enkeltstrengede. Gener som koder for proteiner består av en serie med tre- nukleotidsekvenser kalt kodoner , som fungerer som "ord" i det genetiske "språket". Den genetiske koden spesifiserer korrespondansen under proteinoversettelse mellom kodoner og aminosyrer . Den genetiske koden er nesten den samme for alle kjente organismer.

Kromosomer

Et mikroskopibilde av 46 kromosomer stripet med røde og grønne bånd
Fluorescerende mikroskopibilde av en menneskelig kvinnelig karyotype , som viser 23 par kromosomer. DNA er farget rødt, med regioner som er rike på husholdningsgener som er mer farget i grønt. De største kromosomene er rundt 10 ganger størrelsen på de minste.

Det totale komplementet av gener i en organisme eller celle er kjent som dets genom , som kan lagres på ett eller flere kromosomer . Et kromosom består av en enkelt, veldig lang DNA -helix som tusenvis av gener er kodet for. Regionen av kromosomet der et bestemt gen befinner seg, kalles dens lokus . Hvert lokus inneholder ett allel av et gen; medlemmer av en populasjon kan imidlertid ha forskjellige alleler på stedet, hver med en litt annen gensekvens.

Flertallet av eukaryote gener er lagret på et sett med store, lineære kromosomer. Kromosomene er pakket inn i kjernen i kompleks med lagringsproteiner kalt histoner for å danne en enhet som kalles et nukleosom . DNA pakket og kondensert på denne måten kalles kromatin . Måten DNA lagres på histonene på, i tillegg til kjemiske modifikasjoner av selve histonet, regulerer om en bestemt DNA -region er tilgjengelig for genuttrykk . I tillegg til gener inneholder eukaryote kromosomer sekvenser som er involvert i å sikre at DNA blir kopiert uten nedbrytning av endeområder og sortert i datterceller under celledeling: replikasjonsorigin , telomerer og sentromerer . Replikasjonens opprinnelse er sekvensregionene der DNA -replikasjon initieres for å lage to kopier av kromosomet. Telomerer er lange strekninger med repeterende sekvenser som dekker endene på de lineære kromosomene og forhindrer nedbrytning av kodende og regulatoriske regioner under DNA -replikasjon . Lengden på telomerene reduseres hver gang genomet replikeres og har vært implisert i aldringsprosessen . Sentromeren er nødvendig for å binde spindelfibre for å skille søsterkromatider i datterceller under celledeling .

Prokaryoter ( bakterier og archaea ) lagrer vanligvis genomene sine på et enkelt stort, sirkulært kromosom . På samme måte inneholder noen eukaryote organeller et resterende sirkulært kromosom med et lite antall gener. Prokaryoter supplerer noen ganger kromosomet med ytterligere små sirkler av DNA som kalles plasmider , som vanligvis bare koder for noen få gener og kan overføres mellom individer. For eksempel er genene for antibiotikaresistens vanligvis kodet på bakterielle plasmider og kan passeres mellom individuelle celler, selv de av forskjellige arter, via horisontal genoverføring .

Mens kromosomene til prokaryoter er relativt gentette, inneholder eukaryotes ofte områder av DNA som ikke har noen åpenbar funksjon. Enkle encellede eukaryoter har relativt små mengder slikt DNA, mens genomene til komplekse flercellede organismer , inkludert mennesker, inneholder et absolutt flertall av DNA uten en identifisert funksjon. Dette DNA har ofte blitt referert til som " søppel -DNA ". Nyere analyser antyder imidlertid at selv om proteinkodende DNA utgjør knapt 2% av det menneskelige genomet , kan omtrent 80% av basene i genomet uttrykkes, så begrepet "søppel-DNA" kan være en misvisende navn.

Struktur og funksjon

Struktur

Bildet ovenfor inneholder klikkbare lenker
Strukturen til et eukaryotisk proteinkodende gen. Den regulatoriske sekvensen kontrollerer når og hvor ekspresjon forekommer for proteinkodingsområdet (rødt). Promoter- og forsterkerregioner (gul) regulerer transkripsjonen av genet til et pre-mRNA som er modifisert for å fjerne introner (lysegrå) og legge til en 5'-hette og poly-A-hale (mørkegrå). De mRNA 5 ' og 3' uoversatte regioner (blå) regulerer translasjon til det endelige proteinproduktet.

Den struktur av et gen som består av flere elementer, hvorav selve proteinkodende sekvens er ofte bare en liten del. Disse inkluderer DNA -regioner som ikke er transkribert, så vel som uoversatte regioner av RNA.

Ved siden av den åpne leserammen inneholder gener en regulatorisk sekvens som er nødvendig for uttrykket. For det første krever gener en promotorsekvens . Promotoren blir gjenkjent og bundet av transkripsjonsfaktorer som rekrutterer og hjelper RNA -polymerase å binde seg til regionen for å starte transkripsjon. Gjenkjenningen skjer vanligvis som en konsensus -sekvens som TATA -boksen . Et gen kan ha mer enn én promoter, noe som resulterer i messenger -RNA ( mRNA ) som er forskjellige i hvor langt de strekker seg i 5' -enden. Svært transkriberte gener har "sterke" promotorsekvenser som danner sterke assosiasjoner til transkripsjonsfaktorer, og derved initierer transkripsjon med høy hastighet. Andre gener har "svake" promotorer som danner svake assosiasjoner til transkripsjonsfaktorer og starter transkripsjon sjeldnere. Eukaryote promotorregioner er mye mer komplekse og vanskeligere å identifisere enn prokaryote promotorer.

I tillegg kan gener ha regulatoriske regioner mange kilobaser oppstrøms eller nedstrøms for den åpne leserammen som endrer uttrykk. Disse virker ved å binde seg til transkripsjonsfaktorer som deretter får DNA til å sløyfe slik at den regulatoriske sekvensen (og den bundne transkripsjonsfaktoren) blir nær RNA -polymerasebindingsstedet. For eksempel øker forsterkere transkripsjon ved å binde et aktivatorprotein som deretter hjelper til med å rekruttere RNA -polymerase til promotoren; omvendt binder lyddempere repressorproteiner og gjør DNA mindre tilgjengelig for RNA -polymerase.

Det transkriberte pre-mRNA inneholder utranslaterte regioner i begge ender som inneholder bindingssteder for ribosomer , RNA-bindende proteiner , miRNA , så vel som terminator , og start- og stoppkodoner . I tillegg inneholder de fleste eukaryote åpne leserammer uoversatte introner , som fjernes og eksoner , som er koblet sammen i en prosess kjent som RNA -spleising . Til slutt er endene av gentranskripsjoner definert av spaltning og polyadenylering (CPA) -steder , hvor nyprodusert pre-mRNA blir spaltet og en streng på ~ 200 adenosinmonofosfater blir tilsatt i 3'-enden. Det poly (A) hale beskytter ferdig mRNA fra degradering og har også andre funksjoner, som påvirker translasjon, lokalisering, og transport av transkriptet fra kjernen. Splising, etterfulgt av CPA, genererer det endelige modne mRNA , som koder for proteinet eller RNA -produktet. Selv om de generelle mekanismene som definerer lokalisering av menneskelige gener er kjent, er identifisering av de eksakte faktorene som regulerer disse cellulære prosessene et område av aktiv forskning. For eksempel kan kjente sekvensfunksjoner i 3′-UTR bare forklare halvparten av alle humane genender.

Mange prokaryote gener er organisert i operoner , med flere proteinkodende sekvenser som er transkribert som en enhet. Genene i en operon transkriberes som et kontinuerlig messenger -RNA , referert til som et polykistronisk mRNA . Begrepet cistron i denne sammenhengen tilsvarer gen. Transkripsjonen av en operons mRNA blir ofte kontrollert av en repressor som kan forekomme i en aktiv eller inaktiv tilstand avhengig av tilstedeværelsen av spesifikke metabolitter. Når den er aktiv, binder repressoren til en DNA -sekvens i begynnelsen av operonet, kalt operatørregionen , og undertrykker transkripsjon av operonet ; når repressoren er inaktiv kan transkripsjon av operonet forekomme (se f.eks. Lac operon ). Produktene av operongener har vanligvis relaterte funksjoner og er involvert i det samme regulatoriske nettverket .

Funksjonelle definisjoner

Det er vanskelig å definere nøyaktig hvilken del av en DNA -sekvens som består av et gen. Regulerende regioner av et gen som forsterkere trenger ikke nødvendigvis å være i nærheten av den kodende sekvensen på det lineære molekylet fordi det mellomliggende DNA kan sløyfes ut for å bringe genet og dets regulatoriske område i nærheten. På samme måte kan et genet introner være mye større enn eksonene. Reguleringsområder kan til og med befinne seg på helt forskjellige kromosomer og operere i trans for å tillate regulatoriske regioner på ett kromosom å komme i kontakt med målgener på et annet kromosom.

Tidlig arbeid innen molekylær genetikk antydet konseptet om at ett gen lager ett protein . Dette konseptet (opprinnelig kalt en-gen-ett-enzymhypotesen ) kom frem fra et innflytelsesrikt papir fra 1941 av George Beadle og Edward Tatum om eksperimenter med mutanter av soppen Neurospora crassa . Norman Horowitz , en tidlig kollega innen Neurospora -forskningen , minner i 2004 om at "disse eksperimentene grunnla vitenskapen om hva Beadle og Tatum kalte biokjemisk genetikk . I virkeligheten viste de seg å være åpningspistolen i det som ble molekylær genetikk og all utviklingen som har fulgt av det. ” Det ene gen-ett-proteinkonseptet har blitt foredlet siden oppdagelsen av gener som kan kode for flere proteiner ved alternativ spleising og kodesekvenser delt i kort seksjon over genomet hvis mRNA er sammenkoblet av trans-spleising .

Noen ganger brukes en bred operasjonell definisjon for å omfatte kompleksiteten til disse mangfoldige fenomenene, hvor et gen er definert som en forening av genomiske sekvenser som koder for et sammenhengende sett med potensielt overlappende funksjonelle produkter. Denne definisjonen kategoriserer gener etter deres funksjonelle produkter (proteiner eller RNA) i stedet for deres spesifikke DNA-loci, med regulatoriske elementer klassifisert som genassosierte regioner.

Overlapping mellom gener

Det er også mulig for gener å overlappe den samme DNA -sekvensen og betraktes som distinkte, men overlappende gener . Den nåværende definisjonen av et overlappende gen er forskjellig på tvers av eukaryoter, prokaryoter og virus. I eukaryoter har de nylig blitt definert som "når minst ett nukleotid deles mellom de ytterste grensene for de primære transkripsjonene til to eller flere gener, slik at en DNA -basemutasjon ved overlappingspunktet vil påvirke transkripsjoner av alle gener som er involvert i overlapping. " I prokaryoter og virus har de nylig blitt definert som "når de kodende sekvensene til to gener deler et nukleotid enten på samme eller motsatte tråder."

Genuttrykk

I alle organismer kreves to trinn for å lese informasjonen som er kodet i et genet DNA og produsere proteinet det spesifiserer. For det første transkriberes genets DNA til messenger -RNA ( mRNA ). For det andre, at mRNA er oversatt til protein. RNA-kodende gener må fortsatt gå gjennom det første trinnet, men blir ikke oversatt til protein. Prosessen med å produsere et biologisk funksjonelt molekyl av enten RNA eller protein kalles genuttrykk , og det resulterende molekylet kalles et genprodukt .

Genetisk kode

Et RNA -molekyl som består av nukleotider.  Grupper på tre nukleotider er angitt som kodoner, som hver tilsvarer en bestemt aminosyre.
Skjematisk av et enkeltstrenget RNA-molekyl som illustrerer en serie med tre-baserte kodoner . Hver tre- nukleotid -kodon tilsvarer en aminosyre når det oversettes til protein

Nukleotidsekvensen til et genet DNA angir aminosyresekvensen til et protein gjennom den genetiske koden . Sett med tre nukleotider, kjent som kodoner , tilsvarer hver en bestemt aminosyre. Prinsippet om at tre sekvensielle baser av DNA -kode for hver aminosyre ble demonstrert i 1961 ved bruk av rammeskiftmutasjoner i rIIB -genet til bakteriofag T4 (se Crick, Brenner et al. Eksperiment ).

I tillegg indikerer et " startkodon " og tre " stoppkodoner " begynnelsen og slutten av proteinkodingsområdet . Det er 64 mulige kodoner (fire mulige nukleotider i hver av tre stillinger, derav 4 3  mulige kodoner) og bare 20 standard aminosyrer; Derfor er koden overflødig, og flere kodoner kan spesifisere den samme aminosyren. Korrespondansen mellom kodoner og aminosyrer er nesten universell blant alle kjente levende organismer.

Transkripsjon

Transkripsjon produserer et enkeltstrenget RNA- molekyl kjent som messenger-RNA , hvis nukleotidsekvens er komplementær til DNA-en som det ble transkribert fra. MRNA fungerer som et mellomprodukt mellom DNA -genet og dets endelige proteinprodukt. Genets DNA brukes som en mal for å generere et komplementært mRNA. MRNA matcher sekvensen til genets DNA -kodende streng fordi den er syntetisert som komplementet til malstrengen . Transkripsjon utføres av et enzym kalt en RNA -polymerase , som leser malstrengen i 3 ' til 5'  -retningen og syntetiserer RNA fra 5' til 3 ' . For å starte transkripsjon, gjenkjenner og binder polymerasen først en promotorregion av genet. Således er en hovedmekanisme for genregulering blokkering eller sekvestering av promotorregionen, enten ved tett binding av repressormolekyler som fysisk blokkerer polymerasen eller ved å organisere DNA slik at promotorregionen ikke er tilgjengelig.

I prokaryoter forekommer transkripsjon i cytoplasma ; for veldig lange transkripsjoner kan oversettelse begynne ved 5' -enden av RNA mens 3' -enden fortsatt blir transkribert. I eukaryoter forekommer transkripsjon i kjernen, der cellens DNA er lagret. RNA-molekylet produsert av polymerasen er kjent som det primære transkriptet og gjennomgår post-transkripsjonelle modifikasjoner før det blir eksportert til cytoplasma for oversettelse. En av modifikasjonene som er utført er spleising av introner som er sekvenser i det transkriberte området som ikke koder for et protein. Alternative spleisemekanismer kan resultere i at modne transkripsjoner fra det samme genet har forskjellige sekvenser og dermed koder for forskjellige proteiner. Dette er en hovedform for regulering i eukaryote celler og forekommer også i noen prokaryoter.

Oversettelse

Et proteinkodende gen i DNA som transkriberes og translateres til et funksjonelt protein eller et ikke-proteinkodende gen som transkriberes til et funksjonelt RNA
Proteinkodende gener blir transkribert til et mRNA -mellomprodukt, deretter oversatt til et funksjonelt protein . RNA-kodende gener blir transkribert til et funksjonelt, ikke-kodende RNA . ( PDB : 3BSE , 1OBB , 3TRA )

Oversettelse er prosessen der et modent mRNA -molekyl brukes som en mal for syntetisering av et nytt protein . Oversettelse utføres av ribosomer , store komplekser av RNA og protein som er ansvarlige for å utføre de kjemiske reaksjonene for å tilsette nye aminosyrer til en voksende polypeptidkjede ved dannelse av peptidbindinger . Den genetiske koden leses av tre nukleotider om gangen, i enheter som kalles kodoner , via interaksjoner med spesialiserte RNA -molekyler kalt transfer RNA (tRNA). Hvert tRNA har tre uparede baser kjent som anticodon som er komplementære til kodonet det leser på mRNA. TRNA er også kovalent knyttet til aminosyren spesifisert av det komplementære kodonet. Når tRNA binder seg til sitt komplementære kodon i en mRNA -streng, fester ribosomet sin aminosyrelast til den nye polypeptidkjeden, som syntetiseres fra aminoterminal til karboksylterminal . Under og etter syntese må de fleste nye proteiner brette seg til sin aktive tredimensjonale struktur før de kan utføre sine cellulære funksjoner.

Regulering

Gener er regulert slik at de bare kommer til uttrykk når produktet er nødvendig, siden uttrykket bruker begrensede ressurser. En celle regulerer genuttrykket avhengig av sitt ytre miljø (f.eks. Tilgjengelige næringsstoffer , temperatur og andre påkjenninger ), dets indre miljø (f.eks. Celledelingssyklus , metabolisme , infeksjonstatus ) og dens spesifikke rolle hvis den er i en flercellet organisme. Genuttrykk kan reguleres på ethvert trinn: fra transkripsjonell initiering , til RNA-prosessering , til post-translasjonell modifikasjon av proteinet. Reguleringen av laktosemetabolismegener i E. coli ( lac operon ) var den første slike mekanismen som ble beskrevet i 1961.

RNA -gener

Et typisk proteinkodende gen blir først kopiert til RNA som et mellomprodukt i fremstillingen av det endelige proteinproduktet. I andre tilfeller er RNA -molekylene de faktiske funksjonelle produktene, som ved syntese av ribosomalt RNA og overførings -RNA . Noen RNAer kjent som ribozymer er i stand til enzymatisk funksjon , og mikroRNA har en regulatorisk rolle. De DNA -sekvenser fra hvilke slike RNA transkriberes er kjent som ikke-kodende RNA gener .

Noen virus lagrer hele genomene i form av RNA , og inneholder ikke DNA i det hele tatt. Fordi de bruker RNA til å lagre gener, deres cellulære verter kan syntetisere deres proteiner så snart de er infisert og uten forsinkelse i reguleringen av transkripsjon. På den annen side krever RNA -retrovirus , for eksempel HIV , omvendt transkripsjon av genomet deres fra RNA til DNA før proteinene deres kan syntetiseres. RNA-mediert epigenetisk arv er også observert hos planter og svært sjelden hos dyr.

Arv

Illustrasjon av autosomal recessiv arv.  Hver forelder har en blå allel og en hvit allel.  Hvert av deres 4 barn arver en allel fra hver forelder slik at ett barn ender opp med to blå alleler, ett barn har to hvite alleler og to barn har en av hver allel.  Bare barnet med begge blå alleler viser egenskapen fordi egenskapen er recessiv.
Arv av et gen som har to forskjellige alleler (blå og hvit). Genet befinner seg på et autosomalt kromosom . Den hvite allelen er recessiv for den blå allelen. Sannsynligheten for hvert utfall i barnegenerasjonen er en fjerdedel, eller 25 prosent.

Organismer arver genene sine fra foreldrene. Aseksuelle organismer arver ganske enkelt en fullstendig kopi av foreldrenes genom. Seksuelle organismer har to kopier av hvert kromosom fordi de arver ett komplett sett fra hver forelder.

Mendelsk arv

I følge mendelsk arv skyldes variasjoner i en organismes fenotype (observerbare fysiske og atferdsmessige egenskaper) delvis variasjoner i genotypen (bestemt sett med gener). Hvert gen spesifiserer en bestemt egenskap med en annen sekvens av et gen ( alleler ) som gir opphav til forskjellige fenotyper. De fleste eukaryote organismer (som erteplantene Mendel jobbet med) har to alleler for hver egenskap, en arvet fra hver forelder.

Alleler på et sted kan være dominerende eller recessive ; dominerende alleler gir opphav til sine tilsvarende fenotyper når de er parret med en annen allel for den samme egenskapen, mens recessive alleler gir opphav til sin tilsvarende fenotype bare når de er parret med en annen kopi av den samme allelen. Hvis du kjenner genotypene til organismer, kan du bestemme hvilke alleler som er dominerende og hvilke som er recessive. For eksempel, hvis allelen som angir høye stengler i erteplanter er dominerende over allelen som spesifiserer korte stilker, vil erteplanter som arver en høy allel fra en forelder og en kort allel fra den andre forelder også ha høye stengler. Mendels arbeid viste at alleler sorterer uavhengig av hverandre i produksjonen av kjønnsceller eller kimceller , noe som sikrer variasjon i neste generasjon. Selv om mendelsk arv fortsatt er en god modell for mange egenskaper bestemt av enkeltgener (inkludert en rekke kjente genetiske lidelser ), inkluderer den ikke de fysiske prosessene for DNA-replikasjon og celledeling.

DNA -replikasjon og celledeling

Vekst, utvikling og reproduksjon av organismer er avhengig av celledeling ; prosessen der en enkelt celle deler seg i to vanligvis identiske datterceller . Dette krever først å lage en kopi av hvert gen i genomet i en prosess som kalles DNA -replikasjon . Kopiene er laget av spesialiserte enzymer kjent som DNA-polymeraser , som "leser" en tråd av det dobbeltspirale DNA, kjent som malstrengen, og syntetiserer en ny komplementær streng. Fordi DNA -dobbeltspiralen holdes sammen ved baseparring , spesifiserer sekvensen til en streng fullstendig sekvensen av komplementet; Derfor trenger bare en tråd å leses av enzymet for å produsere en tro kopi. Prosessen med DNA -replikasjon er semikonservativ ; det vil si at kopien av genomet som arves av hver dattercelle inneholder en original og en nysyntetisert DNA -streng.

Hastigheten på DNA-replikasjon i levende celler ble først målt som hastigheten på fag T4 DNA-forlengelse i faginfiserte E. coli og funnet å være imponerende rask. I perioden med eksponentiell DNA -økning ved 37 ° C var forlengelseshastigheten 749 nukleotider per sekund.

Etter at DNA-replikasjon er fullført, må cellen fysisk skille de to kopiene av genomet og dele seg i to forskjellige membranbundne celler. I prokaryoter  ( bakterier og archaea ) skjer dette vanligvis via en relativt enkel prosess som kalles binær fisjon , der hvert sirkulære genom fester seg til cellemembranen og skilles inn i dattercellene når membranen invaginerer for å dele cytoplasma i to membranbundne deler . Binær fisjon er ekstremt rask sammenlignet med celledeling i eukaryoter . Eukaryote celledeling er en mer kompleks prosess kjent som cellesyklusen ; DNA -replikasjon skjer i en fase av denne syklusen kjent som S -fasen , mens prosessen med å separere kromosomer og splitte cytoplasma skjer under M -fasen .

Molekylær arv

Duplisering og overføring av genetisk materiale fra en generasjon av celler til den neste er grunnlaget for molekylær arv og koblingen mellom de klassiske og molekylære bildene av gener. Organismer arver foreldrenes egenskaper fordi cellene i avkommet inneholder kopier av genene i foreldrenes celler. I aseksuelt reproduserende organismer vil avkommet være en genetisk kopi eller klon av moderorganismen. I seksuelt reproduserende organismer produserer en spesialisert form for celledeling kalt meiose celler som kalles gameter eller kimceller som er haploide , eller inneholder bare en kopi av hvert gen. Kjønnscellene som produseres av kvinner kalles egg eller egg, og de som produseres av menn kalles sædceller . To gameter smelter for å danne et diploid befruktet egg , en enkelt celle som har to sett med gener, med en kopi av hvert gen fra moren og en fra faren.

Under prosessen med meiotisk celledeling kan det noen ganger forekomme en hendelse som kalles genetisk rekombinasjon eller overgang , der en lengde på DNA på ett kromatid byttes ut med en lengde av DNA på det tilsvarende homologe ikke-søster-kromatidet. Dette kan resultere i et assortiment av ellers koblede alleler. Det mendelske prinsippet om uavhengig sortiment hevder at hver av foreldrenes to gener for hver egenskap vil sortere uavhengig i kjønnsceller; hvilken allel en organisme arver for en egenskap er ikke relatert til hvilken allel den arver for en annen egenskap. Dette er faktisk bare sant for gener som ikke ligger på det samme kromosomet eller ligger veldig langt fra hverandre på det samme kromosomet. Jo nærmere to gener ligger på det samme kromosomet, jo nærmere blir de assosiert i kjønnsceller og jo oftere vil de vises sammen (kjent som genetisk kobling ). Gener som er veldig nære skilles i hovedsak aldri fordi det er ekstremt usannsynlig at et kryssingspunkt vil oppstå mellom dem.

Molekylær evolusjon

Mutasjon

DNA -replikasjon er for det meste ekstremt nøyaktig, men feil ( mutasjoner ) oppstår. Feilraten i eukaryote celler kan være så lav som 10 - 8 per nukleotid per replikasjon, mens den for noen RNA -virus kan være så høy som 10 - 3 . Dette betyr at hver generasjon, hvert menneskelig genom akkumulerer 1-2 nye mutasjoner. Små mutasjoner kan være forårsaket av DNA -replikasjon og kjølvannet av DNA -skade og inkludere punktmutasjoner der en enkelt base endres og rammeskiftmutasjoner der en enkelt base settes inn eller slettes. Begge disse mutasjonene kan endre genet ved missense (endre et kodon for å kode en annen aminosyre) eller tull (et for tidlig stoppkodon ). Større mutasjoner kan skyldes feil i rekombinasjon for å forårsake kromosomavvik, inkludert duplisering , sletting, omorganisering eller inversjon av store deler av et kromosom. I tillegg kan DNA -reparasjonsmekanismer introdusere mutasjonsfeil ved reparasjon av fysisk skade på molekylet. Reparasjonen, selv med mutasjon, er viktigere for å overleve enn å gjenopprette en eksakt kopi, for eksempel ved reparasjon av dobbeltstrengede brudd .

Når flere forskjellige alleler for et gen er tilstede i en arts befolkning kalles det polymorf . De fleste forskjellige alleler er funksjonelt likeverdige, men noen alleler kan gi opphav til forskjellige fenotypiske trekk . Et genes vanligste allel kalles villtypen , og sjeldne alleler kalles mutanter . Den genetiske variasjonen i relative frekvenser for forskjellige alleler i en populasjon skyldes både naturlig seleksjon og genetisk drift . Viltypealelen er ikke nødvendigvis stamfar til mindre vanlige alleler, og den er heller ikke nødvendigvis sprekere .

De fleste mutasjoner i gener er nøytrale , og har ingen effekt på organismenes fenotype ( stille mutasjoner ). Noen mutasjoner endrer ikke aminosyresekvensen fordi flere kodoner koder for den samme aminosyren ( synonyme mutasjoner ). Andre mutasjoner kan være nøytrale hvis de fører til endringer i aminosyresekvensen, men proteinet fungerer fortsatt på samme måte som den nye aminosyren (f.eks. Konservative mutasjoner ). Mange mutasjoner er imidlertid skadelige eller dødelige , og blir fjernet fra populasjoner ved naturlig seleksjon. Genetiske lidelser er et resultat av skadelige mutasjoner og kan skyldes spontan mutasjon hos det berørte individet, eller kan arves. Til slutt er en liten brøkdel av mutasjoner gunstige , forbedrer organismens kondisjon og er ekstremt viktige for evolusjon, siden deres retningsvalg fører til adaptiv evolusjon .

Sekvenshomologi

En sekvenssammenstilling, produsert av ClustalO , av pattedyr histon proteiner

Gener med en siste felles stamfar , og dermed en felles evolusjonær aner, er kjent som homologer . Disse genene dukker opp enten fra gentuplisering i en organismes genom, hvor de er kjent som paralogiske gener, eller er et resultat av divergens mellom genene etter en spesiasjonshendelse , der de er kjent som ortologe gener, og ofte utfører de samme eller lignende funksjoner i beslektede organismer. Det antas ofte at funksjonene til ortologe gener er mer like enn de til paraloge gener, selv om forskjellen er minimal.

Forholdet mellom gener kan måles ved å sammenligne sekvensjusteringen av deres DNA. Graden av sekvenslikhet mellom homologe gener kalles konservert sekvens . De fleste endringer i et gens sekvens påvirker ikke funksjonen, og derfor akkumulerer gener mutasjoner over tid ved nøytral molekylær evolusjon . I tillegg vil enhver markering på et gen få sekvensen til å avvike med en annen hastighet. Gener under stabiliserende seleksjon er begrenset og endrer seg derfor langsommere, mens gener under retningsvalg seleksjon endres raskere. Sekvensforskjellene mellom gener kan brukes til fylogenetiske analyser for å studere hvordan disse genene har utviklet seg og hvordan organismer de kommer fra er relatert.

Opprinnelsen til nye gener

Evolusjonær skjebne for dupliserte gener.

Den vanligste kilden til nye gener i eukaryote linjer er genduplisering , noe som skaper variasjon i kopitall av et eksisterende gen i genomet. De resulterende genene (paralogene) kan deretter avvike i rekkefølge og i funksjon. Sett med gener dannet på denne måten utgjør en genfamilie . Gendupliseringer og tap i en familie er vanlige og representerer en viktig kilde til evolusjonært biologisk mangfold . Noen ganger kan gentuplisering resultere i en ikke -funksjonell kopi av et gen, eller en funksjonell kopi kan være gjenstand for mutasjoner som resulterer i tap av funksjon; slike ikke -funksjonelle gener kalles pseudogener .

"Foreldreløse" gener , hvis sekvens ikke viser likhet med eksisterende gener, er mindre vanlige enn genduplikater. Det menneskelige genomet inneholder anslagsvis 18 til 60 gener uten identifiserbare homologer utenfor mennesker. Foreldreløse gener oppstår først og fremst fra enten de novo- fremvekst fra tidligere ikke-kodende sekvens , eller genduplisering etterfulgt av så rask sekvensendring at det opprinnelige forholdet blir uoppdagelig. De novo -gener er vanligvis kortere og enklere i struktur enn de fleste eukaryote gener, med få om noen introner. Over lange evolusjonære tidsperioder kan de novo genfødsel være ansvarlig for en betydelig brøkdel av taksonomisk begrensede genfamilier.

Horisontal genoverføring refererer til overføring av genetisk materiale gjennom en annen mekanisme enn reproduksjon . Denne mekanismen er en vanlig kilde til nye gener i prokaryoter , noen ganger antatt å bidra mer til genetisk variasjon enn genduplisering. Det er et vanlig middel for å spre antibiotikaresistens , virulens og adaptive metabolske funksjoner. Selv om horisontal genoverføring er sjelden i eukaryoter, har sannsynlige eksempler blitt identifisert på protist- og algengener som inneholder gener av bakteriell opprinnelse.

Genom

Den genomet er den totale genetiske materialet i en organisme, og innbefatter både genene og ikke-kodende sekvenser . Eukaryote gener kan kommenteres ved hjelp av FINDER.

Antall gener

Avbildning av antall gener for representative planter (grønn), virveldyr (blå), virvelløse dyr (oransje), sopp (gul), bakterier (lilla) og virus (grå). Et innlegg til høyre viser de mindre genomene som er utvidet 100 ganger arealmessig.

Den genomstørrelse , og antallet gener som koder for det varierer mellom organismer. De minste genomene forekommer i virus og viroider (som fungerer som et enkelt ikke-kodende RNA-gen). Motsatt kan planter ha ekstremt store genomer, med ris som inneholder> 46 000 proteinkodende gener. Det totale antallet proteinkodende gener (jordens proteom ) er estimert til å være 5 millioner sekvenser.

Selv om antallet basepar av DNA i det menneskelige genomet har vært kjent siden 1960-tallet, har det estimerte antallet gener endret seg over tid som definisjoner av gener, og metoder for å påvise dem har blitt forbedret. De første teoretiske spådommene om antall menneskelige gener var så høye som 2.000.000. Tidlige eksperimentelle tiltak indikerte at det var 50 000–100 000 transkriberte gener ( uttrykte sekvensmerker ). Deretter indikerte sekvensering i Human Genome Project at mange av disse transkripsjonene var alternative varianter av de samme genene, og det totale antallet proteinkodende gener ble revidert til ~ 20 000 med 13 gener kodet for mitokondrielt genom. Med GENCODE -annotasjonsprosjektet har dette anslaget fortsatt å falle til 19 000. Av det menneskelige genomet består bare 1-2% av proteinkodende sekvenser, mens resten er 'ikke-kodende' DNA som introner , retrotransposoner og ikke-kodende RNA . Hver flercellet organisme har alle sine gener i hver celle i kroppen, men ikke alle genene fungerer i hver celle.

Viktige gener

Genet fungerer i det minimale genomet til den syntetiske organismen , Syn 3 .

Essensielle gener er settet med gener som antas å være avgjørende for en organismes overlevelse. Denne definisjonen forutsetter rikelig tilgjengelighet av alle relevante næringsstoffer og fravær av miljøbelastning. Bare en liten del av organismens gener er viktige. I bakterier er anslagsvis 250–400 gener avgjørende for Escherichia coli og Bacillus subtilis , som er mindre enn 10% av genene deres. Halvparten av disse genene er ortologer i begge organismer og er i stor grad involvert i proteinsyntese . I den spirende gjæren Saccharomyces cerevisiae er antallet essensielle gener litt høyere, ved 1000 gener (~ 20% av genene deres). Selv om tallet er vanskeligere å måle i høyere eukaryoter, anslås mus og mennesker å ha rundt 2000 essensielle gener (~ 10% av genene). Den syntetiske organismen, Syn 3 , har et minimalt genom på 473 essensielle gener og kvasi-essensielle gener (nødvendig for rask vekst), selv om 149 har ukjent funksjon.

Viktige gener inkluderer husholdningsgener (kritiske for grunnleggende cellefunksjoner) samt gener som uttrykkes på forskjellige tidspunkter i organismenes utvikling eller livssyklus . Husholdningsgener brukes som eksperimentelle kontroller ved analyse av genuttrykk , siden de uttrykkes konstituerende på et relativt konstant nivå.

Genetisk og genomisk nomenklatur

Gen-nomenklatur er etablert av HUGO Gene Nomenclature Committee (HGNC), en komité for Human Genome Organization , for hvert kjente humane gen i form av et godkjent gennavn og symbol (kort form forkortelse ), som kan nås via en database vedlikeholdt av HGNC. Symboler er valgt for å være unike, og hvert gen har bare ett symbol (selv om godkjente symboler noen ganger endres). Symboler holdes fortrinnsvis konsistent med andre medlemmer av en genfamilie og med homologer i andre arter, spesielt musen på grunn av dens rolle som en vanlig modellorganisme .

Genteknologi

Sammenligning av konvensjonell planteavl med transgen og cisgen genetisk modifikasjon.

Genteknologi er modifikasjonen av en organismes genom gjennom bioteknologi . Siden 1970 -tallet har en rekke teknikker blitt utviklet for å spesifikt legge til, fjerne og redigere gener i en organisme. Nylig utviklede genomingeniørteknikker bruk konstruert for nuklease -enzymer for å skape målrettet DNA-reparasjon i et kromosom til enten å forstyrre eller redigere et gen når bruddet er reparert. Det beslektede uttrykket syntetisk biologi brukes noen ganger for å referere til omfattende genteknologi av en organisme.

Genteknologi er nå et rutinemessig forskningsverktøy med modellorganismer . For eksempel legges det enkelt til gener i bakterier, og avstamninger av knockoutmus med et bestemt gen som er forstyrret, brukes til å undersøke det genets funksjon. Mange organismer har blitt genetisk modifisert for anvendelser innen landbruk , industriell bioteknologi og medisin .

For flercellede organismer er vanligvis embryoet konstruert som vokser til en voksen genetisk modifisert organisme . Imidlertid kan genomene til celler i en voksen organisme redigeres ved hjelp av genterapiteknikker for å behandle genetiske sykdommer.

Se også

Referanser

Sitater

Kilder

Hovedlærebok

Videre lesning

Eksterne linker