Sekvenshomologi - Sequence homology

Gene fylogeni som røde og blå grener innenfor grå arter fylogeni. Topp: En duplisering av forfedre produserer to paraloger ( histon H1.1 og 1.2 ). En spesiasjonshendelse produserer ortologer i de to datterartene (menneske og sjimpanse). Nederst: i en egen art ( E. coli ) har et gen en lignende funksjon ( histonlignende nukleoidstrukturerende protein ), men har en egen evolusjonær opprinnelse, og det er en analog .

Sekvenshomologi er den biologiske homologien mellom DNA- , RNA- eller proteinsekvenser , definert i form av felles aner i livets evolusjonære historie . To segmenter av DNA kan ha felles aner på grunn av tre fenomener: enten en spesiasjonshendelse (ortologer), eller en dupliseringshendelse (paraloger), eller en horisontal (eller lateral) genoverføringshendelse (xenologer).

Homologi blant DNA, RNA eller proteiner er vanligvis utledet av deres nukleotid- eller aminosyresekvenslikhet . Betydelig likhet er sterke bevis på at to sekvenser er relatert til evolusjonære endringer fra en vanlig forfedresekvens. Justeringer av flere sekvenser brukes til å indikere hvilke regioner i hver sekvens som er homologe.

Identitet, likhet og bevaring

En sekvensjustering av histonproteiner hos pattedyr . Sekvenser er de midterste 120-180 aminosyrerester av proteinene. Rester som er konservert på tvers av alle sekvenser er markert med grått. Nøkkelen nedenfor angir konservert sekvens (*), konservative mutasjoner (:), semikonservative mutasjoner (.) Og ikke-konservative mutasjoner ().

Begrepet "prosent homologi" brukes ofte for å bety "sekvenslikhet", det vil si prosentandelen av identiske rester ( prosent identitet ), eller prosentandelen rester som er bevart med lignende fysisk -kjemiske egenskaper ( prosent likhet ), f.eks. Leucin og isoleucin , er vanligvis brukes til å "kvantifisere homologien." Basert på definisjonen av homologi spesifisert ovenfor er denne terminologien feil siden sekvenslikhet er observasjonen, homologi er konklusjonen. Sekvenser er enten homologe eller ikke. Dette innebærer at begrepet "prosent homologi" er en misvisende.

Som med morfologiske og anatomiske strukturer, kan sekvenslikhet oppstå på grunn av konvergent evolusjon , eller, som med kortere sekvenser, ved en tilfeldighet, noe som betyr at de ikke er homologe. Homologe sekvensområder kalles også konserverte . Dette skal ikke forveksles med bevaring i aminosyresekvenser , der aminosyren i en bestemt posisjon har blitt erstattet med en annen som har funksjonelt ekvivalente fysisk -kjemiske egenskaper.

Delvis homologi kan forekomme der et segment av de sammenlignede sekvensene har en delt opprinnelse, mens resten ikke har det. Slik delvis homologi kan skyldes en genfusjonshendelse .

Ortologi

Topp: Et forfedre gen dupliserer for å produsere to paraloger (gener A og B). En spesiasjonshendelse produserer ortologer i de to datterartene. Nederst: i en egen art har et ikke -relatert gen en lignende funksjon (gen C), men har en egen evolusjonær opprinnelse, og det er en analog .

Homologe sekvenser er ortologe hvis de antas å stamme fra den samme forfedresekvensen atskilt med en spesiasjonshendelse : Når en art divergerer i to separate arter, sies kopiene av et enkelt gen i de to resulterende artene å være ortologe. Ortologer, eller ortologe gener, er gener i forskjellige arter som stammer fra vertikal nedstigning fra et enkelt gen fra den siste felles forfaren . Begrepet "ortolog" ble laget i 1970 av den molekylære evolusjonisten Walter Fitch .

For eksempel er planteinfluensa -reguleringsproteinet til stede både i Arabidopsis (flercellet høyere plante) og Chlamydomonas (enkeltcelle grønne alger). Den Chlamydomonas versjonen er mer komplekst: det krysser membranen to ganger snarere enn én gang, inneholder flere domener, og gjennomgår alternativ spleising. Imidlertid kan den erstatte det mye enklere Arabidopsis -proteinet fullt ut , hvis det overføres fra alger til plantegenomet ved hjelp av genteknologi . Betydelig sekvenslikhet og delte funksjonelle domener indikerer at disse to genene er ortologe gener, arvet fra den delte forfaren .

Ortologi er strengt definert når det gjelder aner. Gitt at den eksakte opprinnelsen til gener i forskjellige organismer er vanskelig å fastslå på grunn av gentekplisering og genomarrangement av genom, finner man vanligvis det sterkeste beviset på at to lignende gener er ortologe ved å utføre fylogenetisk analyse av genlinjen. Ortologer har ofte, men ikke alltid, den samme funksjonen.

Ortologiske sekvenser gir nyttig informasjon i taksonomisk klassifisering og fylogenetiske studier av organismer. Mønsteret for genetisk divergens kan brukes til å spore organismenes beslektethet. To organismer som er nært beslektet, viser sannsynligvis svært like DNA -sekvenser mellom to ortologer. Motsatt vil en organisme som er fjernet evolusjonært ytterligere fra en annen organisme sannsynligvis vise en større divergens i sekvensen til ortologene som studeres.

Databaser over ortologe gener

Gitt sin enorme betydning for biologi og bioinformatikk , har ortologe gener blitt organisert i flere spesialiserte databaser som gir verktøy for å identifisere og analysere ortologe gensekvenser. Disse ressursene bruker tilnærminger som generelt kan klassifiseres i de som bruker heuristisk analyse av alle parvise sekvenssammenligninger, og de som bruker fylogenetiske metoder. Sekvenssammenligningsmetoder ble først pioner i COGs -databasen i 1997. Disse metodene er utvidet og automatisert i følgende databaser:

  • AYbRAH: Analysere gjær ved å rekonstruere forfedre av homologer
  • eggNOG
  • GreenPhylDB for planter
  • InParanoid fokuserer på parvise ortologiske forhold
  • OHNOLOGS er et depot av genene som beholdes fra hele genomduplikasjoner i vertebratgenomene inkludert mennesker og mus.
  • OMA
  • OrthoDB setter pris på at ortologikonseptet er relativt til forskjellige spesiasjonspunkter ved å gi et hierarki av ortologer langs artstreet.
  • OrthoInspector er et depot av ortologe gener for 4753 organismer som dekker livets tre domener
  • OrthologID
  • OrthoMaM for pattedyr
  • OrthoMCL
  • Roundup

Trebaserte fylogenetiske tilnærminger tar sikte på å skille spesiasjon fra genteknologihendelser ved å sammenligne gentrær med artstrær, slik de er implementert i databaser og programvareverktøy som:

En tredje kategori av hybridmetoder bruker både heuristiske og fylogenetiske metoder for å konstruere klynger og bestemme trær, for eksempel:

  • EnsemblCompara GeneTrees
  • HomoloGene
  • Ortholuge

Paralogi

Paraloge gener er gener som er relatert via dupliseringshendelser i den siste felles forfaren (LCA) til arten som blir sammenlignet. De skyldes mutasjon av dupliserte gener under separate spesiasjonshendelser. Når etterkommere fra LCA deler muterte homologer av de originale dupliserte genene, blir disse genene ansett som paraloger.

Som et eksempel, i LCA kan ett gen (gen A) bli duplisert for å lage et eget lignende gen (gen B), de to genene vil fortsette å bli overført til påfølgende generasjoner. Under spesiasjon vil ett miljø favorisere en mutasjon i gen A (gen A1), og produsere en ny art med genene A1 og B. Så i en egen spesiasjonshendelse vil ett miljø favorisere en mutasjon i gen B (gen B1) som gir opphav til en ny art med genene A og B1. Etterkommernes gener A1 og B1 er paralogiske med hverandre fordi de er homologer som er relatert via en dupliseringshendelse i den siste felles forfaren til de to artene.

Ytterligere klassifiseringer av paraloger inkluderer alloparalogs (ut-paraloger) og symparaloger (in-paraloger). Alloparaloger er paraloger som utviklet seg fra gentuplikasjoner som gikk foran den gitte spesiasjonshendelsen. Med andre ord er alloparaloger paraloger som utviklet seg fra duplikasjonshendelser som skjedde i LCA for organismer som ble sammenlignet. Eksemplet ovenfor er et eksempel på alloparalogi. Symparaloger er paraloger som utviklet seg fra gentuplisering av paraloge gener i påfølgende spesiasjonshendelser. Fra eksemplet ovenfor, hvis etterkommeren med gener A1 og B gjennomgikk en annen spesiasjonshendelse der gen A1 dupliserte seg, ville den nye arten ha gener B, A1a og A1b. I dette eksemplet er gener A1a og A1b symparaloger.

Vertebrate Hox -gener er organisert i sett med paraloger. Hver Hox -klynge (HoxA, HoxB, etc.) er på et annet kromosom. For eksempel er den menneskelige HoxA -klyngen på kromosom 7 . Mus HoxA -klyngen vist her har 11 paraloge gener (2 mangler).

Paraloge gener kan forme strukturen til hele genomer og dermed forklare genomutviklingen i stor grad. Eksempler inkluderer Homeobox ( Hox ) -genene hos dyr. Disse genene gjennomgikk ikke bare genduplikasjoner i kromosomer, men også hele genomduplikasjoner . Som et resultat er Hox-gener i de fleste virveldyr gruppert på tvers av flere kromosomer, og HoxA-D-klyngene er de best studerte.

Et annet eksempel er globingene som koder for myoglobin og hemoglobin og regnes som gamle paraloger. På samme måte er de fire kjente klasser av hemoglobiner ( hemoglobin A , hemoglobin A2 , hemoglobin B og hemoglobin F ) paraloger av hverandre. Mens hvert av disse proteinene tjener den samme grunnleggende funksjonen til oksygen transport, har de allerede divergerte litt i funksjon: fosterhemoglobin (hemoglobin F) har en høyere affinitet for oksygen enn voksen hemoglobin. Funksjonen er imidlertid ikke alltid bevart. Menneskelig angiogenin avviker for eksempel fra ribonuklease , og mens de to paralogene forblir like i tertiær struktur, er deres funksjoner i cellen nå ganske forskjellige.

Det blir ofte hevdet at ortologer er mer funksjonelt like enn paraloger med lignende divergens, men flere artikler har utfordret denne oppfatningen.

Regulering

Paraloger reguleres ofte annerledes, f.eks. Ved å ha forskjellige vevsspesifikke ekspresjonsmønstre (se Hox-gener). Imidlertid kan de også reguleres annerledes på proteinnivå. For eksempel koder Bacillus subtilis for to paraloger av glutamatdehydrogenase : GudB er konstitutivt transkribert mens RocG er tett regulert. I deres aktive, oligomere tilstander viser begge enzymene lignende enzymatiske hastigheter. Bytting av enzymer og promotorer forårsaker imidlertid alvorlige kondisjonstap, og indikerer dermed co -evolusjon mellom promoter -enzym. Karakterisering av proteinene viser at, i forhold til RocG, er GudBs enzymatiske aktivitet sterkt avhengig av glutamat og pH.

Paraloge kromosomregioner

Noen ganger deler store områder av kromosomer geninnhold som ligner andre kromosomale regioner i samme genom. De er godt karakterisert i det menneskelige genomet, der de har blitt brukt som bevis for å støtte 2R -hypotesen . Sett med dupliserte, tredoblede og firedoblede gener, med de relaterte genene på forskjellige kromosomer, er utledet til å være rester fra genom eller kromosomale duplikasjoner. Et sett med paralogiregioner kalles sammen en paralogon. Godt studerte sett med paralogiregioner inkluderer områder av humant kromosom 2, 7, 12 og 17 som inneholder Hox- genklynger, kollagengener , keratingener og andre dupliserte gener, områder av humane kromosomer 4, 5, 8 og 10 som inneholder neuropeptidreseptorgener, Homebox -gener i NK -klassen og mange flere genfamilier , og deler av menneskelige kromosomer 13, 4, 5 og X som inneholder ParaHox -genene og deres naboer. Det store histokompatibilitetskomplekset (MHC) på humant kromosom 6 har paralogiregioner på kromosomer 1, 9 og 19. Mye av det menneskelige genomet ser ut til å kunne tilskrives paralogiregioner.

Oknologi

En hel genomduplikasjonshendelse produserer et genom med to ohnologkopier av hvert gen.
En spesiasjonshendelse produserer ortologer av et gen i de to datterartene. En horisontal genoverføringshendelse fra en art til en annen legger en xenolog av genet til genomet.
En spesiasjonshendelse produserer ortologer av et gen i de to datterartene. Påfølgende hybridisering av disse artene genererer et hybridgenom med en homoeologkopi av hvert gen fra begge artene.

Ohnologe gener er paraloge gener som har sin opprinnelse i en prosess med 2R helgenomet duplisering . Navnet ble først gitt til ære for Susumu Ohno av Ken Wolfe. Ohnologer er nyttige for evolusjonsanalyse fordi alle ohnologer i et genom har vært divergerende i like lang tid (siden deres felles opprinnelse i hele genomduplikasjonen). Ohnologer er også kjent for å vise større tilknytning til kreft, dominerende genetiske lidelser og patogene variasjoner i kopiantall.

Xenologi

Homologer som følge av horisontal genoverføring mellom to organismer kalles xenologer. Xenologer kan ha forskjellige funksjoner hvis det nye miljøet er vidt forskjellig for det horisontalt bevegelige genet. Generelt har xenologer imidlertid vanligvis lignende funksjon i begge organismer. Begrepet ble laget av Walter Fitch.

Homoeologi

Homoeologe (også stavede homologe) kromosomer eller deler av kromosomer er de som ble samlet etter hybridisering mellom arter og allopolyploidisering for å danne et hybridgenom , og hvis forhold var helt homologt i en forfedres art. I allopolyploider bør de homologe kromosomene i hvert foreldres subgenom parres trofast under meiose , noe som fører til disomisk arv; i noen allopolyploider kan imidlertid de homøologe kromosomene i foreldrenes genomer være nesten like like som de homologe kromosomene, noe som fører til tetrasomisk arv (fire kromosomer som pares ved meiose), intergenomisk rekombinasjon og redusert fruktbarhet.

Gametologi

Gametologi angir forholdet mellom homologe gener på ikke-rekombinante, motsatte kjønnskromosomer . Begrepet ble laget av García-Moreno og Mindell. 2000. Gametologer er resultatet av opprinnelsen til genetisk kjønnsbestemmelse og hindringer for rekombinasjon mellom kjønnskromosomer. Eksempler på gametologer inkluderer CHDW og CHDZ hos fugler.

Se også

Referanser