Konsensussekvens - Consensus sequence

I molekylærbiologi og bioinformatikk er konsensus-sekvensen (eller den kanoniske sekvensen ) den beregnede rekkefølgen av de hyppigste rester, enten nukleotid eller aminosyre , funnet ved hver posisjon i en sekvensjustering . Det representerer resultatene av flere sekvensjusteringer der relaterte sekvenser blir sammenlignet med hverandre og lignende sekvensmotiver beregnes. Slik informasjon er viktig når man vurderer sekvensavhengige enzymer som RNA-polymerase .

Biologisk betydning

Et proteinbindingssted, representert av en konsensus-sekvens, kan være en kort sekvens av nukleotider som finnes flere ganger i genomet og antas å spille den samme rollen på forskjellige steder. For eksempel gjenkjenner mange transkripsjonsfaktorer bestemte mønstre i promotorene til genene de regulerer. På samme måte har restriksjonsenzymer vanligvis palindromiske konsensus-sekvenser, som vanligvis tilsvarer stedet der de kutter DNA. Transposoner handler på omtrent samme måte når de identifiserer målsekvenser for transponering. Til slutt kan skjøtingssteder (sekvenser som umiddelbart omgir ekson - introngrensene ) også betraktes som konsensussekvenser.

En konsensus-sekvens er således en modell for et antatt DNA-bindingssted : det oppnås ved å tilpasse alle kjente eksempler på et bestemt gjenkjennelsessete og definert som den idealiserte sekvensen som representerer den dominerende basen i hver posisjon. Alle de faktiske eksemplene bør ikke avvike fra konsensus med mer enn noen få erstatninger, men å telle uoverensstemmelser på denne måten kan føre til inkonsekvenser.

Enhver mutasjon som tillater at et mutert nukleotid i kjernepromotorsekvensen ser mer ut som konsensus-sekvensen, er kjent som en opp-mutasjon . Denne typen mutasjon vil generelt gjøre promoteren sterkere, og dermed danner RNA-polymerase en strengere binding til DNA det ønsker å transkribere og transkripsjon er oppregulert. Tvert imot er mutasjoner som ødelegger konserverte nukleotider i konsensus-sekvensen kjent som dunmutasjoner . Disse typer mutasjoner nedregulerer transkripsjon siden RNA-polymerase ikke lenger kan binde så tett til kjernepromotorsekvensen.

Sekvensanalyse

Å utvikle programvare for mønstergjenkjenning er et hovedtema innen genetikk , molekylærbiologi og bioinformatikk . Spesifikke sekvensmotiver kan fungere som regulatoriske sekvenser som styrer biosyntese, eller som signalsekvenser som leder et molekyl til et bestemt sted i cellen eller regulerer modning. Siden reguleringsfunksjonen til disse sekvensene er viktig, antas de å være konservert over lange evolusjonsperioder . I noen tilfeller kan evolusjonær tilknytning estimeres av bevaringsmengden til disse stedene.

Notasjon

De konserverte sekvensmotivene kalles konsensus-sekvenser og de viser hvilke rester som er konservert og hvilke rester som er variable. Tenk på følgende DNA- sekvens:

A [CT] N {A} YR

I denne notasjonen betyr A at en A alltid finnes i den posisjonen; [CT] står for enten C eller T; N står for hvilken som helst base; og {A} betyr hvilken som helst base unntatt A. Y representerer ethvert pyrimidin , og R indikerer hvilket som helst purin .

I dette eksemplet gir ikke notasjonen [CT] noen indikasjon på den relative frekvensen av C eller T som forekommer i den posisjonen. En alternativ metode for å representere en konsensus-sekvens bruker en sekvenslogo . Dette er en grafisk fremstilling av konsensus-sekvensen, hvor størrelsen på et symbol er relatert til frekvensen at et gitt nukleotid (eller aminosyre) forekommer i en bestemt posisjon. I sekvenslogoer jo mer konserverte rest, jo større blir symbolet for den resten tegnet; jo sjeldnere, jo mindre symbol. Sekvenslogoer kan genereres ved hjelp av WebLogo , eller ved hjelp av Gestalt Workbench , et offentlig tilgjengelig visualiseringsverktøy skrevet av Gustavo Glusman ved Institute for Systems Biology .

Programvare

Bioinformatikk verktøy er i stand til å beregne og visualisere konsensus sekvenser. Eksempler på verktøyene er JalView og UGENE .

Se også

Referanser