DNA -bindende domene - DNA-binding domain

Et DNA-bindende domene ( DBD ) er et uavhengig brettet proteindomene som inneholder minst ett strukturelt motiv som gjenkjenner dobbelt- eller enkeltstrenget DNA . En DBD kan gjenkjenne en spesifikk DNA -sekvens (en gjenkjenningssekvens ) eller ha en generell affinitet til DNA. Noen DNA-bindende domener kan også inkludere nukleinsyrer i sin brettede struktur.

Funksjon

Eksempel på et DNA-bindende domene i sammenheng med et protein. Det N-terminale DNA-bindende domenet (merket) til Lac repressor er regulert av et C-terminal regulatorisk domene (merket). Det regulatoriske domenet binder et allosterisk effektormolekyl (grønt). Den allosteriske responsen til proteinet kommuniseres fra reguleringsdomenet til DNA -bindingsdomenet gjennom linkerområdet.

Ett eller flere DNA-bindende domener er ofte en del av et større protein som består av ytterligere proteindomener med forskjellig funksjon. De ekstra domenene regulerer ofte aktiviteten til det DNA-bindende domenet. Funksjonen til DNA -binding er enten strukturell eller involverer transkripsjonsregulering , med de to rollene noen ganger overlappende.

DNA-bindende domener med funksjoner som involverer DNA- struktur har biologiske roller i DNA-replikasjon , reparasjon , lagring og modifisering, for eksempel metylering .

Mange proteiner involvert i reguleringen av genuttrykk inneholder DNA-bindende domener. For eksempel kalles proteiner som regulerer transkripsjon ved å binde DNA, transkripsjonsfaktorer . Den siste produksjonen av de fleste cellulære signalkaskader er genregulering.

DBD samhandler med nukleotidene i DNA på en DNA- sekvens-spesifikk eller ikke-sekvens-spesifikk måte, men selv ikke-sekvens-spesifikk gjenkjenning innebærer en slags molekylær komplementaritet mellom protein og DNA. DNA-gjenkjenning av DBD kan forekomme i det store eller mindre sporet av DNA, eller ved sukker-fosfat-DNA-ryggraden (se strukturen til DNA ). Hver spesifikk type DNA -gjenkjenning er skreddersydd for proteinets funksjon. For eksempel, DNA-skjærende enzym -DNase I kutter DNA nesten vilkårlig, og så må binde seg til DNA i en ikke-sekvensspesifikk måte. Men likevel gjenkjenner DNAse I en viss 3D- struktur , noe som gir et noe spesifikt DNA-spaltningsmønster som kan være nyttig for å studere DNA-gjenkjenning ved hjelp av en teknikk som kalles DNA-fotavtrykk .

Mange DNA-bindende domener må gjenkjenne spesifikke DNA-sekvenser, for eksempel DBDer av transkripsjonsfaktorer som aktiverer spesifikke gener, eller de av enzymer som modifiserer DNA på spesifikke steder, som restriksjonsenzymer og telomerase . Den hydrogenbindingsmønster i DNA hovedsporet er mindre degenerert enn den for den DNA minor groove, noe som gir et mer attraktivt område for sekvens -spesifikk DNA-gjenkjenning.

Spesifisiteten til DNA-bindende proteiner kan studeres ved bruk av mange biokjemiske og biofysiske teknikker, for eksempel gelelektroforese , analytisk ultrasentrifugering , kalorimetri , DNA- mutasjon , mutasjon eller modifikasjon av proteinstruktur , kjernemagnetisk resonans , røntgenkrystallografi , overflate plasmonresonans , elektron paramagnetisk resonans , tverrbinding og mikroskala termoforese (MST).

DNA-bindende protein i genomer

En stor brøkdel av gener i hvert genom koder for DNA-bindende proteiner (se tabell). Imidlertid er bare et ganske lite antall proteinfamilier DNA-bindende. For eksempel er mer enn 2000 av de ~ 20 000 humane proteiner "DNA-bindende", inkludert omtrent 750 sink-fingerproteiner.

Arter DNA-bindende proteiner DNA-bindende familier
Arabidopsis thaliana (thale karse) 4471 300
Saccharomyces cerevisiae (gjær) 720 243
Caenorhabditis elegans (orm) 2028 271
Drosophila melanogaster (fruktflue) 2620 283

Typer

Helix-turn-helix

Helix-turn-helix- motivet ble opprinnelig oppdaget i bakterier, og er vanligvis funnet i repressorproteiner og er omtrent 20 aminosyrer langt. I eukaryoter omfatter homeodomenet 2 spiraler, hvorav den ene gjenkjenner DNA (aka anerkjennelse helix). De er vanlige i proteiner som regulerer utviklingsprosesser ( PROSITE HTH ).

Sinkfinger

Krystallografisk struktur ( PDB : 1R4O ) av en dimer av sinkfingeren som inneholder DBD av glukokortikoidreseptoren (øverst) bundet til DNA (nederst). Sinkatomer er representert med grå kuler og de koordinerende cystein sidekjedene er avbildet som pinner.

Den zinkfingerdomenet hovedsakelig finnes i eukaryoter, men noen eksempler er funnet i bakterier. Sinkfinger-domenet er vanligvis mellom 23 og 28 aminosyrer langt og stabiliseres ved å koordinere sinkioner med regelmessig avstandssatte sink-koordinerende rester (enten histidiner eller cystein). Den vanligste klassen av sinkfinger (Cys2His2) koordinerer et enkelt sinkion og består av en gjenkjenningsspiral og et 2-strengs beta-ark. I transkripsjonsfaktorer finnes disse domenene ofte i matriser (vanligvis atskilt med korte linker -sekvenser) og tilstøtende fingre er i avstand med 3 basepar -intervaller når de er bundet til DNA.

Leucine glidelås

Det grunnleggende leucin -glidelåsen ( bZIP ) finnes hovedsakelig i eukaryoter og i begrenset grad hos bakterier. BZIP -domenet inneholder en alfa -helix med leucin for hver 7. aminosyre. Hvis to slike spiraler finner hverandre, kan leucinene samhandle som tennene i en glidelås, noe som tillater dimerisering av to proteiner. Ved binding til DNA bindes grunnleggende aminosyrerester til sukker-fosfat-ryggraden mens spiralene sitter i de store sporene. Det regulerer genuttrykk.

Winged helix

Bestående av omtrent 110 aminosyrer, har winged helix (WH) -domenet fire spiraler og et to-strengs beta-ark.

Winged helix-turn-helix

Det bevingede helix-turn-helix (wHTH) domenet SCOP 46785 er vanligvis 85-90 aminosyrer langt. Den er dannet av en 3-spiralbunt og et 4-strengs beta-ark (vinge).

Helix-loop-helix

Det grunnleggende helix-loop-helix (bHLH) domenet finnes i noen transkripsjonsfaktorer og er preget av to alfa-helixer (α-helixer) forbundet med en loop. En spiral er vanligvis mindre og på grunn av fleksibiliteten til løkken, tillater dimerisering ved å brette og pakke mot en annen helix. Den større helixen inneholder vanligvis de DNA-bindende områdene.

HMG-boks

HMG-box- domener finnes i proteiner med høy mobilitet som er involvert i en rekke DNA-avhengige prosesser som replikasjon og transkripsjon. De endrer også fleksibiliteten til DNA ved å indusere bøyninger. Domenet består av tre alfa -helixer atskilt med sløyfer.

Wor3 -domene

Wor3-domener, oppkalt etter White-Opaque Regulator 3 (Wor3) i Candida albicans, oppsto mer nylig i evolusjonstiden enn de fleste tidligere beskrevne DNA-bindende domener og er begrenset til et lite antall sopp.

OB-fold domene

OB-folden er et lite strukturelt motiv som opprinnelig ble oppkalt etter dets o ligonukleotid / o ligosakkarid b inderende egenskaper. OB-foldede domener varierer mellom 70 og 150 aminosyrer i lengde. OB-folder binder enkeltstrenget DNA, og er derfor enkelttrådede bindingsproteiner .

OB-fold proteiner er blitt identifisert som kritiske for DNA-replikasjon , DNA-rekombinasjon , DNA-reparasjon , transkripsjon , oversettelse , kald sjokkrespons , og telomere vedlikehold.

Uvanlig

Immunoglobulinfold

Den immunglobulindomene ( InterproIPR013783 ) består av et P-platestruktur med store kobler løkker, som tjener til å gjenkjenne enten DNA større spor eller antigener. Vanligvis finnes de i immunglobulinproteiner, og de er også tilstede i Stat -proteiner i cytokinveien. Dette er sannsynligvis fordi cytokinveien utviklet seg relativt nylig og har gjort bruk av systemer som allerede var funksjonelle, i stedet for å lage sine egne.

B3 -domene

Den B3 DBD ( InterproIPR003340 , SCOP 117,343 ) er funnet eksklusivt i transkripsjonsfaktorer fra høyere planter og restriksjonsendonukleasene EcoRII og BfiI og består vanligvis av 100-120 rester. Den inkluderer syv beta-ark og to alfa-spiraler , som danner en DNA-bindende pseudobarrel proteinfold .

TAL -effektor

TAL -effektorer finnes i bakterielle plantepatogener av slekten Xanthomonas og er involvert i regulering av genene til vertsplanten for å lette bakteriell virulens, spredning og spredning. De inneholder et sentralt område med repetisjoner av tandem 33-35 rester, og hvert gjentagelsesområde koder for en enkelt DNA-base i TALEs bindingssted. Innenfor gjentagelsen er det rest 13 alene som direkte kontakter DNA-basen og bestemmer sekvensspesifisitet, mens andre posisjoner oppretter kontakter med DNA-ryggraden, og stabiliserer den DNA-bindende interaksjonen. Hver gjentakelse i matrisen har form av sammenkoblede alfa-helixer, mens hele gjentagelsesarrayen danner en høyrehendt superhelix som vikles rundt DNA-dobbelheliksen. TAL-effektor-gjentagelsesarrays har vist seg å trekke seg sammen ved DNA-binding, og en tostatssøkemekanisme er blitt foreslått der den langstrakte TALE begynner å trekke seg sammen rundt DNA-en som begynner med en vellykket Thymin-gjenkjenning fra en unik gjentagelsesenhet N-terminal i kjernen TAL -effekt gjentatt matrise. Relaterte proteiner finnes i bakteriell plantepatogen Ralstonia solanacearum , soppendosymbiont Burkholderia rhizoxinica og to ennå uidentifiserte marine mikroorganismer. DNA-bindingskoden og strukturen til repetisjonsoppsettet bevares mellom disse gruppene, samlet referert til som TALE-liker .

RNA-guidet

Den CRISPR / Cas system av Streptococcus pyogenes kan programmeres til å styre både aktivering og undertrykkelse til naturlige og kunstige eukaryote promotere gjennom den enkle konstruksjon av førings RNA med baseparring komplementaritet til mål-DNA-områder. Cas9 kan brukes som en tilpassbar RNA-guidet DNA-bindende plattform. Domene Cas9 kan funksjonaliseres med regulatoriske domener av interesse (f.eks. Aktivering, undertrykkelse eller epigenetisk effektor) eller med endonukleasedomene som et allsidig verktøy for genomteknisk biologi. og deretter målrettet mot flere loci ved hjelp av forskjellige guide -RNA.

Se også

Referanser

Eksterne linker