Essensielt gen - Essential gene

Essensielle gener er uunnværlige gener for organismer for å vokse og reprodusere avkom under et bestemt miljø. Å være essensiell er imidlertid sterkt avhengig av omstendighetene der en organisme lever. For eksempel er et gen som kreves for å fordøye stivelse bare avgjørende hvis stivelse er den eneste energikilden. Nylig har det blitt gjort systematiske forsøk på å identifisere de genene som er absolutt nødvendige for å opprettholde livet, forutsatt at alle næringsstoffer er tilgjengelige. Slike eksperimenter har ført til den konklusjon at det absolutt nødvendige antallet gener for bakterier er i størrelsesorden 250–300. Essensielle gener for encellede organismer koder for proteiner for tre grunnleggende funksjoner, inkludert behandling av genetisk informasjon, cellekonvolutter og energiproduksjon. Disse genfunksjonene brukes til å opprettholde en sentral metabolisme , replikere DNA , oversette gener til proteiner , opprettholde en grunnleggende cellulær struktur og formidle transportprosesser inn og ut av cellen. Sammenlignet med encellede organismer har flercellede organismer mer essensielle gener knyttet til kommunikasjon og utvikling. De fleste av de essensielle genene i virus er relatert til behandling og vedlikehold av genetisk informasjon. I motsetning til de fleste encellede organismer, mangler virus mange viktige gener for metabolisme, noe som tvinger dem til å kapre vertens metabolisme. De fleste gener er ikke viktige, men formidler selektive fordeler og økt kondisjon . Derfor er de aller fleste gener ikke viktige, og mange kan slettes uten konsekvenser, i hvert fall under de fleste omstendigheter.

Bakterier: genomomfattende studier

To hovedstrategier har blitt benyttet for å identifisere essensielle gener på genomet: generell sletting av gener og tilfeldig mutagenese ved bruk av transposoner . I det første tilfellet blir kommenterte individuelle gener (eller ORFer ) fullstendig slettet fra genomet på en systematisk måte. Ved transposon-mediert mutagenese blir transposoner tilfeldig satt inn i så mange stillinger i et genom som mulig, med sikte på å forstyrre funksjonen til de målrettede genene (se figuren nedenfor). Innsettingsmutanter som fortsatt er i stand til å overleve eller vokse, tyder på at transposonet er satt inn i et gen som ikke er avgjørende for overlevelse. Plasseringen av transposoninnsettingene kan bestemmes gjennom hybridisering til mikroarrays eller gjennom transposonsekvensering . Et sammendrag av slike skjermer er vist i tabellen.

Organisme Mutagenese Metode Avlesning ORFer Ikke-ess. Viktig % Ess. Merknader Ref.
Mycoplasma genitalium/pneumoniae Tilfeldig Befolkning Sekvensering 482 130 265–350 55–73% ---
Mycoplasma genitalium Tilfeldig Kloner Sekvensering 482 100 382 79% b, c
Staphylococcus aureus WCUH29 Tilfeldig Kloner Sekvensering 2600 n/a 168 n/a b, c
Staphylococcus aureus RN4220 Tilfeldig Kloner Sekvensering 2.892 n/a 658 23% ---
Haemophilus influenzae Rd Tilfeldig Befolkning Footprint-PCR 1657 602 670 40% ---
Streptococcus pneumoniae Rx-1 Målrettet Kloner Kolonidannelse 2.043 234 113 n/a c
Streptococcus pneumoniae D39 Målrettet Kloner Kolonidannelse 2.043 560 133 n/a c
Streptococcus pyogenes 5448 Tilfeldig Transposon Tn-seq 1.865 ? 227 12% ---
Streptococcus pyogenes NZ131 Tilfeldig Transposon Tn-seq 1700 ? 241 14% ---
Streptococcus sanguinis SK36 Målrettet Kloner Kolonidannelse 2.270 2.052 218 10% a, j
Mycobacterium tuberculosis H37Rv Tilfeldig Befolkning Microarray 3.989 2567 614 15% ---
Mycobacterium tuberculosis Tilfeldig Transposon ? 3.989 ? 401 10% ---
Mycobacterium tuberculosis H37Rv Tilfeldig Transposon NG-sekvensering 3.989 ? 774 19% ---
Mycobacterium tuberculosis H37Rv Tilfeldig Transposon NG-sekvensering 3.989 3.364 625 16% h, jeg
Mycobacterium tuberculosis --- Beregning Beregning 3.989 ? 283 7% ---
Bacillus subtilis 168 Målrettet Kloner Kolonidannelse 4 105 3.830 261 7% a, d, g
Escherichia coli K-12 MG1655 Tilfeldig Befolkning Footprint-PCR 4.308 3.126 620 14% ---
Escherichia coli K-12 MG1655 Målrettet Kloner Kolonidannelse 4.308 2.001 n/a n/a a, e
Escherichia coli K-12 BW25113 Målrettet Kloner Kolonidannelse 4.390 3.985 303 7% en
Pseudomonas aeruginosa PAO1 Tilfeldig Kloner Sekvensering 5.570 4.783 678 12% en
Porphyromonas gingivalis Tilfeldig Transposon Sekvensering 1 990 1.527 463 23% ---
Pseudomonas aeruginosa PA14 Tilfeldig Kloner Sekvensering 5 688 4.469 335 6% a, f
Salmonella typhimurium Tilfeldig Kloner Sekvensering 4.425 n/a 257 ~ 11% b, c
Helicobacter pylori G27 Tilfeldig Befolkning Microarray 1576 1.178 344 22% ---
Corynebacterium glutamicum Tilfeldig Befolkning ? 3002 2.352 650 22% ---
Francisella novicida Tilfeldig Transposon ? 1719 1.327 392 23% ---
Mycoplasma pulmonis UAB CTIP Tilfeldig Transposon ? 782 472 310 40% ---
Vibrio cholerae N16961 Tilfeldig Transposon ? 3.890 ? 779 20% ---
Salmonella Typhi Tilfeldig Transposon ? 4.646 ? 353 8% ---
Staphylococcus aureus Tilfeldig Transposon ? ~ 2600 ? 351 14% ---
Caulobacter crescentus Tilfeldig Transposon Tn-Seq 3 876 3240 480 12,2% ---
Neisseria meningitidis Tilfeldig Transposon ? 2.158 ? 585 27% ---
Desulfovibrio alaskensis Tilfeldig Transposon Sekvensering 3.258 2.871 387 12% ---

Tabell 1. Viktige gener i bakterier . Mutagenese : målrettede mutanter er gen -slettinger; tilfeldige mutanter er transposoninnsetninger . Metoder : Kloner indikerer sletting av enkeltgener, populasjon indikerer mutasjon av hele populasjonen, f.eks. Ved bruk av transposoner. Viktige gener fra populasjonsskjermer inkluderer gener som er viktige for kondisjon (se tekst). ORF : antall alle åpne leserammer i det genomet. Merknader : (a) mutant samling tilgjengelig; (b) metode for direkte nødvendighetsscreening (f.eks. via antisense -RNA) som ikke gir informasjon om ikke -essensielle gener. (c) Bare delvis datasett tilgjengelig. (d) Inkluderer forutsagt genetisk essensialitet og datasamling fra publiserte single-gen-essensialitetsstudier. (e) Prosjekt pågår. (f) Utledet ved sammenligning av de to genetiske essensielle datasettene som er oppnådd uavhengig i P. aeruginosa -stammene PA14 og PAO1. (g) Det opprinnelige resultatet av 271 essensielle gener er blitt korrigert til 261, med 31 gener som ble antatt å være essensielle faktisk ikke-essensielle, mens 20 nye essensielle gener har blitt beskrevet siden den gang. (h) Teller gener med essensielle domener og de som fører til vekstdefekter når de blir avbrutt som essensielle, og de som fører til vekstfordel når de blir avbrutt som ikke-essensielle. (i) Involverte et fullt mettet mutantbibliotek med 14 replikater, med 84,3% av mulige innsettingssteder med minst én transposoninnsetting. (j) Hvert essensielt gen har blitt uavhengig bekreftet minst fem ganger.

Essensielle gener i Mycobacterium tuberculosis H37Rv som funnet ved bruk av transposoner som settes inn i tilfeldige posisjoner i genomet. Hvis det ikke finnes transposoner i et gen, er genet mest sannsynlig avgjørende ettersom det ikke tåler noen innsetting. I dette eksemplet er essensielle hem -biosyntetiske gener hemA, hemB, hemC, hemD blottet for innsetting. Antall sekvenser som leser ('' leser/TA '') vises for det angitte området av H37Rv -kromosomet. Potensielle steder for TA -dinukleotidinnsetting er angitt. Bilde fra Griffin et al. 2011.

På grunnlag av genomomfattende eksperimentelle studier og systembiologianalyse har en essensiell gendatabase blitt utviklet av Kong et al. (2019) for å forutsi> 4000 bakteriearter.

Eukaryoter

I Saccharomyces cerevisiae (spirende gjær) er 15-20% av alle gener essensielle. I Schizosaccharomyces pombe (fisjongjær) er 4.836 heterozygote deletjoner som dekker 98,4% av de 4 914 proteinkodende åpne leserammene konstruert. 1260 av disse slettingene viste seg å være avgjørende.

Lignende skjermer er vanskeligere å utføre i andre flercellede organismer, inkludert pattedyr (som modell for mennesker), på grunn av tekniske årsaker, og resultatene er mindre klare. Imidlertid har det blitt utviklet forskjellige metoder for nematodeormen C. elegans , fruktfluen og sebrafisken (se tabell). En nylig studie av 900 musegener konkluderte med at 42% av dem var essensielle selv om de utvalgte genene ikke var representative.

Gen -knockout -eksperimenter er ikke mulige eller i det minste ikke etiske hos mennesker. Imidlertid har naturlige mutasjoner ført til identifisering av mutasjoner som fører til tidlig embryonal eller senere død. Vær oppmerksom på at mange gener hos mennesker ikke er helt avgjørende for overlevelse, men kan forårsake alvorlig sykdom når de muteres. Slike mutasjoner er katalogisert i databasen Online Mendelian Inheritance in Man (OMIM). I en beregningsanalyse av genetisk variasjon og mutasjoner i 2472 menneskelige ortologer av kjente essensielle gener i musen, sa Georgi et al. funnet sterkt, rensende utvalg og relativt reduserte nivåer av sekvensvariasjon, noe som indikerer at disse menneskelige genene også er viktige.

Selv om det kan være vanskelig å bevise at et gen er essensielt hos mennesker, kan det påvises at et gen ikke er essensielt eller ikke engang forårsaker sykdom. For eksempel fant sekvensering av genomene til 2.636 islandske borgere og genotyping av 101.584 tilleggspersoner 8.041 individer som hadde 1 gen helt slått ut (dvs. at disse menneskene var homozygote for et ikke-funksjonelt gen). Av de 8 041 individer med fullstendig knock-out ble 6.885 estimert til å være homozygoter , 1 249 ble estimert til å være sammensatte heterozygoter (dvs. de hadde begge alleler av et gen slått ut, men de to allelene hadde forskjellige mutasjoner). I disse individene ble totalt 1.171 av de 19.135 menneskelige ( RefSeq ) -genene (6.1%) fullstendig slått ut. Det ble konkludert med at disse 1 171 genene er ikke-essensielle hos mennesker-i det minste ble det ikke rapportert om noen tilknyttede sykdommer. På samme måte avslørte eksomsekvensene til 3222 britiske pakistanske voksne med høy foreldrenes slektskap 1111 sjeldne varianter homozygote genotyper med forutsagt tap av genfunksjon (LOF = knockouts) i 781 gener. Denne studien fant gjennomsnittlig 140 forutsagte LOF -genotyper (per emne), inkludert 16 sjeldne (mindre allelfrekvens <1%) heterozygoter, 0,34 sjeldne homozygoter, 83,2 vanlige heterozygoter og 40,6 vanlige homozygoter. Nesten alle sjeldne homozygote LOF -genotyper ble funnet innenfor autozygote segmenter (94,9%). Selv om de fleste av disse personene ikke hadde noen åpenbare helseproblemer som følge av deres defekte gener, er det mulig at mindre helseproblemer kan bli funnet ved mer detaljert undersøkelse.

Et sammendrag av essensielle skjermer er vist i tabellen nedenfor (hovedsakelig basert på databasen over essensielle gener.

Organisme Metode Viktige gener Ref.
Arabidopsis thaliana T-DNA innsetting 777
Caenorhabditis elegans (orm) RNA -interferens 294
Danio rerio (sebrafisk) Innsetting mutagenese 288
Drosophila melanogaster (fruktflue) P-element innsetting mutagenese 339
Homo sapiens (menneske) Litteratursøk 118
Homo sapiens (menneske) CRISPR/Cas9-basert skjerm 1.878
Homo sapiens (menneske) Haploid gen-trap skjerm ~ 2000
Homo sapiens (menneske) musens ortologer 2.472
Mus musculus (mus) Litteratursøk 2114
Saccharomyces cerevisiae (gjær) Sletting av enkeltgener 878
Saccharomyces cerevisiae (gjær) Sletting av enkeltgener 1 105
Schizosaccharomyces pombe (gjær) Sletting av enkeltgener 1260

Virus

Virus mangler mange gener som er nødvendige for metabolisme, og tvinger dem til å kapre vertens metabolisme. Skjermer for essensielle gener har blitt utført i noen få virus. For eksempel ble humant cytomegalovirus (CMV) funnet å ha 41 essensielle, 88 ikke -essensielle og 27 forsterkende ORF (150 totalt ORF). De fleste essensielle og forsterkende gener er lokalisert i den sentrale regionen, og ikke -essensielle gener samles vanligvis nær endene av virusgenomet.

Tscharke og Dobson (2015) utarbeidet en omfattende undersøkelse av essensielle gener i Vaccinia Virus og tildelte roller til hver av de 223 ORFene i Western Reserve (WR) -stammen og 207 ORF -er fra Copenhagen -stammen, og vurderte deres rolle i replikasjon i cellekultur. I henhold til deres definisjon anses et gen som essensielt (dvs. har en rolle i cellekultur) hvis sletting resulterer i en nedgang i virustiter på mer enn 10 ganger i enten en enkelt- eller flertrinns vekstkurve. Alle gener som er involvert i innpakket virionproduksjon, dannelse av aktinhale og ekstracellulær virionfrigjøring ble også ansett som essensielle. Gener som påvirker plakkstørrelse, men ikke replikasjon, ble definert som ikke-essensielle. Ved denne definisjonen er det nødvendig med 93 gener for Vaccinia Virus-replikasjon i cellekultur, mens 108 og 94 ORF fra henholdsvis WR og København er ikke-essensielle. Vaccinia -virus med sletting i hver ende av genomet oppførte seg som forventet, og viste bare milde eller vertsfeil. I kontrast forårsaket kombinering av slettinger i begge ender av genomet for VACV -stamme WR en ødeleggende vekstdefekt på alle cellelinjer som ble testet. Dette viser at sletting av enkeltgener ikke er tilstrekkelig til å vurdere geners essensialitet og at flere gener er viktige i Vaccinia -virus enn opprinnelig antatt.

En av bakteriofager som er screenet for essensielle gener inkluderer mycobacteriophage Giles. Minst 35 av de 78 spådde Giles-genene (45%) er ikke-essensielle for lytisk vekst. 20 gener ble funnet å være essensielle. Et stort problem med faggener er at et flertall av genene forblir funksjonelt ukjente, derfor er deres rolle vanskelig å vurdere. En skjerm med Salmonella enterica phage SPN3US avslørte 13 essensielle gener, selv om det fortsatt er litt uklart hvor mange gener som virkelig ble testet.

Kvantitativ gen -essensialitetsanalyse

I teorien er essensielle gener kvalitative. Avhengig av omgivelsene kan imidlertid visse essensielle genmutanter vise delvise funksjoner, som kan bestemmes kvantitativt i noen studier. For eksempel kan en bestemt gen-sletting redusere vekstraten (eller fruktbarheten eller andre tegn) til 90% av villtypen. Hvis det er isozymer eller alternative veier for de essensielle genene, kan de slettes fullstendig.

Syntetisk dødelighet

To gener er syntetiske dødelige hvis ingen av dem er essensielle, men når begge er mutert, er dobbeltmutanten dødelig. Noen studier har estimert at antallet syntetiske dødelige gener kan være i størrelsesorden 45% av alle gener.

Betinget essensielle gener

En skjematisk oversikt over essensielle gener (eller proteiner) i lysinbiosyntese av forskjellige bakterier . Det samme proteinet kan være avgjørende for en art, men ikke en annen.

Mange gener er bare viktige under visse omstendigheter. For eksempel, hvis aminosyren lysin tilføres en celle, er ethvert gen som er nødvendig for å lage lysin, ikke-essensielt. Men når det ikke leveres lysin, blir gener som koder for enzymer for lysinbiosyntese essensielle, ettersom ingen proteinsyntese er mulig uten lysin.

Streptococcus pneumoniae ser ut til å kreve 147 gener for vekst og overlevelse i spytt , mer enn 113-133 som er funnet i tidligere studier.

Sletting av et gen kan føre til død eller blokk av celledeling . Selv om sistnevnte tilfelle kan implisere "overlevelse" en stund, kan cellen fortsatt dø til slutt uten celledeling. På samme måte kan en celle i stedet for blokkert celledeling ha redusert vekst eller metabolisme som spenner fra nesten ikke -detekterbar til nesten normal. Dermed er det gradient fra "essensielt" til helt ikke-essensielt, igjen avhengig av tilstanden. Noen forfattere har dermed skilt mellom gener " essensielle for overlevelse " og " essensielle for kondisjon ".

Rollen som genetisk bakgrunn . I likhet med miljøforhold kan den genetiske bakgrunnen bestemme essensen av et gen: et gen kan være essensielt for ett individ, men ikke et annet, gitt hans eller hennes genetiske bakgrunn. Genduplikasjoner er en mulig forklaring (se nedenfor).

Metabolsk avhengighet . Gener involvert i visse biosyntetiske veier, for eksempel aminosyresyntese , kan bli ikke-essensielle hvis en eller flere aminosyrer tilføres av kulturmedium eller av en annen organisme. Dette er hovedårsaken til at mange parasitter (f.eks. Cryptosporidium hominis ) eller endosymbiontiske bakterier mistet mange gener (f.eks. Chlamydia ). Slike gener kan være essensielle, men bare tilstede i vertsorganismen. For eksempel, Chlamydia trachomatis ikke kan syntetisere purin og pyrimidin- nukleotider de novo , slik at disse bakteriene er avhengig av nukleotid-biosyntetiske gener av verten.

En annen form for metabolsk avhengighet, som ikke er relatert til interaksjoner mellom arter, kan bli funnet når bakterier dyrkes under spesifikke næringsforhold . For eksempel blir mer enn 100 gener avgjørende når Escherichia coli dyrkes på næringsbegrensede medier. Nærmere bestemt isocitrat dehydrogenase (ICD) og citratsyntaseaktivitet (gltA) er to enzymer som er en del av trikarboksylsyre (TCA) syklus . Begge genene er essensielle i M9 minimale medier (som bare gir de mest grunnleggende næringsstoffene). Men når media supplerer med 2-oksoglutarat eller glutamat , er disse genene ikke lenger viktige.

Gendupliseringer og alternative metabolske veier

Mange gener er duplisert i et genom, og mange organismer har forskjellige metabolske veier (alternativ metabolsk vei) for å syntetisere de samme produktene. Slike duplikasjoner ( paraloger ) og alternative metabolske veier gjør ofte essensielle gener ikke-essensielle fordi duplikatet kan erstatte den originale kopien. For eksempel er genet som koder for enzymet aspartokinase essensielt i E. coli . Derimot inneholder Bacillus subtilis -genomet tre kopier av dette genet, hvorav ingen er avgjørende alene. Imidlertid er en trippel sletting av alle tre genene dødelig. I slike tilfeller kan essensen av et gen eller en gruppe paraloger ofte forutsies basert på essensialiteten til et essensielt enkeltgen i en annen art. I gjær er få av de essensielle genene duplisert i genomet: 8,5% av de ikke-essensielle genene, men bare 1% av de essensielle genene har en homolog i gjærgenomet.

I ormen C. elegans er ikke-essensielle gener sterkt overrepresentert blant dubletter, muligens fordi duplisering av essensielle gener forårsaker overuttrykk av disse genene. Woods et al. fant ut at ikke-essensielle gener oftere blir vellykket duplisert (fikset) og tapt sammenlignet med essensielle gener. Derimot dupliseres essensielle gener sjeldnere, men ved vellykket duplisering opprettholdes de over lengre perioder.

Bevaring

Bevaring av essensielle gener i bakterier , tilpasset fra

Hos bakterier ser det ut til at essensielle gener er mer bevart enn ikke -essensielle gener, men korrelasjonen er ikke veldig sterk. For eksempel har bare 34% av de viktige B. subtilis- genene pålitelige ortologer i alle firmaer og 61% av de essensielle E. coli- generene har pålitelige ortologer i alle Gamma-proteobakterier . Fang et al. (2005) definerte vedvarende gener som genene som finnes i mer enn 85% av genomene til kladen. De fant 475 og 611 av slike gener for henholdsvis B. subtilis og E. coli . Videre klassifiserte de gener i fem klasser i henhold til utholdenhet og essensialitet: vedvarende gener, essensielle gener, vedvarende ikke -essensielle (PNE) gener (276 i B. subtilis , 409 i E. coli ), essensielle ikke -vedvarende (ENP) gener (73 i B . subtilis , 33 i E. coli ) og ikke -vedvarende ikke -essensielle (NPNE) gener (3.558 i B. subtilis , 3.525 i E. coli ). Fang et al. fant 257 vedvarende gener, som eksisterer både i B. subtilis (for Firmicutes) og E. coli (for Gamma-proteobakterier). Blant disse ble 144 (henholdsvis 139) tidligere identifisert som essensielle i B. subtilis (henholdsvis E. coli ) og 25 (henholdsvis 18) av de 257 genene er ikke tilstede i 475 B. subtilis (henholdsvis 611 E. coli) vedvarende gener. Alle de andre medlemmene i bassenget er PNE -gener.

I eukaryoter har 83% av en-til-en-ortologene mellom Schizosaccharomyces pombe og Saccharomyces cerevisiae bevart essensialitet, det vil si at de er uvesentlige i begge artene eller essensielle i begge artene. De resterende 17% av genene er uvesentlige i den ene arten og essensielle i den andre. Dette er ganske bemerkelsesverdig, gitt at S. pombe er atskilt fra S. cerevisiae med omtrent 400 millioner års utvikling.

Generelt er sterkt konserverte og dermed eldre gener (dvs. gener med tidligere fylogenetisk opprinnelse) mer sannsynlig å være essensielle enn yngre gener - selv om de har blitt duplisert.

Studere

Den eksperimentelle studien av essensielle gener er begrenset av det faktum at inaktivering av et essensielt gen per definisjon er dødelig for organismen. Derfor kan de ikke bare slettes eller muteres for å analysere de resulterende fenotypene (en vanlig teknikk innen genetikk ).

Det er imidlertid noen omstendigheter der essensielle gener kan manipuleres. I diploide organismer kan det bare være nødvendig med en enkelt funksjonell kopi av noen essensielle gener ( haplosuffisiens ), og heterozygoten viser en lærerik fenotype. Noen essensielle gener kan tolerere mutasjoner som er skadelige, men ikke helt dødelige, siden de ikke fullstendig avskaffer genets funksjon.

Beregningsanalyse kan avsløre mange egenskaper til proteiner uten å analysere dem eksperimentelt, f.eks. Ved å se på homologe proteiner , funksjon, struktur etc. (se også nedenfor, Forutsi essensielle gener ). Produktene av essensielle gener kan også studeres når de uttrykkes i andre organismer , eller når de renses og studeres in vitro .

Betinget essensielle gener er lettere å studere. Temperaturfølsomme varianter av essensielle gener er identifisert som koder for produkter som mister funksjonen ved høye temperaturer, og som derfor bare viser en fenotype ved økt temperatur.

Reproduserbarhet

Hvis skjermer for essensielle gener gjentas i uavhengige laboratorier, resulterer de ofte i forskjellige genlister. For eksempel har skjermer i E. coli gitt fra ~ 300 til ~ 600 essensielle gener (se tabell 1 ). Slike forskjeller er enda mer uttalt når forskjellige bakteriestammer brukes (se figur 2 ). En vanlig forklaring er at de eksperimentelle forholdene er forskjellige eller at mutasjonens art kan være annerledes (f.eks. En fullstendig genet -sletting vs. en transposonmutant). Spesielt Transposon -skjermer er vanskelige å reprodusere, gitt at en transposon kan sette inn på mange posisjoner i et gen. Innsettelser mot 3' -enden av et essensielt gen har kanskje ikke en dødelig fenotype (eller ingen fenotype i det hele tatt) og kan derfor ikke gjenkjennes som sådan. Dette kan føre til feilaktige merknader (her: falske negativer).

Sammenligning av CRISPR /cas9 og RNAi -skjermer . Skjermbilder for å identifisere essensielle gener i den humane kroniske myelogene leukemi -cellelinjen K562 med disse to metodene viste bare begrenset overlapping. Med en 10% falsk positiv hastighet var det ~ 4500 gener identifisert i Cas9 -skjermen mot ~ 3100 i shRNA -skjermen, med bare ~ 1200 gener identifisert i begge.

Ulike essensielle gener i forskjellige organismer

Ulike organismer kan ha forskjellige essensielle gener. For eksempel har Bacillus subtilis 271 essensielle gener. Omtrent halvparten (150) av de ortologe genene i E. coli er også viktige. Ytterligere 67 gener som er essensielle i E. coli er ikke essensielle i B. subtilis , mens 86 E. coli essensielle gener ikke har B. subtilis ortholog. I Mycoplasma genitalium er minst 18 gener viktige som ikke er essensielle i M. bovis. Mange av disse forskjellige essensielle genene er forårsaket av paraloger eller alternative metabolske veier.

Slike forskjellige essensielle gener i bakterier kan brukes til å utvikle målrettede antibakterielle behandlinger mot visse spesifikke patogener for å redusere antibiotikaresistens i mikrobiometiden. Stone et al (2015) har brukt forskjellen i essensielle gener i bakterier til å utvikle selektive legemidler mot det orale patogenet Porphyromonas gingivalis , i stedet for de gunstige bakteriene Streptococcus sanguis .

Prediksjon

Essensielle gener kan forutses beregningsmessig. Imidlertid bruker de fleste metodene til en viss grad eksperimentelle data ("treningssett"). Chen et al. bestemte fire kriterier for å velge treningssett for slike spådommer: (1) essensielle gener i det valgte treningssettet skal være pålitelige; (2) vekstbetingelsene der essensielle gener defineres, bør være konsistente i trenings- og prediksjonssett; (3) arter som brukes som treningssett bør være nært knyttet til målorganismen; og (4) organismer som brukes som trenings- og forutsigelsessett, bør ha lignende fenotyper eller livsstiler. De fant også at størrelsen på treningssettet skulle være minst 10% av de totale genene for å gi nøyaktige spådommer. Noen tilnærminger for å forutsi viktige gener er:

Komparativ genomikk . Kort tid etter at de første genomene (av Haemophilus influenzae og Mycoplasma genitalium ) ble tilgjengelige, ble Mushegian et al. prøvde å forutsi antall essensielle gener basert på vanlige gener i disse to artene. Det ble antatt at bare essensielle gener skulle bevares over den lange evolusjonære avstanden som skilte de to bakteriene. Denne studien identifiserte omtrent 250 kandidatens essensielle gener. Etter hvert som flere genomer ble tilgjengelige, fortsatte antallet forutsagte essensielle gener å krympe fordi flere genomer delte færre og færre gener. Som en konsekvens ble det konkludert med at den universelt bevarte kjernen består av mindre enn 40 gener. Dette settet med bevarte gener er imidlertid ikke identisk med settet med essensielle gener ettersom forskjellige arter er avhengige av forskjellige essensielle gener.

En lignende tilnærming har blitt brukt for å utlede essensielle gener fra pan-genomet til Brucella- arter. 42 komplette Brucella- genomer og totalt 132 143 proteinkodende gener ble brukt til å forutsi 1252 potensielle essensielle gener, avledet fra kjernegenomet ved sammenligning med en prokaryote database med essensielle gener.

Nettverksanalyse . Etter at de første proteininteraksjonsnettverkene av gjær hadde blitt publisert, ble det mer sannsynlig at sterkt forbundne proteiner (f.eks. Ved protein-proteininteraksjoner ) er essensielle. Imidlertid kan sterkt tilkoblede proteiner være eksperimentelle artefakter og høy tilkobling kan heller representere pleiotropi i stedet for essensialitet. Likevel har nettverksmetoder blitt forbedret ved å legge til andre kriterier og har derfor en viss verdi i å forutsi viktige gener.

Maskinlæring . Hua et al. brukte Machine Learning til å forutsi viktige gener hos 25 bakteriearter .

Hurst indeks . Liu et al. (2015) brukte Hurst-eksponenten , en karakteristisk parameter for å beskrive langdistanskorrelasjon i DNA for å forutsi viktige gener. I 31 av 33 bakterielle genomer var signifikansnivåene til Hurst-eksponentene til de essensielle genene signifikant høyere enn for det tilsvarende full-gen-settet, mens signifikansnivåene til Hurst-eksponentene til de ikke-essensielle genene forble uendret eller økte bare litt.

Minimale genomer . Det ble også antatt at essensielle gener kan utledes av minimale genomer som angivelig bare inneholder essensielle gener. Problemet her er at de minste genomene tilhører parasittiske (eller symbiontiske) arter som kan overleve med et redusert gensett når de får mange næringsstoffer fra vertene. For eksempel er en av de minste genomene den til Hodgkinia cicadicola , en symbiont av cikader, som bare inneholder 144 Kb DNA som bare koder for 188 gener. Som andre symbionter mottar Hodgkinia mange av næringsstoffene fra verten, så genene trenger ikke å være essensielle.

Metabolsk modellering . Essensielle gener kan også forutsies i fullstendig sekvenserte genomer ved metabolsk rekonstruksjon , det vil si ved å rekonstruere hele metabolismen fra geninnholdet og deretter identifisere de genene og veiene som har vist seg å være essensielle i andre arter. Imidlertid kan denne metoden kompromitteres av proteiner med ukjent funksjon. I tillegg har mange organismer backup eller alternative veier som må tas i betraktning (se figur 1). Metabolsk modellering ble også brukt av Basler (2015) for å utvikle en metode for å forutsi viktige metabolske gener. Fluxbalanse -analyse , en metode for metabolsk modellering, har nylig blitt brukt til å forutsi essensielle gener i metabolisme av nyrecellekarsinom i klare celler.

Gener med ukjent funksjon . Overraskende nok har et betydelig antall essensielle gener ingen kjent funksjon. For eksempel, blant de 385 viktige kandidatene i M. genitalium , kunne ingen funksjon tilskrives 95 gener, selv om dette tallet var redusert til 75 innen 2011. De fleste ukjente funksjonelt viktige gener har potensielle biologiske funksjoner relatert til en av de tre grunnleggende funksjoner.

ZUPLS . Song et al. presenterte en ny metode for å forutsi viktige gener som bare bruker Z-kurven og andre sekvensbaserte funksjoner. Slike trekk kan lett beregnes ut fra DNA/aminosyresekvensene. Imidlertid er påliteligheten til denne metoden fortsatt litt uklar.

Viktige servere for prediksjon av gen . Guo et al. (2015) har utviklet tre elektroniske tjenester for å forutsi viktige gener i bakterielle genomer. Disse fritt tilgjengelige verktøyene gjelder for enkelt -gensekvenser uten merkede funksjoner, enkeltgener med bestemte navn og komplette genomer av bakteriestammer. Kong et al. (2019) har utviklet ePath -databasen, som kan brukes til å søke> 4000 bakteriearter for å forutsi viktige gener.

Viktige proteindomener

Selv om de fleste essensielle gener koder for proteiner, består mange essensielle proteiner av et enkelt domene. Dette faktum har blitt brukt til å identifisere viktige proteindomener. Goodacre et al. har identifisert hundrevis av viktige domener med ukjent funksjon (eDUF). Lu et al. presenterte en lignende tilnærming og identifiserte 3.450 domener som er essensielle i minst én mikrobiell art.

Se også

Referanser

Videre lesning

Eksterne linker