Genontologi - Gene Ontology

Genontologien
Database.png
Innhold
Beskrivelse Ressurs med kontrollert vokabular for å beskrive funksjonen til gener og genprodukter
Adgang
Nettsted genontologi .org

The Gene Ontologi ( GO ) er en stor bioinformatikk initiativ til å forene representasjon av genet og genet produktattributter på tvers av alle arter . Nærmere bestemt har prosjektet som mål å: 1) opprettholde og utvikle sitt kontrollerte ordforråd med gen- og genproduktattributter; 2) kommentere gener og genprodukter, og assimilere og spre annotasjonsdata; og 3) gi verktøy for enkel tilgang til alle aspekter av dataene som tilbys av prosjektet, og for å muliggjøre funksjonell tolkning av eksperimentelle data ved hjelp av GO, for eksempel via berikelsesanalyse. GO er en del av et større klassifiseringsarbeid, Open Biomedical Ontologies , som er et av de første kandidatmedlemmene i OBO Foundry .

Mens gennomenklatur fokuserer på gen- og genprodukter, fokuserer Gene Ontology på funksjonen til genene og genproduktene. GO utvider også innsatsen ved å bruke markeringsspråk for å gjøre dataene (ikke bare om genene og deres produkter, men også av kuraterte attributter) maskinlesbare , og for å gjøre det på en måte som er enhetlig på tvers av alle arter (mens gennomenklaturkonvensjoner varierer etter biologisk taxon ).

Vilkår og ontologi

Fra et praktisk syn er en ontologi en representasjon av noe vi vet om. "Ontologier" består av representasjoner av ting som er påviselige eller direkte observerbare, og forholdet mellom disse tingene. Det er ingen universell standardterminologi innen biologi og beslektede domener, og termbruk kan være spesifikk for en art, forskningsområde eller til og med en bestemt forskningsgruppe. Dette gjør kommunikasjon og deling av data vanskeligere. Gene Ontology -prosjektet gir en ontologi med definerte termer som representerer genproduktets egenskaper. Ontologien dekker tre domener:

Hver GO -term i ontologien har et termnavn, som kan være et ord eller en rekke ord; en unik alfanumerisk identifikator; en definisjon med siterte kilder; og en ontologi som angir domenet den tilhører. Begreper kan også ha synonymer, som er klassifisert som nøyaktig ekvivalente med begrepet navn, bredere, smalere eller beslektede; referanser til tilsvarende begreper i andre databaser; og kommentarer til begrepsbetydning eller bruk. GO -ontologien er strukturert som en rettet asyklisk graf , og hvert begrep har definerte relasjoner til ett eller flere andre termer i samme domene, og noen ganger til andre domener. GO-vokabularet er designet for å være artsnøytralt, og inkluderer vilkår som gjelder for prokaryoter og eukaryoter , enkelt- og flercellede organismer .

GO er ikke statisk, og tillegg, korreksjoner og endringer foreslås av og etterspørres av medlemmer av forsknings- og annotasjonssamfunnene, så vel som av de som er direkte involvert i GO -prosjektet. For eksempel kan en annotator be om et bestemt begrep for å representere en metabolsk vei, eller en del av ontologien kan bli revidert ved hjelp av samfunnseksperter (f.eks.). Foreslåtte endringer blir gjennomgått av ontologiredaktørene, og implementert der det er aktuelt.

GO -ontologien og annotasjonsfilene er fritt tilgjengelige fra GO -nettstedet i en rekke formater, eller kan nås online via GO -nettleseren AmiGO . Gene Ontology -prosjektet gir også nedlastbare tilordninger av vilkårene til andre klassifiseringssystemer.

Eksempelbegrep

id: GO: 0000016
navn: laktaseaktivitet
ontologi: molekylær funksjon
def: "Katalyse av reaksjonen: laktose + H2O = D-glukose + D-galaktose." [EF: 3.2.1.108]
synonym: "lactase-phlorizin hydrolase activity" BROAD [EC: 3.2.1.108]
synonym: "laktosegalaktohydrolaseaktivitet" NØYAKTIG [EC: 3.2.1.108]
xref: EC: 3.2.1.108
xref: MetaCyc: LACTASE-RXN
xref: Reactome: 20536
is_a: GO: 0004553! hydrolaseaktivitet, hydrolysering av O-glykosylforbindelser

Datakilde:

Kommentar

Genomkommentar omfatter praksis for å fange data om et genprodukt, og GO -merknader bruker termer fra GO for å gjøre det. Kommentarer fra GO -kuratorer er integrert og spredt på GO -nettstedet, hvor de kan lastes ned direkte eller vises på nettet ved hjelp av AmiGO. I tillegg til genproduktidentifikatoren og den relevante GO -termen, har GO -merknader minst følgende data: Referansen som ble brukt for å lage merknaden (f.eks. En tidsskriftartikkel); En beviskode som angir typen bevis som merknaden er basert på; Datoen og skaperen av merknaden

Støttende informasjon, avhengig av GO -begrep og bevis som brukes og tilleggsinformasjon, for eksempel betingelsene funksjonen observeres under, kan også inkluderes i en GO -kommentar.

Beviskoden kommer fra et kontrollert ordforråd med koder, Evidence Code Ontology, som dekker både manuelle og automatiserte merkingsmetoder. For eksempel betyr Sporbar Forfattererklæring (TAS) at en kurator har lest en publisert vitenskapelig artikkel, og metadataene for denne merknaden har en sitat fra denne artikkelen; Avledet fra sekvenslikhet (ISS) betyr at en menneskelig kurator har gjennomgått resultatet fra et sekvenslikhetssøk og bekreftet at det er biologisk meningsfylt. Kommentarer fra automatiserte prosesser (for eksempel omlegging av kommentarer som er opprettet ved hjelp av et annet annotasjonsordforråd) får koden Avledet fra Electronic Annotation (IEA). I 2010 ble over 98% av alle GO -merknader utledet beregningsmessig, ikke av kuratorer, men fra 2. juli 2019 ble bare omtrent 30% av alle GO -merknader utledet beregningsmessig. Siden disse merknadene ikke blir sjekket av et menneske, anser GO -konsortiet at de er marginalt mindre pålitelige, og de er vanligvis til et høyere nivå, mindre detaljerte vilkår. Hele annotasjonsdatasett kan lastes ned fra GO -nettstedet. For å støtte utviklingen av merknader, tilbyr GO Consortium workshops og veileder nye grupper av kuratorer og utviklere.

Mange algoritmer for maskinlæring har blitt designet og implementert for å forutsi Gene Ontology -merknader.

Eksempel på merknad

Genprodukt: Actin, alfa cardiac muscle 1, UniProtKB: P68032
GO -sikt: hjertekontraksjon; GO: 0060047 (biologisk prosess)
Beviskode: Avledet fra mutant fenotype (IMP)
Referanse: PMID  17611253
Tildelt av: UniProtKB, 6. juni 2008

Datakilde:

Verktøy

Det er et stort antall verktøy tilgjengelig både online og for å laste ned som bruker dataene fra GO -prosjektet. De aller fleste av disse kommer fra tredjeparter; GO-konsortiet utvikler og støtter to verktøy, AmiGO og OBO-Edit .

AmiGO er et nettbasert program som lar brukerne søke, bla gjennom og visualisere ontologier og genetiske produktkommentarer. Den har også et BLAST -verktøy, verktøy som tillater analyse av større datasett, og et grensesnitt for å spørre GO -databasen direkte.

AmiGO kan brukes online på GO -nettstedet for å få tilgang til dataene fra GO Consortium, eller kan lastes ned og installeres for lokal bruk på en hvilken som helst database som bruker GO -databaseskjemaet (f.eks.). Det er gratis åpen kildekode-programvare og er tilgjengelig som en del av go-dev-programvaredistribusjonen.

OBO-Edit er en åpen kildekode, plattformuavhengig ontologi-redaktør utviklet og vedlikeholdt av Gene Ontology Consortium. Den er implementert i Java , og bruker en graforientert tilnærming for å vise og redigere ontologier. OBO-Edit inkluderer et omfattende søke- og filtergrensesnitt, med mulighet til å gjengi undersett av vilkår for å gjøre dem visuelt forskjellige; brukergrensesnittet kan også tilpasses i henhold til brukerpreferanser. OBO-Edit har også en begrunnelse som kan utlede koblinger som ikke er eksplisitt angitt, basert på eksisterende relasjoner og deres egenskaper. Selv om det ble utviklet for biomedisinske ontologier, kan OBO-Edit brukes til å se, søke og redigere enhver ontologi. Det er fritt tilgjengelig for nedlasting.

Konsortium

Gene Ontology Consortium er settet med biologiske databaser og forskningsgrupper som er aktivt involvert i genontologi -prosjektet. Dette inkluderer en rekke modellorganismedatabaser og proteindatabaser med flere arter , programvareutviklingsgrupper og et dedikert redaksjonskontor.

Historie

Gene Ontology ble opprinnelig konstruert i 1998 av et konsortium av forskere som studerer genomene til tre modellorganismer : Drosophila melanogaster (fruktflue), Mus musculus (mus) og Saccharomyces cerevisiae (brygger- eller bakergjær). Mange andre modellorganismedatabaser har sluttet seg til Gene Ontology Consortium, og bidro ikke bare med merknadsdata, men bidro også til utviklingen av ontologiene og verktøyene for å se og anvende dataene. Mange store plante-, dyre- og mikroorganismedatabaser bidrar til dette prosjektet. Fra juli 2019 inneholder GO 44 945 vilkår; det er 6 408 283 merknader til 4 467 forskjellige biologiske organismer. Det er en betydelig litteratur om utvikling og bruk av GO, og det har blitt et standardverktøy i bioinformatikkarsenalet . Målene deres har tre aspekter: å bygge genontologi, tildele ontologi til gen/genprodukter og utvikle programvare og databaser for de to første objektene.

Flere analyser av Gene Ontology som bruker formelle, domeneuavhengige egenskaper for klasser (metaproperties) begynner også å dukke opp. For eksempel ser en ontologisk analyse av biologiske ontologier.

Se også

Referanser

Eksterne linker