Supertree - Supertree

Et supertree er et enkelt fylogenetisk tre sammensatt av en kombinasjon av mindre fylogenetiske trær, som kan ha blitt satt sammen ved hjelp av forskjellige datasett (f.eks. Morfologisk og molekylært) eller et annet utvalg av taxa. Supertree -algoritmer kan markere områder der tilleggsdata mest nyttig ville løse eventuelle uklarheter. Inntrærne til et overtrær bør oppføre seg som prøver fra det større treet.

Byggemetoder

Konstruksjonen av et supertree skalerer eksponentielt med antall skatter inkludert; Derfor er det for et tre av en rimelig størrelse ikke mulig å undersøke alle mulige overtrær og veie dets suksess ved å kombinere inngangsinformasjonen. Heuristiske metoder er dermed essensielle, selv om disse metodene kan være upålitelige; resultatet som hentes ut er ofte partisk eller påvirket av irrelevante egenskaper ved inngangsdataene.

Den mest kjente metoden for konstruksjon av supertree er Matrix Representation with Parsimony (MRP), der inngangskildetrærne er representert med matriser med 0s, 1s og? S (dvs. hver kant i hvert kildetre definerer en bipartisjon av bladet i to usammenhengende deler, og bladene på den ene siden får 0, bladene på den andre siden får 1, og de manglende bladene får?), og matrisene blir sammenkoblet og deretter analysert ved bruk av heuristikk for maksimal parsimoni. En annen tilnærming for supertree -konstruksjon inkluderer en maksimal sannsynlighetsversjon av MRP kalt "MRL" (matrisepresentasjon med sannsynlighet), som analyserer den samme MRP -matrisen, men bruker heuristikk for maksimal sannsynlighet i stedet for for maksimal parsimon for å konstruere supertree.

Den Robinson-Foulds avstanden er den mest populære av mange måter å måle hvor like en supertree er til inngangs trær. Det er en metrik for antall klader fra inngangstrærne som beholdes i overtreet. Robinson-Foulds optimaliseringsmetoder søker etter et supertree som minimerer de totale (oppsummerte) Robinson-Foulds-forskjellene mellom (binært) supertree og hvert input-tre.

En nylig innovasjon har vært konstruksjonen av Maximum Likelihood-supertrees og bruk av "input-tree-wise" sannsynlighetspoeng for å utføre tester av to supertrees.

Ytterligere metoder inkluderer Min Cut Supertree -tilnærmingen, Most Similar Supertree Analysis (MSSA), Distance Fit (DFIT) og Quartet Fit (QFIT), implementert i programvaren CLANN.

applikasjon

Supertrees har blitt brukt for å produsere fylogenier fra mange grupper, særlig angiospermene , eukaryoter og pattedyr. De har også blitt brukt på større problemer som opprinnelsen til mangfold, sårbarhet for utryddelse og evolusjonære modeller for økologisk struktur.

Videre lesning

  • Bininda-Emonds, OR P (2004). Filogenetiske supertrees: kombinere informasjon for å avsløre livets tre . ISBN 978-1-4020-2328-6.
  • Bininda-Emonds, ORP; Gittleman, JL; Steel, MA (2002). "Livets (super) tre: prosedyrer, problemer og utsikter". Årlig gjennomgang av økologi og systematikk . 33 : 265–289. doi : 10.1146/annurev.ecolsys.33.010802.150511 . JSTOR  3069263 .

Referanser