Datafusjon - Data fusion

Sammensmelting av dataene fra to kilder (dimensjoner #1 og #2) kan gi en klassifiserer som er bedre enn alle klassifiseringer basert på dimensjon #1 eller dimensjon #2 alene.

Datafusjon er prosessen med å integrere flere datakilder for å produsere mer konsekvent, nøyaktig og nyttig informasjon enn den som tilbys av en individuell datakilde.

Datafusjonsprosesser blir ofte kategorisert som lave, mellomliggende eller høye, avhengig av prosessfasen der fusjonen finner sted. Datafusjon på lavt nivå kombinerer flere kilder til rådata for å produsere nye rådata. Forventningen er at sammensmeltede data er mer informative og syntetiske enn de opprinnelige inngangene.

For eksempel er sensorfusjon også kjent som (multisensor) datafusjon og er et delsett av informasjonsfusjon .

Konseptet med datafusjon har sitt utspring i den utviklede kapasiteten til mennesker og dyr til å inkorporere informasjon fra flere sanser for å forbedre deres evne til å overleve. For eksempel kan en kombinasjon av syn, berøring, lukt og smak indikere om et stoff er spiselig.

JDL/DFIG -modellen

Felles modell for laboratorier (JDL)/Data Fusion Information Group (DFIG) modell

På midten av 1980-tallet dannet Joint Directors of Laboratories Data Fusion-underpanelet (som senere ble kjent som Data Fusion Group). Med fremkomsten av World Wide Web inkluderte datafusjon derfor data, sensor og informasjonsfusjon. JDL/DFIG introduserte en modell for datafusjon som delte de forskjellige prosessene. For tiden er de seks nivåene med Data Fusion Information Group (DFIG) modellen:

Nivå 0: Kildeforbehandling (eller datavurdering )

Nivå 1: Objektvurdering

Nivå 2: Situasjonsvurdering

Nivå 3: Konsekvensanalyse (eller trusselforbedring )

Nivå 4: Prosessforbedring (eller ressursstyring )

Nivå 5: Brukerforbedring (eller kognitiv forfining )

Nivå 6: Mission Refinement (eller Mission Management )

Selv om JDL-modellen (nivå 1–4) fremdeles er i bruk i dag, blir det ofte kritisert for dens implikasjon at nivåene nødvendigvis skjer i orden og også for dens mangel på tilstrekkelig representasjon av potensialet for et menneske-i-løkken . DFIG -modellen (nivå 0–5) undersøkte implikasjonene av situasjonsbevissthet, brukerforbedring og oppdragsstyring. Til tross for disse manglene, er JDL/DFIG-modellene nyttige for å visualisere datafusjonsprosessen, legge til rette for diskusjon og felles forståelse, og viktige for informasjonsfusjonsdesign på systemnivå.

Geospatiale applikasjoner

I det geospatiale ( GIS ) domenet er datafusjon ofte synonymt med dataintegrasjon . I disse programmene er det ofte behov for å kombinere forskjellige datasett til et enhetlig (sammensmeltet) datasett som inkluderer alle datapunkter og tidstrinn fra inndatasettene. Det sammensmeltede datasettet er forskjellig fra et enkelt kombinert oversett ved at punktene i det sammensmeltede datasettet inneholder attributter og metadata som kanskje ikke var inkludert for disse punktene i det opprinnelige datasettet.

Et forenklet eksempel på denne prosessen er vist nedenfor der datasett "α" er smeltet med datasett β for å danne det sammensmeltede datasettet δ. Datapunkter i settet "α" har romlige koordinater X og Y og attributtene A1 og A2. Datapunkter i sett β har romlige koordinater X og Y og attributtene B1 og B2. Det sammensmeltede datasettet inneholder alle punkter og attributter.

Inndatasett α Inndatasett β Sikret datasett δ
Punkt X Y A1 A2
α1 10 10 M N
α2 10 30 M N
α3 30 10 M N
α4 30 30 M N
Punkt X Y B1 B2
β1 20 20 Sp R
β2 20 40 Sp R
β3 40 20 Sp R
β4 40 40 Sp R
Punkt X Y A1 A2 B1 B2
δ1 10 10 M N Spørsmål? R?
δ2 10 30 M N Spørsmål? R?
δ3 30 10 M N Spørsmål? R?
δ4 30 30 M N Spørsmål? R?
δ5 20 20 M? N? Sp R
δ6 20 40 M? N? Sp R
δ7 40 20 M? N? Sp R
8 40 40 M? N? Sp R

I et enkelt tilfelle hvor alle attributter er ensartede på tvers av hele analysedomenet, kan attributtene ganske enkelt tildeles: M ?, N ?, Q ?, R? til M, N, Q, R. I en ekte applikasjon er attributter ikke ensartede, og noen form for interpolasjon er vanligvis nødvendig for å tilordne attributter til datapunktene i det sammensmeltede settet.

Visualisering av sammensmeltede datasett for steinhummerspor i Tasmanhavet. Bilde generert ved hjelp av Eonfusion -programvare av Myriax Pty. Ltd.

I en mye mer komplisert applikasjon bruker marine dyreforskere datafusjon for å kombinere data om sporing av dyr med batymetriske , meteorologiske , havoverflatetemperatur (SST) og dyrs habitatdata for å undersøke og forstå habitatutnyttelse og dyreadferd i reaksjon på ytre krefter som vær eller vanntemperatur. Hvert av disse datasettene viser et annet romlig rutenett og samplingshastighet, så en enkel kombinasjon vil sannsynligvis skape feil antagelser og forringe resultatene av analysen. Men ved bruk av datafusjon blir alle data og attributter samlet til en enkelt visning der et mer komplett bilde av miljøet skapes. Dette gjør det mulig for forskere å identifisere viktige steder og tider og danne ny innsikt i samspillet mellom miljøet og dyrs atferd.

I figuren til høyre studeres steinhummer utenfor kysten av Tasmania. Hugh Pederson fra University of Tasmania brukte datafusjonsprogramvare for å smelte sørlige hummer- sporingsdata (fargekodet for henholdsvis gult og svart for dag og natt) med batymetri og habitatdata for å lage et unikt 4D-bilde av atferd fra steinhummer.

Dataintegrasjon

I applikasjoner utenfor det geospatiale domenet gjelder forskjeller i bruken av begrepene Dataintegrasjon og datafusjon. På områder som business intelligence, for eksempel, brukes dataintegrasjon for å beskrive kombinering av data, mens data fusjon er integrasjon etterfulgt av reduksjon eller erstatning. Dataintegrasjon kan sees på som settkombinasjon der det større settet beholdes, mens fusjon er en teknikk for reduksjon av sett med forbedret tillit.

Bruksområder

Fra flere trafikkavkjenningsmetoder

Dataene fra de forskjellige sanseteknologiene kan kombineres på intelligente måter for å bestemme trafikkstatus nøyaktig. En datafusjonsbasert tilnærming som benytter akustiske data, bildedata og sensordata på veikanten har vist seg å kombinere fordelene med de forskjellige individuelle metodene.

Beslutningsfusjon

I mange tilfeller er geografisk spredte sensorer sterkt begrenset til energi og båndbredde. Derfor er rådataene om et bestemt fenomen ofte oppsummert i noen få biter fra hver sensor. Når man slutter på en binær hendelse (dvs. eller ), sendes i ekstreme tilfeller bare binære beslutninger fra sensorer til et Decision Fusion Center (DFC) og kombineres for å oppnå forbedret klassifiseringsytelse.

For bedre kontekstuell bevissthet

Med et mangfold av innebygde sensorer, inkludert bevegelsessensor, miljøsensor, posisjonssensor, gir en moderne mobil enhet vanligvis mobilapplikasjoner tilgang til en rekke sensoriske data som kan utnyttes for å forbedre kontekstuell bevissthet. Ved å bruke signalbehandling og datafusjonsteknikker som funksjonsgenerering, mulighetsstudie og hovedkomponentanalyse (PCA) vil slike sensoriske data i stor grad forbedre den positive frekvensen for klassifisering av bevegelse og kontekstuell relevant status for enheten. Mange kontekstforbedrede informasjonsteknikker tilbys av Snidaro, et al.

Se også

Referanser

Kilder

Generelle referanser

Bibliografi

  • Hall, David L .; McMullen, Sonya AH (2004). Matematiske teknikker i Multisensor Data Fusion, andre utgave . Norwood, MA: Artech House, Inc. ISBN 978-1-5805-3335-5.
  • Mitchell, HB (2007). Multi-sensor Data Fusion-En introduksjon . Berlin: Springer-Verlag. ISBN 978-3-540-71463-7.
  • Das, S. (2008). Data Fusion på høyt nivå . Norwood, MA: Artech House Publishers. ISBN 978-1-59693-281-4.

Eksterne linker