Utbredelse av usikkerhet - Propagation of uncertainty

I statistikk , forplantning av usikkerhet (eller forplantning av feil ) er effekten av variabler ' usikkerheter (eller feil , mer spesifikt de tilfeldige feilene ) på usikkerheten av en funksjon basert på dem. Når variablene er verdiene av eksperimentelle målinger har de usikkerheter som skyldes måle begrensninger (f.eks instrument presisjons ) som forplanter seg på grunn av kombinasjonen av variablene i funksjon.

Usikkerheten u kan uttrykkes på en rekke måter. Det kan defineres av den absolutte feilen Δ x . Usikkerheter kan også defineres av den relative feilen x )/ x , som vanligvis skrives som en prosentandel. Vanligvis er usikkerheten på en mengde kvantifisert i form av standardavviket , σ , som er den positive kvadratroten til variansen . Verdien av en mengde og dens feil uttrykkes deretter som et intervall x ± u . Hvis den statistiske sannsynlighetsfordelingen til variabelen er kjent eller kan antas, er det mulig å utlede konfidensgrenser for å beskrive regionen der variabelens sanne verdi kan finnes. For eksempel er 68% konfidensgrenser for en endimensjonal variabel som tilhører en normalfordeling omtrent ± ett standardavvik σ fra den sentrale verdien x , noe som betyr at regionen x ± σ vil dekke den sanne verdien i omtrent 68% av saker.

Hvis usikkerhetene er korrelert,kovarians tas i betraktning. Korrelasjon kan oppstå fra to forskjellige kilder. For det første kan målefeilene være korrelert. For det andre, når de underliggende verdiene er korrelert på tvers av en populasjon, vil usikkerheten i gruppens gjennomsnitt være korrelert.

Lineære kombinasjoner

La oss være et sett med m -funksjoner, som er lineære kombinasjoner av variabler med kombinasjonskoeffisienter :

eller i matrisenotasjon,

La også varians -kovariansmatrisen til x  = ( x 1 , ...,  x n ) betegnes med og la middelverdien betegnes med :

er det ytre produktet .

Deretter er varians -kovariansmatrisen til f gitt av

I komponentnotasjon, ligningen

leser

Dette er det mest generelle uttrykket for spredning av feil fra ett sett med variabler til en annen. Når feilene på x er ukorrelerte, forenkles det generelle uttrykket til

hvor er variansen av k -th element i x -vektoren. Vær oppmerksom på at selv om feilene på x ikke er korrelert, er feilene på f generelt korrelert; med andre ord, selv om det er en diagonal matrise, er det generelt en full matrise.

De generelle uttrykk for en skalar-verdsatt funksjon f er litt enklere (her en er en radvektor):

Hvert kovarianseterm kan uttrykkes i form av korrelasjonskoeffisienten ved , slik at et alternativt uttrykk for variansen av f er

I tilfelle variablene i x er ukorrelerte, forenkler dette ytterligere til

I det enkle tilfellet med identiske koeffisienter og avvik, finner vi

For det aritmetiske gjennomsnittet er resultatet standardfeilen i gjennomsnittet :

Ikke-lineære kombinasjoner

Når f er et sett med ikke-lineær kombinasjon av variablene x , kan en intervallutbredelse utføres for å beregne intervaller som inneholder alle konsistente verdier for variablene. I en sannsynlig tilnærming må funksjonen f vanligvis lineariseres ved tilnærming til en førsteordens Taylor- serieutvidelse, men i noen tilfeller kan eksakte formler utledes som ikke er avhengig av utvidelsen, slik det er tilfellet for den eksakte variansen av produkter . Taylor -utvidelsen vil være:

hvor betegner det partielle derivatet av f k med hensyn til i -variabelen, evaluert til middelverdien av alle komponentene i vektor x . Eller i matrisenotasjon ,

hvor J er den jakobiske matrisen . Siden f 0 er en konstant, bidrar det ikke til feilen på f. Derfor følger utbredelsen av feil det lineære tilfellet ovenfor, men erstatter de lineære koeffisientene, A ki og A kj med de partielle derivatene, og . I matrisenotasjon,

Det vil si at den jakobiske funksjonen brukes til å transformere radene og kolonnene i varians-kovariansmatrisen til argumentet. Merk at dette tilsvarer matriseuttrykket for det lineære tilfellet med .

Forenkling

Å neglisjere korrelasjoner eller anta uavhengige variabler gir en vanlig formel blant ingeniører og eksperimentelle forskere for å beregne feilutbredelse, variansformelen:

hvor representerer standardavviket til funksjonen , representerer standardavviket til , representerer standardavviket til , og så videre.

Det er viktig å merke seg at denne formelen er basert på de lineære egenskapene til gradienten til, og derfor er det et godt estimat for standardavviket så lenge de er små nok. Spesielt må den lineære tilnærmingen til være i nærheten av et radiusområde .

Eksempel

Enhver ikke-lineær differensierbar funksjon,, av to variabler, og kan utvides som

derav:

hvor er standardavviket til funksjonen , er standardavviket til , er standardavviket til og er kovariansen mellom og .

I det spesielle tilfellet at , . Deretter

eller

hvor er sammenhengen mellom og .

Når variablene og er ukorrelerte, . Deretter

Advarsler og advarsler

Feilestimater for ikke-lineære funksjoner er partiske på grunn av bruk av en avkortet serieutvidelse. Omfanget av denne skjevheten avhenger av funksjonens art. For eksempel øker skjevheten på feilen beregnet for logg (1+ x ) når x øker, siden utvidelsen til x er en god tilnærming bare når x er nær null.

For svært ikke-lineære funksjoner finnes det fem kategorier av sannsynlighetsmetoder for usikkerhetsspredning; se Usikkerhetskvantifisering § Metoder for videre usikkerhetsspredning for detaljer.

Gjensidig og forskjøvet gjensidig

I spesialtilfellet invers eller gjensidig , der følger en normal normalfordeling , er den resulterende fordelingen en gjensidig standard normalfordeling, og det er ingen definerbar varians.

I det litt mer generelle tilfellet av en forskjøvet gjensidig funksjon for å følge en generell normalfordeling, eksisterer imidlertid gjennomsnitts- og variansstatistikk i en prinsipiell verdi forstand, hvis forskjellen mellom polen og gjennomsnittet er virkelig verdsatt.

Forhold

Forhold er også problematiske; normale tilnærminger eksisterer under visse forhold.

Eksempelformler

Denne tabellen viser avvik og standardavvik for enkle funksjoner til de reelle variablene , med standardavvik kovarians og korrelasjon . De reelle verdier koeffisienter a og b er antatt nøyaktig kjent (deterministisk), det vil si .

I kolonnene "Varians" og "Standardavvik" bør A og B forstås som forventningsverdier (dvs. verdier som vi estimerer usikkerheten rundt), og skal forstås som verdien av funksjonen beregnet til forventningsverdien til .

Funksjon Forskjell Standardavvik

For ikke -korrelerte variabler ( , ) kan uttrykk for mer kompliserte funksjoner utledes ved å kombinere enklere funksjoner. For eksempel gir gjentatt multiplikasjon, forutsatt at det ikke er noen sammenheng

For saken har vi også Goodmans uttrykk for den eksakte variansen: for den ukorrelerte saken er det

og derfor har vi:

Effekt av korrelasjon på forskjeller

Hvis A og B er ukorrelerte, vil forskjellen AB ha mer varians enn noen av dem. En økende positiv korrelasjon ( ) vil redusere variansen til differansen, konvergere til null varians for perfekt korrelerte variabler med samme varians . På den annen side, en negativ korrelasjon ( ) med ytterligere økning av differansen av forskjellen, sammenlignet med det ukorrelerte tilfellet.

For eksempel har selvsubtraksjonen f = AA null varians bare hvis varianten er perfekt autokorrelert ( ). Hvis A er ukorrelert, , så produksjonen variansen er det dobbelte av inngangs varians, . Og hvis A er perfekt antikorrelert, så blir inngangsvariansen firedoblet i utgangen, (varsel for f = aA - aA i tabellen ovenfor).

Eksempelberegninger

Omvendt tangentfunksjon

Vi kan beregne usikkerhetsutbredelsen for den inverse tangensfunksjonen som et eksempel på bruk av partielle derivater for å spre feil.

Definere

hvor er den absolutte usikkerheten om vår måling av x . Derivatet av f ( x ) med hensyn til x er

Derfor er vår forplantede usikkerhet

hvor er den absolutte forplantede usikkerheten.

Motstandsmåling

En praktisk anvendelse er et eksperiment hvor en måler strøm , I , og spenningen , V , på en motstand for å bestemme motstand , R , ved hjelp av Ohms lov , R = V / I .

Gitt de målte variablene med usikkerheter, I ± σ I og V ± σ V , og neglisjere deres mulige korrelasjon, er usikkerheten i den beregnede mengden, σ R :

Se også

Referanser

Videre lesning

Eksterne linker