Tilfeldig variabel - Random variable

I sannsynlighet og statistikk beskrives en tilfeldig variabel , tilfeldig mengde , aleatorisk variabel eller stokastisk variabel uformelt som en variabel hvis verdier avhenger av utfallet av et tilfeldig fenomen. Den formelle matematiske behandlingen av tilfeldige variabler er et tema i sannsynlighetsteori . I den sammenhengen forstås en tilfeldig variabel som en målbar funksjon definert på et sannsynlighetsrom som kartlegger fra prøveområdet til de reelle tallene .

Denne grafen viser hvordan tilfeldig variabel er en funksjon fra alle mulige utfall til reelle verdier. Den viser også hvordan tilfeldig variabel brukes til å definere sannsynlighetsmassefunksjoner.

En tilfeldig variabels mulige verdier kan representere de mulige resultatene av et eksperiment som ennå ikke skal utføres, eller de mulige resultatene av et tidligere eksperiment hvis allerede eksisterende verdi er usikker (for eksempel på grunn av upresise målinger eller kvanteusikkerhet ). De kan også konseptuelt representere enten resultatene av en "objektivt" tilfeldig prosess (for eksempel å rulle en terning) eller den "subjektive" tilfeldigheten som skyldes ufullstendig kunnskap om en mengde. Betydningen av sannsynlighetene som er tilordnet potensielle verdier for en tilfeldig variabel er ikke en del av sannsynlighetsteorien i seg selv, men er i stedet knyttet til filosofiske argumenter om tolkningen av sannsynlighet . Matematikken fungerer det samme uavhengig av den spesielle tolkningen som er i bruk.

Som en funksjon må en tilfeldig variabel være målbar , noe som gjør at sannsynligheter kan tilordnes sett med potensielle verdier. Det er vanlig at resultatene er avhengige av noen fysiske variabler som ikke er forutsigbare. For eksempel, når du kaster en rettferdig mynt, er det endelige resultatet av hoder eller haler avhengig av de usikre fysiske forholdene, så resultatet som blir observert er usikkert. Mynten kan bli fanget i en sprekk i gulvet, men en slik mulighet er utelukket fra vurdering.

Den domene av en stokastisk variabel blir kalt en prøve plass, er definert som det sett av mulige utfall av en ikke-deterministisk begivenhet. For eksempel, ved myntkast, er bare to mulige utfall mulige: hoder eller haler.

En tilfeldig variabel har en sannsynlighetsfordeling , som spesifiserer sannsynligheten for Borel -undersett i sitt område. Tilfeldige variabler kan være diskrete , det vil si å ta en hvilken som helst av en spesifisert begrenset eller tellbar verdiliste (som har et tellbart område), utstyrt med en sannsynlighetsmassefunksjon som er karakteristisk for den tilfeldige variablens sannsynlighetsfordeling; eller kontinuerlig , tar en hvilken som helst numerisk verdi i et intervall eller samling av intervaller (som har et utellelig område), via en sannsynlighetstetthetsfunksjon som er karakteristisk for den tilfeldige variablens sannsynlighetsfordeling; eller en blanding av begge.

To tilfeldige variabler med samme sannsynlighetsfordeling kan fortsatt variere når det gjelder deres assosiasjoner til eller uavhengighet fra andre tilfeldige variabler. Realiseringene av en tilfeldig variabel, det vil si resultatene av tilfeldig valg av verdier i henhold til variabelens sannsynlighetsfordelingsfunksjon, kalles tilfeldige variabler .

Selv om ideen opprinnelig ble introdusert av Christiaan Huygens , var den første personen som tenkte systematisk i form av tilfeldige variabler Pafnuty Chebyshev .

Definisjon

En tilfeldig variabel er en målbar funksjon fra et sett med mulige utfall til et målbart rom . Den tekniske aksiomatiske definisjonen krever å være et utvalg av en sannsynlighets trippel (se den måtteoretiske definisjonen ). En tilfeldig variabel er ofte merket med kapital romerske bokstaver som , , , .

Sannsynligheten som tar en verdi i et målbart sett er skrevet som

Standard etui

I mange tilfeller er reell verdi , altså . I noen sammenhenger brukes begrepet tilfeldig element (se utvidelser ) for å betegne en tilfeldig variabel som ikke har denne formen.

Når bildet (eller området) av er tellbart , kalles den tilfeldige variabelen for en diskret tilfeldig variabel og dens fordeling er en diskret sannsynlighetsfordeling , dvs. kan beskrives med en sannsynlighetsmassefunksjon som tilordner en sannsynlighet til hver verdi i bildet av . Hvis bildet er utallig uendelig (vanligvis et intervall ) kalles det en kontinuerlig tilfeldig variabel . I det spesielle tilfellet at det er absolutt kontinuerlig , kan fordelingen beskrives med en sannsynlighetstetthetsfunksjon , som tilordner sannsynligheter til intervaller; spesielt må hvert enkelt punkt nødvendigvis ha null sannsynlighet for en absolutt kontinuerlig tilfeldig variabel. Ikke alle kontinuerlige tilfeldige variabler er absolutt kontinuerlige, en blandingsfordeling er et slikt moteksempel; slike tilfeldige variabler kan ikke beskrives med en sannsynlighetstetthet eller en sannsynlighetsmassefunksjon.

Enhver tilfeldig variabel kan beskrives med dens kumulative fordelingsfunksjon , som beskriver sannsynligheten for at den tilfeldige variabelen vil være mindre enn eller lik en bestemt verdi.

Utvidelser

Begrepet "tilfeldig variabel" i statistikk er tradisjonelt begrenset til real-value case ( ). I dette tilfellet er strukturen av de reelle tall som gjør det mulig å definere slike mengder som den forventede verdien og variansen av en tilfeldig variabel, dens kumulativ fordelingsfunksjon , og det øyeblikk av sin fordeling.

Imidlertid er definisjonen ovenfor gyldig for alle målbare verdier. Dermed kan man vurdere tilfeldige elementer i andre sett , for eksempel tilfeldige boolske verdier , kategoriske verdier , komplekse tall , vektorer , matriser , sekvenser , trær , sett , former , manifolder og funksjoner . Man kan da spesifikt referere til en tilfeldig variabel av typen , eller en verdsatt tilfeldig variabel .

Dette mer generelle begrepet et tilfeldig element er spesielt nyttig i disipliner som grafteori , maskinlæring , naturlig språkbehandling og andre felt innen diskret matematikk og informatikk , hvor man ofte er interessert i å modellere tilfeldig variasjon av ikke-numeriske data strukturer . I noen tilfeller er det likevel praktisk å representere hvert element av , ved å bruke ett eller flere reelle tall. I dette tilfellet kan et tilfeldig element eventuelt bli representert som en vektor med virkelige verdifulle tilfeldige variabler (alle definert på det samme underliggende sannsynlighetsrommet , som gjør at de forskjellige tilfeldige variablene kan dekke ). For eksempel:

  • Et tilfeldig ord kan representeres som et tilfeldig heltall som fungerer som en indeks i ordforrådet til mulige ord. Alternativt kan det fremstilles som en vilkårlig indikator vektor, hvis lengde er lik størrelsen av vokabular, der de eneste verdier av positiv sannsynlighet er , , og posisjonen til 1 angir ordet.
  • En tilfeldig setning med gitt lengde kan representeres som en vektor med tilfeldige ord.
  • En tilfeldig graf på gitte hjørner kan bli representert som en matrise med tilfeldige variabler, hvis verdier angir adjacensmatrisen til den tilfeldige grafen.
  • En tilfeldig funksjon kan representeres som en samling tilfeldige variabler , som gir funksjonens verdier på de forskjellige punktene i funksjonens domene. Det er vanlige reelle verdifulle tilfeldige variabler forutsatt at funksjonen er virkelig verdsatt. For eksempel er en stokastisk prosess en tilfeldig funksjon av tid, en tilfeldig vektor er en tilfeldig funksjon av et indekssett, for eksempel , og tilfeldig felt er en tilfeldig funksjon på et hvilket som helst sett (vanligvis tid, rom eller et diskret sett).

Distribusjonsfunksjoner

Hvis en tilfeldig variabel definert på sannsynlighetsrommet er gitt, kan vi stille spørsmål som "Hvor sannsynlig er det at verdien av er lik 2?". Dette er det samme som sannsynligheten for hendelsen som ofte skrives som eller for kort.

Registrering av alle disse sannsynlighetene for utgangsområder for en virkelig verdsatt tilfeldig variabel gir sannsynlighetsfordelingen til . Sannsynlighetsfordelingen "glemmer" det spesielle sannsynlighetsrommet som brukes til å definere og registrerer bare sannsynligheten for forskjellige verdier av . En slik sannsynlighetsfordeling kan alltid fanges opp av den kumulative fordelingsfunksjonen

og eventuelt også ved hjelp av en sannsynlighetstetthetsfunksjon , . I tiltaksteoretiske begreper, bruker vi tilfeldig variabel til "push-forward" tiltaket på å et mål på . Det underliggende sannsynlighetsrommet er en teknisk enhet som brukes til å garantere eksistensen av tilfeldige variabler, noen ganger for å konstruere dem, og for å definere forestillinger som korrelasjon og avhengighet eller uavhengighet basert på en felles fordeling av to eller flere tilfeldige variabler på samme sannsynlighetsrom. I praksis disponerer man ofte over plassen helt og bare setter et mål på det som tildeler mål 1 til hele den virkelige linjen, det vil si at man jobber med sannsynlighetsfordelinger i stedet for tilfeldige variabler. Se artikkelen om kvantile funksjoner for fullere utvikling.

Eksempler

Diskret tilfeldig variabel

I et eksperiment kan en person velges tilfeldig, og en tilfeldig variabel kan være personens høyde. Matematisk blir den tilfeldige variabelen tolket som en funksjon som kartlegger personen til personens høyde. Tilknyttet den tilfeldige variabelen er en sannsynlighetsfordeling som gjør det mulig å beregne sannsynligheten for at høyden er i en hvilken som helst delmengde av mulige verdier, for eksempel sannsynligheten for at høyden er mellom 180 og 190 cm, eller sannsynligheten for at høyden enten er mindre over 150 eller mer enn 200 cm.

En annen tilfeldig variabel kan være personens antall barn; dette er en diskret tilfeldig variabel med ikke-negative heltallsverdier. Det tillater beregning av sannsynligheter for individuelle heltallverdier - sannsynlighetsmassefunksjonen (PMF) - eller for sett med verdier, inkludert uendelige sett. For eksempel kan hendelsen være "et like stort antall barn". For både endelige og uendelige hendelsessett kan deres sannsynligheter finnes ved å legge sammen PMF -ene til elementene; det vil si at sannsynligheten for et jevnt antall barn er den uendelige summen .

I eksempler som disse undertrykkes utvalgsområdet ofte, siden det er matematisk vanskelig å beskrive, og de mulige verdiene for de tilfeldige variablene blir deretter behandlet som et prøveområde. Men når to tilfeldige variabler måles på samme utvalg av utfall, for eksempel høyden og antall barn som blir beregnet på de samme tilfeldige personene, er det lettere å spore forholdet deres hvis det er anerkjent at både høyde og antall barn kommer fra den samme tilfeldige personen, for eksempel slik at spørsmål om slike tilfeldige variabler er korrelert eller ikke kan stilles.

Dersom er Tellbar av reelle tall, og deretter er en diskret fordelingsfunksjon. Her for , for . Hvis vi for eksempel tar en oppregning av alle rasjonelle tall som en, får man en diskret fordelingsfunksjon som ikke er en trinnfunksjon eller stykkevis konstant.

Myntkast

De mulige utfallene for ett myntkast kan beskrives av prøveområdet . Vi kan introdusere en virkelig verdsatt tilfeldig variabel som modellerer en gevinst på $ 1 for et vellykket spill på hoder som følger:

Hvis mynten er en rettferdig mynt , har Y en sannsynlighetsmassefunksjon gitt av:

Terningkast

Hvis utvalgsområdet er settet med mulige tall som rulles på to terninger, og den tilfeldige variabelen av interesse er summen S av tallene på de to terningene, så er S en diskret tilfeldig variabel hvis fordeling er beskrevet av sannsynlighetsmassefunksjonen plottet som høyden på bildesøylene her.

En tilfeldig variabel kan også brukes til å beskrive prosessen med terningkast og mulige utfall. Den mest åpenbare representasjonen for to-terningssaken er å ta settet med par med tall n 1 og n 2 fra {1, 2, 3, 4, 5, 6} (som representerer tallene på de to terningene) som prøven rom. Totalt antall rullet (summen av tallene i hvert par) er deretter en tilfeldig variabel X gitt av funksjonen som tilordner paret til summen:

og (hvis terningene er rettferdige ) har en sannsynlighetsmassefunksjon ƒ X gitt av:

Kontinuerlig tilfeldig variabel

Formelt sett er en kontinuerlig tilfeldig variabel en tilfeldig variabel hvis kumulative fordelingsfunksjon er kontinuerlig overalt. Det er ingen " hull ", som tilsvarer tall som har en begrenset sannsynlighet for å oppstå . I stedet tar kontinuerlige tilfeldige variabler nesten aldri en eksakt foreskrevet verdi c (formelt, ), men det er en positiv sannsynlighet for at verdien vil ligge i bestemte intervaller som kan være vilkårlig små . Kontinuerlige tilfeldige variabler innrømmer vanligvis sannsynlighetstetthetsfunksjoner (PDF), som kjennetegner CDF og sannsynlighetstiltak ; slike distribusjoner kalles også absolutt kontinuerlig ; men noen kontinuerlige fordelinger er entall , eller blandinger av en absolutt kontinuerlig del og en entall.

Et eksempel på en kontinuerlig tilfeldig variabel vil være en basert på en spinner som kan velge en horisontal retning. Da er verdiene tatt av den tilfeldige variabelen retninger. Vi kan representere disse retningene ved nord, vest, øst, sør, sørøst, etc. Imidlertid er det vanligvis mer praktisk å kartlegge utvalgsområdet til en tilfeldig variabel som tar verdier som er reelle tall. Dette kan for eksempel gjøres ved å kartlegge en retning til en peiling i grader med klokken fra nord. Den tilfeldige variabelen tar deretter verdier som er reelle tall fra intervallet [0, 360), og alle deler av området er "like sannsynlige". I dette tilfellet er X = vinkel spunnet. Et hvilket som helst reelt tall har sannsynlighetsnull for å bli valgt, men en positiv sannsynlighet kan tildeles alle verdiområder . For eksempel, sannsynligheten for å velge et nummer i [0, 180] er Anmeldelse for 1. / 2- . I stedet for å snakke med en sannsynlighetsmassefunksjon, sier vi at sannsynligheten tetthet av X er 1/360. Sannsynligheten for et delsett på [0, 360) kan beregnes ved å multiplisere målingen til settet med 1/360. Generelt kan sannsynligheten for et sett for en gitt kontinuerlig tilfeldig variabel beregnes ved å integrere tettheten over det gitte settet.

Mer formelt, gitt et hvilket som helst intervall , kalles en tilfeldig variabel en " kontinuerlig uniform tilfeldig variabel" (CURV) hvis sannsynligheten for at den tar en verdi i et delintervall bare avhenger av lengden på delintervallet. Dette innebærer at sannsynligheten for å falle i en hvilken som helst delintervall er proporsjonal med lengden på delintervallet, det vil si at hvis acdb , har man

der den siste likestillings resultater fra unitarity aksiom av sannsynlighet. Den sannsynlighetstetthetsfunksjon av en bue er gitt ved indikatoren funksjon av dens intervall på støtten normalisert ved intervallet lengde:

Av spesiell interesse er den jevne fordelingen på enhetsintervallet . Prøver av hvilken som helst ønsket sannsynlighetsfordelingen kan genereres ved å beregne quantile funksjon av på et tilfeldig tall som er generert fordelt jevnt på enheten intervallet. Dette utnytter egenskapene til kumulative distribusjonsfunksjoner , som er et samlende rammeverk for alle tilfeldige variabler.

Blandet type

En blandet tilfeldig variabel er en tilfeldig variabel hvis kumulative fordelingsfunksjon verken er stykkevis-konstant (en diskret tilfeldig variabel) eller overalt-kontinuerlig . Den kan realiseres som summen av en diskret tilfeldig variabel og en kontinuerlig tilfeldig variabel; i så fall vil CDF være det veide gjennomsnittet av CDFene til komponentvariablene.

Et eksempel på en tilfeldig variabel av blandet type vil være basert på et eksperiment der en mynt vendes og spinneren snurres bare hvis resultatet av myntkastet er hoder. Hvis resultatet er haler, X = −1; ellers X = verdien til spinneren som i foregående eksempel. Det er en sannsynlighet på 12 for at denne tilfeldige variabelen vil ha verdien −1. Andre verdiområder vil ha halve sannsynligheten for det siste eksemplet.

Mest generelt er hver sannsynlighetsfordeling på den virkelige linjen en blanding av diskret del, entall og en absolutt kontinuerlig del; se Lebesgue's dekomponeringsteorem § Forfining . Den diskrete delen er konsentrert om et tellbart sett, men dette settet kan være tett (som settet med alle rasjonelle tall).

Målteoretisk definisjon

Den mest formelle, aksiomatiske definisjonen av en tilfeldig variabel innebærer tiltaksteori . Kontinuerlige tilfeldige variabler defineres når det gjelder sett med tall, sammen med funksjoner som tilordner slike sett til sannsynligheter. På grunn av forskjellige vanskeligheter (f.eks. Banach-Tarski-paradokset ) som oppstår hvis slike sett er utilstrekkelig begrenset, er det nødvendig å introdusere det som kalles en sigma-algebra for å begrense de mulige settene som sannsynligheter kan defineres over. Normalt brukes en spesiell slik sigma-algebra, Borel σ-algebra , som gjør det mulig å definere sannsynligheter over alle sett som kan utledes enten direkte fra kontinuerlige tallintervaller eller med et begrenset eller telt uendelig antall fagforeninger og/ eller kryss mellom slike intervaller.

Den tiltaksteoretiske definisjonen er som følger.

La være et

sannsynlighetsrom og et målbart rom . Da en -valued tilfeldig variabel er en målbar funksjon , noe som betyr at for hver undergruppe , dens preimage er -measurable; , hvor . Denne definisjonen gjør det mulig for oss å måle alle delsett i målrommet ved å se på forbildet, som antatt er målbart.

I mer intuitive termer er et medlem av et mulig utfall, et medlem av er en målbar delmengde av mulige utfall, funksjonen gir sannsynligheten for hver slik målbar delmengde, representerer settet med verdier som den tilfeldige variabelen kan ta (for eksempel sett med reelle tall), og et medlem av er et "veloppdragen" (målbart) delsett av (de som sannsynligheten kan bestemmes for). Den tilfeldige variabelen er da en funksjon fra et hvilket som helst utfall til en mengde, slik at resultatene som fører til en nyttig mengde mengder for den tilfeldige variabelen har en veldefinert sannsynlighet.

Når er en

topologisk plass , da det mest vanlig valg for den σ-algebra er det Borel σ-algebra , som er den σ-algebra generert av samlingen av alle åpne setter inn . I slike tilfeller kalles den -verdierte tilfeldige variabelen en -verdien tilfeldig variabel . Når plassen er den virkelige linjen , kalles dessuten en slik virkelig verdsatt tilfeldig variabel ganske enkelt en tilfeldig variabel .

Virkelig verdsatte tilfeldige variabler

I dette tilfellet er observasjonsrommet settet med reelle tall. Recall, er sannsynlighetsrommet. For et ekte observasjonsrom er funksjonen en virkelig verdsatt tilfeldig variabel hvis

Denne definisjonen er et spesielt tilfelle av det ovenstående fordi settet genererer Borel σ-algebra på settet med reelle tall, og det er tilstrekkelig å kontrollere målbarhet på ethvert generasjonssett. Her kan vi bevise målbarhet på dette generasjonssettet ved å bruke det faktum .

Øyeblikk

Sannsynlighetsfordelingen til en tilfeldig variabel er ofte preget av et lite antall parametere, som også har en praktisk tolkning. For eksempel er det ofte nok å vite hva den "gjennomsnittlige verdien" er. Dette er fanget opp av det matematiske begrepet forventet verdi av en tilfeldig variabel, betegnet og også kalt det

første øyeblikket . Generelt er ikke lik . Når "gjennomsnittsverdien" er kjent, kan man deretter spørre hvor langt fra denne gjennomsnittsverdien verdiene til vanligvis er, et spørsmål som blir besvart av variansen og standardavviket til en tilfeldig variabel. kan ses intuitivt som et gjennomsnitt hentet fra en uendelig befolkning, hvis medlemmer er spesielle evalueringer av .

Matematisk er dette kjent som (generalisert) problem med øyeblikk : for en gitt klasse med tilfeldige variabler , finn en samling funksjoner slik at forventningsverdiene fullt ut karakteriserer

fordelingen av den tilfeldige variabelen .

Øyeblikk kan bare defineres for virkelige verdier av tilfeldige variabler (eller komplekse verdier, etc.). Hvis den tilfeldige variabelen i seg selv er virkelig verdsatt, kan øyeblikkene i selve variabelen tas, som tilsvarer øyeblikkene i identitetsfunksjonen til den tilfeldige variabelen. Selv for tilfeldige variabler som ikke er reelt verdsatt, kan det imidlertid tas øyeblikk av virkelige verdier av disse variablene. For eksempel, for en

kategorisk tilfeldig variabel X som kan anta de nominelle verdiene "rød", "blå" eller "grønn", kan den virkelige verdien funksjonen konstrueres; denne bruker Iverson -braketten , og har verdien 1 hvis har verdien "grønn", 0 ellers. Deretter kan den forventede verdien og andre øyeblikk av denne funksjonen bestemmes.

Funksjoner av tilfeldige variabler

En ny tilfeldig variabel Y kan defineres ved å bruke en ekte Borel-målbar funksjon på resultatene av en

virkelig verdsatt tilfeldig variabel . Det vil si ,. Den kumulative fordelingsfunksjonen til er da

Hvis funksjon er inverteres (dvs eksisterer, hvor det er

invers funksjon ) og enten øker eller minker , blir så den tidligere relasjon kan forlenges for å oppnå

Med de samme hypotesene om inverterbarhet av , forutsatt også

differensiering , kan forholdet mellom sannsynlighetstetthetsfunksjonene bli funnet ved å differensiere begge sider av uttrykket ovenfor med hensyn til , for å oppnå

Hvis det ikke er noen inverterbarhet av, men hver innrømmer høyst et tellbart antall røtter (dvs. et begrenset eller uendelig antall slike ) som så kan den tidligere relasjonen mellom

sannsynlighetstetthetsfunksjonene generaliseres med

der , i henhold til

invers funksjonsteorem . Formlene for tettheter krever ikke å øke.

I den måtteoretiske, aksiomatiske tilnærmingen til sannsynlighet, hvis en tilfeldig variabel på og en

Borel-målbar funksjon , så er den også en tilfeldig variabel på , siden sammensetningen av målbare funksjoner også er målbar . (Dette er imidlertid ikke nødvendigvis sant om er Lebesgue målbar .) Den samme prosedyren som tillatt til å gå fra en sannsynlighet plass til kan anvendes for å oppnå fordelingen av .

Eksempel 1

La være en virkelig verdsatt,

kontinuerlig tilfeldig variabel og la .

Hvis , så , så

Hvis , da

Eksempel 2

Anta at det er en tilfeldig variabel med en kumulativ fordeling

hvor er en fast parameter. Tenk på den tilfeldige variabelen .

Det siste uttrykket kan beregnes i form av den kumulative fordelingen av det

som er den kumulative fordelingsfunksjonen (CDF) for en eksponentiell distribusjon .

Eksempel 3

Anta at det er en tilfeldig variabel med en

standard normalfordeling , hvis tetthet er

Tenk på den tilfeldige variabelen Vi kan finne tettheten ved å bruke formelen ovenfor for en endring av variabler:

I dette tilfellet er endringen ikke monoton , fordi hver verdi av har to tilsvarende verdier på (en positiv og negativ). På grunn av symmetri vil imidlertid begge halvdelene transformere identisk, dvs.

Den omvendte transformasjonen er

og dets derivat er

Deretter,

Dette er en chi-squared-fordeling med én grad av frihet .

Eksempel 4

Anta at det er en tilfeldig variabel med en

normalfordeling , hvis tetthet er

Tenk på den tilfeldige variabelen Vi kan finne tettheten ved å bruke formelen ovenfor for en endring av variabler:

I dette tilfellet er endringen ikke monoton , fordi hver verdi av har to tilsvarende verdier på (en positiv og negativ). Til forskjell fra det forrige eksemplet, er det imidlertid ingen symmetri i dette tilfellet, og vi må beregne de to forskjellige begrepene:

Den omvendte transformasjonen er

og dets derivat er

Deretter,

Dette er en ikke-sentral chi-kvadratisk fordeling med én grad av frihet .

Noen eiendommer

Ekvivalens av tilfeldige variabler

Det er flere forskjellige sanser der tilfeldige variabler kan anses å være ekvivalente. To tilfeldige variabler kan være like, like nesten sikkert eller like i fordelingen.

I økende styrkerekkefølge er den presise definisjonen av disse ekvivalensbegrepene gitt nedenfor.

Likhet i distribusjon

Dersom prøven plass er et delsett av den virkelige linje, tilfeldige variable X og Y er like i fordeling (merket ) hvis de har de samme fordelingsfunksjoner:

For å være lik i fordelingen trenger ikke tilfeldige variabler å være definert på samme sannsynlighetsrom. To tilfeldige variabler som har like momentgenererende funksjoner har samme fordeling. Dette gir for eksempel en nyttig metode for å kontrollere likhet mellom visse funksjoner av uavhengige, identisk fordelte (IID) tilfeldige variabler . Imidlertid eksisterer øyeblikkegenereringsfunksjonen bare for distribusjoner som har en definert Laplace -transformasjon .

Nesten sikker likestilling

To tilfeldige variabler X og Y er like sikkert (betegnet ) hvis, og bare hvis, sannsynligheten for at de er forskjellige er

null :

For alle praktiske formål i sannsynlighetsteori er denne oppfatningen om ekvivalens like sterk som faktisk likhet. Det er knyttet til følgende avstand:

hvor "ess sup" representerer det essensielle supremumet i målteorien .

Likestilling

Til slutt, de to tilfeldige variable X og Y er like hvis de er likeverdige som funksjoner på sin plass målbar:

Denne oppfatningen er vanligvis den minst nyttige i sannsynlighetsteori, fordi i praksis og i teorien er det underliggende målerommet i eksperimentet sjelden eksplisitt karakterisert eller til og med karakteriserbart.

Konvergens

Et viktig tema i matematisk statistikk består i å skaffe konvergensresultater for visse sekvenser av tilfeldige variabler; for eksempel loven om store tall og sentralgrensetningen .

Det er forskjellige sanser der en sekvens av tilfeldige variabler kan konvergere til en tilfeldig variabel . Disse er forklart i artikkelen om

konvergens av tilfeldige variabler .

Se også

Referanser

Inline sitater

Litteratur

Eksterne linker