Ordliste over sannsynlighet og statistikk - Glossary of probability and statistics
Wikipedia-ordliste
De fleste av begrepene oppført i Wikipedia-ordlister er allerede definert og forklart i Wikipedia selv. Ordlister som denne er imidlertid nyttige for å slå opp, sammenligne og gjennomgå et stort antall termer sammen. Du kan bidra til å forbedre denne siden ved å legge til nye termer eller skrive definisjoner for eksisterende.
En statistisk studie der målet er å måle effekten av en variabel på utfallet av en annen variabel. Hvordan vil for eksempel hodepinen min føles hvis jeg tar aspirin, mot hvis jeg ikke tar aspirin? Årsaksstudier kan være enten eksperimentelle eller observasjonelle.
I en statistisk studie er samtidige variabler hvis verdier ikke påvirkes av behandlinger, for eksempel en enhets alder, kjønn og kolesterolnivå før en diett (behandling) startes.
Gitt to felles fordelte tilfeldige variabler X og Y , er den betingede sannsynlighetsfordelingen av Y gitt X (skrevet " Y | X ") sannsynlighetsfordelingen av Y når X er kjent for å være en bestemt verdi
I inferensiell statistikk er et CI et utvalg av sannsynlige verdier for noen parametere, for eksempel populasjonsgjennomsnittet. For eksempel, basert på en studie av søvnvaner blant 100 personer, kan en forsker anslå at den totale befolkningen sover et sted mellom 5 og 9 timer per natt. Dette er forskjellig fra prøvenes gjennomsnitt, som kan måles direkte.
selvtillitsnivå
Også kjent som en konfidenskoeffisient, indikerer konfidensnivået sannsynligheten for at konfidensintervallet (rekkevidden) fanger den virkelige populasjonsgjennomsnittet. For eksempel har et konfidensintervall med 95 prosent konfidensnivå 95 prosent sjanse for å fange befolkningens gjennomsnitt. Teknisk betyr dette at hvis eksperimentet ble gjentatt mange ganger, ville 95 prosent av CI-ene inneholde det sanne populasjonsgjennomsnittet.
Også kalt korrelasjonskoeffisient, et numerisk mål på styrken på det lineære forholdet mellom to tilfeldige variabler (man kan for eksempel kvantifisere hvordan skostørrelse og høyde er korrelert i populasjonen). Et eksempel er Pearson produkt-moment korrelasjonskoeffisient , som blir funnet ved å dele kovariansen til de to variablene med produktet av deres standardavvik. Uavhengige variabler har en korrelasjon på 0. En populasjonskorrelasjon representeres ofte av symbolet , mens en prøvekorrelasjon er .
Gitt to tilfeldige variabler X og Y , med forventede verdier og , er kovarians definert som forventet verdi av tilfeldig variabel , og er skrevet . Den brukes til å måle korrelasjon.
En begivenhet med bare ett element. Når du for eksempel trekker et kort ut av en kortstokk, er "det å få spade" en grunnleggende begivenhet, mens "å få en konge eller et ess" ikke er
En funksjon av de kjente dataene som brukes til å estimere en ukjent parameter; et estimat er resultatet fra den faktiske anvendelsen av funksjonen til et bestemt datasett. Gjennomsnittet kan brukes som en estimator
Summen av sannsynligheten for hvert mulig utfall av eksperimentet multiplisert med utbyttet ("verdi"). Dermed representerer det gjennomsnittlig beløp man "forventer" å vinne per innsats hvis spill med identiske odds blir gjentatt mange ganger. For eksempel er den forventede verdien av en sekssidig matrulle 3,5. Konseptet ligner gjennomsnittet. Den forventede verdien av tilfeldig variabel X skrives typisk E (X) for operatøren, og ( mu ) for parameteren.
En delmengde av prøveområdet (resultatet av et mulig eksperiment), som en sannsynlighet kan tildeles til. For eksempel, når du ruller en terning, er "å få en fem eller en seks" en hendelse (med sannsynligheten på en tredjedel hvis matrisen er rettferdig)
Et mål på de sjeldne ekstreme observasjonene (outliers) av sannsynlighetsfordelingen av en reell verdi tilfeldig variabel. Høyere kurtose betyr at mer av variansen skyldes sjeldne ekstreme avvik, i motsetning til hyppige avvik i beskjedne størrelser
En betinget sannsynlighetsfunksjon betraktet som en funksjon av det andre argumentet sitt første argument holdt fast. Tenk deg for eksempel å trekke en nummerert ball med tallet k fra en pose med n kuler, nummerert 1 til n. Deretter kan du beskrive en sannsynlighetsfunksjon for den tilfeldige variabelen N som sannsynligheten for å få k gitt at det er n kuler: sannsynligheten vil være 1 / n for n større eller lik k, og 0 for n mindre enn k. I motsetning til en sannsynlighetsfordelingsfunksjon vil denne sannsynlighetsfunksjonen ikke oppsummere opptil 1 på prøveområdet
Gitt to fellesdistribuerte tilfeldige variabler X og Y , er marginalfordelingen av X ganske enkelt sannsynlighetsfordelingen av X ignorerer informasjon om Y
Sannsynligheten for en hendelse, ignorerer all informasjon om andre hendelser. Den marginale sannsynligheten for A er skrevet P ( A ). Kontrast med betinget sannsynlighet
En samling av hendelser er gjensidig uavhengig hvis den felles sannsynligheten for at alle hendelser inntreffer er lik produktet av fellessannsynlighetene for de enkelte hendelsene for en delmengde av samlingen. Tenk på resultatet av en serie mynt-flips. Dette er en sterkere tilstand enn parvis uavhengighet
Uttalelsen som testes i en test av statistisk signifikans Vanligvis er nullhypotesen en uttalelse om "ingen effekt" eller "ingen forskjell". "Hvis man for eksempel ville teste om lys har en effekt på søvn, ville nullhypotesen være at det ikke er noen effekt. Det blir ofte symbolisert som H 0 .
Kan være en populasjonsparameter, en distribusjonsparameter, en ikke-observert parameter (med forskjellige nyanser av betydning). I statistikk er dette ofte en mengde som skal estimeres
I Bayesian-slutning representerer dette tidligere tro eller annen informasjon som er tilgjengelig før nye data eller observasjoner blir tatt i betraktning
Beskriver sannsynligheten i en kontinuerlig sannsynlighetsfordeling. For eksempel kan du ikke si at sannsynligheten for at en mann er seks meter høy er 20%, men du kan si at han har 20% sjanser for å være mellom fem og seks meter høy. Sannsynlighetstetthet er gitt av en sannsynlighetstetthetsfunksjon. Kontrast med sannsynlighetsmasse
En målbar funksjon på et sannsynlighetsrom, ofte virkelig verdsatt. Fordelingsfunksjonen til en tilfeldig variabel gir sannsynligheten for forskjellige resultater. Vi kan også utlede gjennomsnittet og variansen til en tilfeldig variabel
I en statistisk studie, alle variabler hvis verdier kan ha blitt påvirket av behandlingene, for eksempel kolesterolnivåer etter å ha fulgt et bestemt diett i seks måneder.
Det aritmetiske gjennomsnittet av et utvalg verdier hentet fra befolkningen. Det er betegnet med . Et eksempel er gjennomsnittlig testpoengsum for en delmengde på 10 studenter fra en klasse. Eksempelgjennomsnitt brukes som en estimator av populasjonsgjennomsnittet, som i dette eksemplet vil være gjennomsnittlig testpoengsum for alle studentene i klassen.
Et mål på asymmetrien av sannsynlighetsfordelingen til en virkelig verdifull tilfeldig variabel. Grovt sett har en fordeling positiv skjevhet (høyre-skjev) hvis den øvre halen er lengre og negativ skjev (venstre-skjev) hvis den nedre halen er lengre (forvirrende de to er en vanlig feil)
To hendelser er uavhengige hvis utfallet av den ene ikke påvirker den andres (for eksempel å få en 1 på en terningrull påvirker ikke sannsynligheten for å få en 1 på en annen kast). På samme måte, når vi hevder at to tilfeldige variabler er uavhengige, mener vi intuitivt at det å vite noe om verdien av en av dem ikke gir noen informasjon om verdien til den andre
Slutning om en populasjon fra et tilfeldig utvalg hentet fra den eller, mer generelt, om en tilfeldig prosess fra dens observerte oppførsel i en begrenset periode
Et sett med enheter om hvilke statistiske slutninger som skal trekkes, ofte basert på tilfeldig utvalg. Man kan også snakke om en populasjon av målinger eller verdier
Variabler i en statistisk studie som er konseptuelt manipulerbare. For eksempel, i en helsestudie er det å følge et bestemt diett en behandling mens alderen ikke er det.
Kan referere til hver enkelt repetisjon når vi snakker om et eksperiment som består av et hvilket som helst fast antall av dem. Som et eksempel kan man tenke på at et eksperiment er et hvilket som helst tall fra en til en myntkast, si 17. I dette tilfellet kan en kast kalles en prøve for å unngå forvirring, siden hele eksperimentet er sammensatt av 17.
I en statistisk studie, gjenstandene som behandlingene tildeles. For eksempel, i en studie som undersøkte effekten av å røyke sigaretter, ville enhetene være mennesker.
Et mål på dens statistiske spredning av en tilfeldig variabel, som indikerer hvor langt fra den forventede verdien dens verdier vanligvis er. Variansen av tilfeldige variable X er vanligvis betegnet som , eller rett og slett