Ordliste over sannsynlighet og statistikk - Glossary of probability and statistics

Følgende er en ordliste over begreper som brukes i matematisk vitenskap statistikk og sannsynlighet.


EN

tillatt avgjørelsesregel
algebra av tilfeldige variabler
alternativ hypotese
Analyse av varianter
atombegivenhet
Et annet navn for elementær begivenhet

B

søylediagram
Bayes teorem
Bayes estimator
Bayes-faktor
Bayesian slutning
partiskhet
1. Et trekk ved et utvalg som ikke er representativt for befolkningen
2. Forskjellen mellom den forventede verdien til en estimator og den sanne verdien
binære data
Data som bare kan ta to verdier, vanligvis representert med 0 og 1
binomial fordeling
bivariate analyse
blokkering
Box – Jenkins-metoden
kassetomt

C

årsaksstudie
En statistisk studie der målet er å måle effekten av en variabel på utfallet av en annen variabel. Hvordan vil for eksempel hodepinen min føles hvis jeg tar aspirin, mot hvis jeg ikke tar aspirin? Årsaksstudier kan være enten eksperimentelle eller observasjonelle.
sentral grensesetning
sentralt øyeblikk
karakteristisk funksjon
chi-kvadrat fordeling
chi-squared test
klyngeanalyse
klyngesampling
utfyllende begivenhet
helt randomisert design
beregningsstatistikk
samtidig
I en statistisk studie er samtidige variabler hvis verdier ikke påvirkes av behandlinger, for eksempel en enhets alder, kjønn og kolesterolnivå før en diett (behandling) startes.
betinget fordeling
Gitt to felles fordelte tilfeldige variabler X og Y , er den betingede sannsynlighetsfordelingen av Y gitt X (skrevet " Y | X ") sannsynlighetsfordelingen av Y når X er kjent for å være en bestemt verdi
betinget sannsynlighet
Sannsynligheten for en hendelse A, forutsatt hendelse B. Betinget sannsynlighet skrives P ( A | B ), og leses "sannsynligheten for A , gitt B "
betinget sannsynlighetsfordeling
konfidensintervall
I inferensiell statistikk er et CI et utvalg av sannsynlige verdier for noen parametere, for eksempel populasjonsgjennomsnittet. For eksempel, basert på en studie av søvnvaner blant 100 personer, kan en forsker anslå at den totale befolkningen sover et sted mellom 5 og 9 timer per natt. Dette er forskjellig fra prøvenes gjennomsnitt, som kan måles direkte.
selvtillitsnivå
Også kjent som en konfidenskoeffisient, indikerer konfidensnivået sannsynligheten for at konfidensintervallet (rekkevidden) fanger den virkelige populasjonsgjennomsnittet. For eksempel har et konfidensintervall med 95 prosent konfidensnivå 95 prosent sjanse for å fange befolkningens gjennomsnitt. Teknisk betyr dette at hvis eksperimentet ble gjentatt mange ganger, ville 95 prosent av CI-ene inneholde det sanne populasjonsgjennomsnittet.
forvirrende
konjugert prior
kontinuerlig variabel
praktisk prøvetaking
sammenheng
Også kalt korrelasjonskoeffisient, et numerisk mål på styrken på det lineære forholdet mellom to tilfeldige variabler (man kan for eksempel kvantifisere hvordan skostørrelse og høyde er korrelert i populasjonen). Et eksempel er Pearson produkt-moment korrelasjonskoeffisient , som blir funnet ved å dele kovariansen til de to variablene med produktet av deres standardavvik. Uavhengige variabler har en korrelasjon på 0. En populasjonskorrelasjon representeres ofte av symbolet , mens en prøvekorrelasjon er .
telle data
Data som kommer fra telling som bare kan ta ikke-negative heltallverdier
kovarians
Gitt to tilfeldige variabler X og Y , med forventede verdier og , er kovarians definert som forventet verdi av tilfeldig variabel , og er skrevet . Den brukes til å måle korrelasjon.

D

data
dataanalyse
datasett
Et utvalg og tilhørende datapunkter
datapunkt
En maskinskrevet måling - det kan være en boolsk verdi, et reelt tall, en vektor (i så fall kalles den også en datavektor) osv.
Beslutningsregel
beslutningsteori
grader av frihet
tetthetsestimering
avhengighet
avhengig variabel
beskrivende statistikk
design av eksperimenter
avvik
diskret variabel
prikkplott
dobbelttelling

E

elementær begivenhet
En begivenhet med bare ett element. Når du for eksempel trekker et kort ut av en kortstokk, er "det å få spade" en grunnleggende begivenhet, mens "å få en konge eller et ess" ikke er
estimeringsteori
estimator
En funksjon av de kjente dataene som brukes til å estimere en ukjent parameter; et estimat er resultatet fra den faktiske anvendelsen av funksjonen til et bestemt datasett. Gjennomsnittet kan brukes som en estimator
forventet verdi
Summen av sannsynligheten for hvert mulig utfall av eksperimentet multiplisert med utbyttet ("verdi"). Dermed representerer det gjennomsnittlig beløp man "forventer" å vinne per innsats hvis spill med identiske odds blir gjentatt mange ganger. For eksempel er den forventede verdien av en sekssidig matrulle 3,5. Konseptet ligner gjennomsnittet. Den forventede verdien av tilfeldig variabel X skrives typisk E (X) for operatøren, og ( mu ) for parameteren.
eksperiment
Enhver prosedyre som kan gjentas uendelig og har et veldefinert sett med resultater
eksponentiell familie
begivenhet
En delmengde av prøveområdet (resultatet av et mulig eksperiment), som en sannsynlighet kan tildeles til. For eksempel, når du ruller en terning, er "å få en fem eller en seks" en hendelse (med sannsynligheten på en tredjedel hvis matrisen er rettferdig)

F

faktor analyse
faktorieksperiment
Frekvens
frekvensfordeling
frekvensdomene
hyppig slutning

G

generell lineær modell
generalisert lineær modell
grupperte data

H

histogram

Jeg

Uavhengighet (sannsynlighetsteori)
uavhengig variabel
interkvartil rekkevidde

J

felles fordeling
Gitt to tilfeldige variabler X og Y , er den felles fordelingen av X og Y sannsynlighetsfordelingen av X og Y sammen
felles sannsynlighet
Sannsynligheten for at to hendelser skal forekomme sammen. Felles sannsynlighet for A og B er skrevet eller

K

Kalman filter
kjernen
estimering av kjernetetthet
kurtose
Et mål på de sjeldne ekstreme observasjonene (outliers) av sannsynlighetsfordelingen av en reell verdi tilfeldig variabel. Høyere kurtose betyr at mer av variansen skyldes sjeldne ekstreme avvik, i motsetning til hyppige avvik i beskjedne størrelser

L

L-øyeblikk
lov av stort antall
sannsynlighetsfunksjon
En betinget sannsynlighetsfunksjon betraktet som en funksjon av det andre argumentet sitt første argument holdt fast. Tenk deg for eksempel å trekke en nummerert ball med tallet k fra en pose med n kuler, nummerert 1 til n. Deretter kan du beskrive en sannsynlighetsfunksjon for den tilfeldige variabelen N som sannsynligheten for å få k gitt at det er n kuler: sannsynligheten vil være 1 / n for n større eller lik k, og 0 for n mindre enn k. I motsetning til en sannsynlighetsfordelingsfunksjon vil denne sannsynlighetsfunksjonen ikke oppsummere opptil 1 på prøveområdet
tap funksjon
sannsynlighetsforholdstest

M

M-estimator
marginal fordeling
Gitt to fellesdistribuerte tilfeldige variabler X og Y , er marginalfordelingen av X ganske enkelt sannsynlighetsfordelingen av X ignorerer informasjon om Y
marginal sannsynlighet
marginal sannsynlighet
Sannsynligheten for en hendelse, ignorerer all informasjon om andre hendelser. Den marginale sannsynligheten for A er skrevet P ( A ). Kontrast med betinget sannsynlighet
Markov-kjeden Monte Carlo
matematisk statistikk
estimering av maksimal sannsynlighet
mener
1. Den forventede verdien av en tilfeldig variabel
2. Det aritmetiske gjennomsnittet er gjennomsnittet av et sett med tall, eller summen av verdiene delt på antall verdier
median
median absolutt avvik
modus
glidende gjennomsnitt
multimodal distribusjon
multivariat analyse
estimering av multivariat kjernetetthet
multivariat tilfeldig variabel
En vektor hvis komponenter er tilfeldige variabler på samme sannsynlighetsrom
gjensidig eksklusivitet
gjensidig uavhengighet
En samling av hendelser er gjensidig uavhengig hvis den felles sannsynligheten for at alle hendelser inntreffer er lik produktet av fellessannsynlighetene for de enkelte hendelsene for en delmengde av samlingen. Tenk på resultatet av en serie mynt-flips. Dette er en sterkere tilstand enn parvis uavhengighet

N

ikke-parametrisk regresjon
ikke-parametrisk statistikk
ikke-prøvetakingsfeil
normal distribusjon
normal sannsynlighetsplott
nullhypotesen
Uttalelsen som testes i en test av statistisk signifikans Vanligvis er nullhypotesen en uttalelse om "ingen effekt" eller "ingen forskjell". "Hvis man for eksempel ville teste om lys har en effekt på søvn, ville nullhypotesen være at det ikke er noen effekt. Det blir ofte symbolisert som H 0 .

O

meningsmåling
optimal beslutning
optimal design
outlier

P

p-verdi
parvis uavhengighet
En parvis uavhengig samling av tilfeldige variabler er et sett med tilfeldige variabler hvorav to er uavhengige
parameter
Kan være en populasjonsparameter, en distribusjonsparameter, en ikke-observert parameter (med forskjellige nyanser av betydning). I statistikk er dette ofte en mengde som skal estimeres
partikkelfilter
persentil
Kake diagram
poengestimering
makt
tidligere sannsynlighet
I Bayesian-slutning representerer dette tidligere tro eller annen informasjon som er tilgjengelig før nye data eller observasjoner blir tatt i betraktning
populasjonsparameter
Se parameter
bakre sannsynlighet
Resultatet av en Bayesian-analyse som innkapsler kombinasjonen av tidligere tro eller informasjon med observerte data
hovedkomponentanalyse
sannsynlighet
sannsynlighetstetthet
Beskriver sannsynligheten i en kontinuerlig sannsynlighetsfordeling. For eksempel kan du ikke si at sannsynligheten for at en mann er seks meter høy er 20%, men du kan si at han har 20% sjanser for å være mellom fem og seks meter høy. Sannsynlighetstetthet er gitt av en sannsynlighetstetthetsfunksjon. Kontrast med sannsynlighetsmasse
sannsynlighetstetthetsfunksjon
Gir sannsynlighetsfordelingen for en kontinuerlig tilfeldig variabel
sannsynlighetsfordeling
En funksjon som gir sannsynligheten for alle elementene i et gitt rom: se Liste over sannsynlighetsfordelinger
sannsynlighetstiltak
Sannsynligheten for hendelser i et sannsynlighetsrom
sannsynlighetsplott
sannsynlighetsrom
Et prøveområde der et sannsynlighetsmål er definert

Spørsmål

kvantil
kvartil
prøvetaking av kvoter

R

tilfeldig variabel
En målbar funksjon på et sannsynlighetsrom, ofte virkelig verdsatt. Fordelingsfunksjonen til en tilfeldig variabel gir sannsynligheten for forskjellige resultater. Vi kan også utlede gjennomsnittet og variansen til en tilfeldig variabel
randomisert blokkdesign
område
Lengden på det minste intervallet som inneholder alle dataene
rekursiv Bayesisk estimering
regresjonsanalyse
gjentatte tiltak design
svar
I en statistisk studie, alle variabler hvis verdier kan ha blitt påvirket av behandlingene, for eksempel kolesterolnivåer etter å ha fulgt et bestemt diett i seks måneder.
begrenset randomisering
robust statistikk
avrundingsfeil

S

prøve
Den delen av en befolkning som faktisk blir observert
Eksempel på gjennomsnitt og kovarians
Det aritmetiske gjennomsnittet av et utvalg verdier hentet fra befolkningen. Det er betegnet med . Et eksempel er gjennomsnittlig testpoengsum for en delmengde på 10 studenter fra en klasse. Eksempelgjennomsnitt brukes som en estimator av populasjonsgjennomsnittet, som i dette eksemplet vil være gjennomsnittlig testpoengsum for alle studentene i klassen.
prøveplass
Settet av mulige resultater av et eksperiment. For eksempel vil prøveområdet for rulling av en seks-sidet dyse være {1, 2, 3, 4, 5, 6}
prøvetaking
En prosess med å velge observasjoner for å skaffe kunnskap om en befolkning. Det er mange metoder å velge hvilket utvalg observasjonene skal gjøre
prøvetakingsskjevhet
prøvetakingsfordeling
Sannsynlighetsfordelingen, under gjentatt utvalg av befolkningen, av en gitt statistikk
prøvetakingsfeil
spredt tomt
Skaleringsparameter
Signifikansnivå
enkelt tilfeldig utvalg
Simpsons paradoks
skjevhet
Et mål på asymmetrien av sannsynlighetsfordelingen til en virkelig verdifull tilfeldig variabel. Grovt sett har en fordeling positiv skjevhet (høyre-skjev) hvis den øvre halen er lengre og negativ skjev (venstre-skjev) hvis den nedre halen er lengre (forvirrende de to er en vanlig feil)
spaghetti tomt
spektrumskjevhet
standardavvik
Det mest brukte målet for statistisk spredning. Det er kvadratroten til variansen, og er vanligvis skrevet ( sigma )
standard feil
standard score
statistikk
Resultatet av å bruke en statistisk algoritme på et datasett. Det kan også beskrives som en observerbar tilfeldig variabel
statistisk spredning
statistisk grafikk
statistisk hypotesetesting
statistisk uavhengighet
To hendelser er uavhengige hvis utfallet av den ene ikke påvirker den andres (for eksempel å få en 1 på en terningrull påvirker ikke sannsynligheten for å få en 1 på en annen kast). På samme måte, når vi hevder at to tilfeldige variabler er uavhengige, mener vi intuitivt at det å vite noe om verdien av en av dem ikke gir noen informasjon om verdien til den andre
statistisk slutning
Slutning om en populasjon fra et tilfeldig utvalg hentet fra den eller, mer generelt, om en tilfeldig prosess fra dens observerte oppførsel i en begrenset periode
statistisk forstyrrelse
statistisk modell
statistisk populasjon
Et sett med enheter om hvilke statistiske slutninger som skal trekkes, ofte basert på tilfeldig utvalg. Man kan også snakke om en populasjon av målinger eller verdier
statistisk spredning
Statistisk variasjon er et mål på hvor mangfoldig noen data er. Det kan uttrykkes av variansen eller standardavviket
statistisk parameter
En parameter som indekserer en familie av sannsynlighetsfordelinger
Statistisk signifikant
statistikk
Studentens t-test
stamme-og-blad display
stratifisert prøvetaking
undersøkelsesmetodikk
overlevelsesfunksjon
overlevelsesforstyrrelse
symmetrisk sannsynlighetsfordeling
systematisk prøvetaking

T

teststatistikk
tids domene
tidsserier
tidsserieanalyse
prognoser for tidsserier
behandlinger
Variabler i en statistisk studie som er konseptuelt manipulerbare. For eksempel, i en helsestudie er det å følge et bestemt diett en behandling mens alderen ikke er det.
prøve
Kan referere til hver enkelt repetisjon når vi snakker om et eksperiment som består av et hvilket som helst fast antall av dem. Som et eksempel kan man tenke på at et eksperiment er et hvilket som helst tall fra en til en myntkast, si 17. I dette tilfellet kan en kast kalles en prøve for å unngå forvirring, siden hele eksperimentet er sammensatt av 17.
trimmet estimator
type I og type II feil

U

unimodal sannsynlighetsfordeling
enheter
I en statistisk studie, gjenstandene som behandlingene tildeles. For eksempel, i en studie som undersøkte effekten av å røyke sigaretter, ville enhetene være mennesker.

V

forskjell
Et mål på dens statistiske spredning av en tilfeldig variabel, som indikerer hvor langt fra den forventede verdien dens verdier vanligvis er. Variansen av tilfeldige variable X er vanligvis betegnet som , eller rett og slett

W

vektet aritmetisk gjennomsnitt
vektet median

X

XOR, eksklusiv adskillelse

Y

Yates rettelse for kontinuitet

Z

z-test

Se også

Referanser

Eksterne linker