Statistisk teori - Statistical theory

Den teori av statistikk gir et grunnlag for hel rekke teknikker, både i studiedesign og dataanalyse , som brukes innen anvendelser av statistikk . Teorien dekker tilnærminger til statistiske avgjørelsesproblemer og til statistisk slutning , og handlinger og deduksjoner som tilfredsstiller de grunnleggende prinsippene som er oppgitt for disse forskjellige tilnærmingene. Innenfor en gitt tilnærming gir statistisk teori måter å sammenligne statistiske prosedyrer på; den kan finne en best mulig prosedyre innenfor en gitt kontekst for gitte statistiske problemer, eller kan gi veiledning om valget mellom alternative prosedyrer.

Bortsett fra filosofiske betraktninger om hvordan man kan lage statistiske slutninger og avgjørelser, består mye av statistisk teori av matematisk statistikk , og er nært knyttet til sannsynlighetsteori , til bruksteori og til optimalisering .

omfang

Statistisk teori gir en underliggende begrunnelse og gir et konsistent grunnlag for valg av metodikk som brukes i anvendt statistikk .

Modellering

Statistiske modeller beskriver datakildene og kan ha forskjellige typer formuleringer som tilsvarer disse kildene og problemet som studeres. Slike problemer kan være av forskjellige slag:

Prøvetaking fra en endelig befolkning
Måling av observasjonsfeil og raffinering av prosedyrer
Studerer statistiske relasjoner

Statistiske modeller, når de er spesifisert, kan testes for å se om de gir nyttige slutninger for nye datasett.

Datainnsamling

Statistisk teori gir en guide for å sammenligne metoder for datainnsamling , der problemet er å generere informative data ved hjelp av optimalisering og randomisering mens du måler og kontrollerer for observasjonsfeil . Optimalisering av datainnsamlingen reduserer datakostnadene mens statistiske mål oppfylles, mens randomisering tillater pålitelige slutninger. Statistisk teori gir grunnlag for god datainnsamling og strukturering av undersøkelser innen temaene:

Design av eksperimenter for å estimere behandlingseffekter, for å teste hypoteser og for å optimalisere responsene.
Undersøkelsesprøve for å beskrive populasjoner

Oppsummering av data

Oppgaven med å oppsummere statistiske data i konvensjonelle former (også kjent som beskrivende statistikk ) blir sett på i teoretisk statistikk som et problem med å definere hvilke aspekter av statistiske prøver som må beskrives, og hvor godt de kan beskrives fra et typisk begrenset utvalg av data. Således inkluderer problemene teoretisk statistikk inkluderer:

Velge sammendragsstatistikk for å beskrive et utvalg
Oppsummerer sannsynlighetsfordelinger av eksempeldata mens du begrenser antagelser om distribusjonsformen som kan oppfylles
Oppsummerer forholdet mellom forskjellige størrelser målt på de samme elementene med et utvalg

Tolke data

I tillegg til filosofien som ligger til grunn for statistisk inferens , har statistisk teori til oppgave å vurdere hvilke spørsmål som dataanalytikere kanskje vil stille om problemene de studerer, og å tilby dataanalyseteknikker for å svare på dem. Noen av disse oppgavene er:

Oppsummering av populasjoner i form av en tilpasset fordeling eller sannsynlighetstetthetsfunksjon
Oppsummerer forholdet mellom variabler ved hjelp av en eller annen type regresjonsanalyse
Gi måter å forutsi resultatet av en tilfeldig størrelse gitt andre relaterte variabler
Undersøk muligheten for å redusere antall variabler som vurderes i et problem (oppgaven med dimensjonsreduksjon )

Når en statistisk prosedyre er spesifisert i studieprotokollen, gir statistisk teori veldefinerte sannsynlighetsuttalelser for metoden når den brukes på alle populasjoner som kunne ha oppstått fra randomiseringen som ble brukt til å generere dataene. Dette gir en objektiv måte å estimere parametere på, estimere konfidensintervaller, teste hypoteser og velge de beste. Selv for observasjonsdata gir statistisk teori en måte å beregne en verdi som kan brukes til å tolke et utvalg av data fra en populasjon, den kan gi et middel for å indikere hvor godt denne verdien bestemmes av utvalget, og dermed et middel for å si at tilsvarende verdier avledet for forskjellige populasjoner er så forskjellige som de kan virke; påliteligheten av slutninger fra post-hoc observasjonsdata er imidlertid ofte verre enn for planlagt randomisert generering av data.

Anvendt statistisk slutning

Statistisk teori gir grunnlag for en rekke dataanalytiske tilnærminger som er vanlige på tvers av vitenskapelig og sosial forskning. Tolke data gjøres med en av følgende tilnærminger:

Estimering av parametere
Tilby en rekke verdier i stedet for et poengestimat
Testing av statistiske hypoteser

Mange av standardmetodene for disse tilnærmingene er avhengige av visse statistiske forutsetninger (laget i avledningen av metodikken) som faktisk holder i praksis. Statistisk teori studerer konsekvensene av avvik fra disse antagelsene. I tillegg gir det en rekke robuste statistiske teknikker som er mindre avhengige av antagelser, og det gir metoder som sjekker om bestemte antagelser er rimelige for et gitt datasett.

Se også

Referanser

Sitater

Kilder

Atkinson, AC; Donev, AN; Tobias, RD (2007). Optimale eksperimentelle design, med SAS . Oxford University Press . s. 511 + xvi. ISBN 978-0-19-929660-6 .
Bailey, R. A (2008). Design av komparative eksperimenter . Cambridge University Press . ISBN 978-0-521-68357-9 . Kapittel for publisering er tilgjengelig online.
Cochran, William G. (1977). Sampling Techniques (tredje utgave). John Wiley & Sons . ISBN 0-471-16240-X .
Cox, DR, Hinkley, DV (1974) Teoretisk statistikk , Chapman & Hall . ISBN 0-412-12420-3
Freedman, David A. (2009). Statistiske modeller: Teori og praksis (2. utgave). Cambridge University Press . ISBN 978-0-521-67105-7 .
Hinkelmann, Klaus og Kempthorne, Oscar (2008). Design og analyse av eksperimenter . I, II (andre utg.). John Wiley & Sons . ISBN 978-0-470-38551-7 . CS1 maint: flere navn: forfatterliste ( lenke )
Kish, L. (1965), Survey Sampling , John Wiley & Sons . ISBN 0-471-48900-X
Lehmann, EL ; Romano, JP (2005), Testing Statistical Hypotheses (tredje utg.), Springer .
Särndal, Carl-Erik, Swensson, Bengt og Wretman, Jan (1992). Modellassistert spørreundersøkelse . Springer-Verlag . ISBN 0-387-40620-4 . CS1 maint: flere navn: forfatterliste ( lenke )

Videre lesning

Peirce, CS
- (1876), "Note on Theory of the Economy of Research" i Coast Survey Report , s. 197–201 (Vedlegg nr. 14), NOAA PDF Eprint . Gjengitt 1958 i Collected Papers of Charles Sanders Peirce 7 , avsnitt 139–157 og i 1967 i Operations Research 15 (4): s. 643–648, Sammendrag fra JSTOR .
- (1967) Peirce, CS (1967). "Merknad om teorien om økonomien i forskning". Operasjonsforskning . 15 (4): 643. doi : 10.1287 / opre.15.4.643 .
- (1877–1878), " Illustrasjoner av vitenskapens logikk "
- (1883), " A Theory of Probable Inference "
- og Jastrow, Joseph (1885), "On Small Differences in Sensation" i Memoirs of the National Academy of Sciences 3 : s. 73–83. Eprint .
Bickel, Peter J. & Doksum, Kjell A. (2001). Matematisk statistikk: Grunnleggende og utvalgte emner . I (Second (oppdatert utskrift 2007) red.). Pearson Prentice-Hall. ISBN 0-13-850363-X .
Davison, AC (2003) Statistiske modeller . Cambridge University Press. ISBN 0-521-77339-3
Lehmann, Erich (1983). Teori om punktestimering .
Liese, Friedrich & Miescke, Klaus-J. (2008). Statistisk beslutningsteori: estimering, testing og utvelgelse . Springer. ISBN 0-387-73193-8 .

Eksterne linker

Media relatert til statistisk teori på Wikimedia Commons

Languages

In other projects