Statistisk teori - Statistical theory
Den teori av statistikk gir et grunnlag for hel rekke teknikker, både i studiedesign og dataanalyse , som brukes innen anvendelser av statistikk . Teorien dekker tilnærminger til statistiske avgjørelsesproblemer og til statistisk slutning , og handlinger og deduksjoner som tilfredsstiller de grunnleggende prinsippene som er oppgitt for disse forskjellige tilnærmingene. Innenfor en gitt tilnærming gir statistisk teori måter å sammenligne statistiske prosedyrer på; den kan finne en best mulig prosedyre innenfor en gitt kontekst for gitte statistiske problemer, eller kan gi veiledning om valget mellom alternative prosedyrer.
Bortsett fra filosofiske betraktninger om hvordan man kan lage statistiske slutninger og avgjørelser, består mye av statistisk teori av matematisk statistikk , og er nært knyttet til sannsynlighetsteori , til bruksteori og til optimalisering .
omfang
Statistisk teori gir en underliggende begrunnelse og gir et konsistent grunnlag for valg av metodikk som brukes i anvendt statistikk .
Modellering
Statistiske modeller beskriver datakildene og kan ha forskjellige typer formuleringer som tilsvarer disse kildene og problemet som studeres. Slike problemer kan være av forskjellige slag:
- Prøvetaking fra en endelig befolkning
- Måling av observasjonsfeil og raffinering av prosedyrer
- Studerer statistiske relasjoner
Statistiske modeller, når de er spesifisert, kan testes for å se om de gir nyttige slutninger for nye datasett.
Datainnsamling
Statistisk teori gir en guide for å sammenligne metoder for datainnsamling , der problemet er å generere informative data ved hjelp av optimalisering og randomisering mens du måler og kontrollerer for observasjonsfeil . Optimalisering av datainnsamlingen reduserer datakostnadene mens statistiske mål oppfylles, mens randomisering tillater pålitelige slutninger. Statistisk teori gir grunnlag for god datainnsamling og strukturering av undersøkelser innen temaene:
- Design av eksperimenter for å estimere behandlingseffekter, for å teste hypoteser og for å optimalisere responsene.
- Undersøkelsesprøve for å beskrive populasjoner
Oppsummering av data
Oppgaven med å oppsummere statistiske data i konvensjonelle former (også kjent som beskrivende statistikk ) blir sett på i teoretisk statistikk som et problem med å definere hvilke aspekter av statistiske prøver som må beskrives, og hvor godt de kan beskrives fra et typisk begrenset utvalg av data. Således inkluderer problemene teoretisk statistikk inkluderer:
- Velge sammendragsstatistikk for å beskrive et utvalg
- Oppsummerer sannsynlighetsfordelinger av eksempeldata mens du begrenser antagelser om distribusjonsformen som kan oppfylles
- Oppsummerer forholdet mellom forskjellige størrelser målt på de samme elementene med et utvalg
Tolke data
I tillegg til filosofien som ligger til grunn for statistisk inferens , har statistisk teori til oppgave å vurdere hvilke spørsmål som dataanalytikere kanskje vil stille om problemene de studerer, og å tilby dataanalyseteknikker for å svare på dem. Noen av disse oppgavene er:
- Oppsummering av populasjoner i form av en tilpasset fordeling eller sannsynlighetstetthetsfunksjon
- Oppsummerer forholdet mellom variabler ved hjelp av en eller annen type regresjonsanalyse
- Gi måter å forutsi resultatet av en tilfeldig størrelse gitt andre relaterte variabler
- Undersøk muligheten for å redusere antall variabler som vurderes i et problem (oppgaven med dimensjonsreduksjon )
Når en statistisk prosedyre er spesifisert i studieprotokollen, gir statistisk teori veldefinerte sannsynlighetsuttalelser for metoden når den brukes på alle populasjoner som kunne ha oppstått fra randomiseringen som ble brukt til å generere dataene. Dette gir en objektiv måte å estimere parametere på, estimere konfidensintervaller, teste hypoteser og velge de beste. Selv for observasjonsdata gir statistisk teori en måte å beregne en verdi som kan brukes til å tolke et utvalg av data fra en populasjon, den kan gi et middel for å indikere hvor godt denne verdien bestemmes av utvalget, og dermed et middel for å si at tilsvarende verdier avledet for forskjellige populasjoner er så forskjellige som de kan virke; påliteligheten av slutninger fra post-hoc observasjonsdata er imidlertid ofte verre enn for planlagt randomisert generering av data.
Anvendt statistisk slutning
Statistisk teori gir grunnlag for en rekke dataanalytiske tilnærminger som er vanlige på tvers av vitenskapelig og sosial forskning. Tolke data gjøres med en av følgende tilnærminger:
- Estimering av parametere
- Tilby en rekke verdier i stedet for et poengestimat
- Testing av statistiske hypoteser
Mange av standardmetodene for disse tilnærmingene er avhengige av visse statistiske forutsetninger (laget i avledningen av metodikken) som faktisk holder i praksis. Statistisk teori studerer konsekvensene av avvik fra disse antagelsene. I tillegg gir det en rekke robuste statistiske teknikker som er mindre avhengige av antagelser, og det gir metoder som sjekker om bestemte antagelser er rimelige for et gitt datasett.
Se også
Referanser
Sitater
Kilder
- Atkinson, AC; Donev, AN; Tobias, RD (2007). Optimale eksperimentelle design, med SAS . Oxford University Press . s. 511 + xvi. ISBN 978-0-19-929660-6 .
- Bailey, R. A (2008). Design av komparative eksperimenter . Cambridge University Press . ISBN 978-0-521-68357-9 . Kapittel for publisering er tilgjengelig online.
- Cochran, William G. (1977). Sampling Techniques (tredje utgave). John Wiley & Sons . ISBN 0-471-16240-X .
- Cox, DR, Hinkley, DV (1974) Teoretisk statistikk , Chapman & Hall . ISBN 0-412-12420-3
- Freedman, David A. (2009). Statistiske modeller: Teori og praksis (2. utgave). Cambridge University Press . ISBN 978-0-521-67105-7 .
- Hinkelmann, Klaus og Kempthorne, Oscar (2008). Design og analyse av eksperimenter . I, II (andre utg.). John Wiley & Sons . ISBN 978-0-470-38551-7 . CS1 maint: flere navn: forfatterliste ( lenke )
- Kish, L. (1965), Survey Sampling , John Wiley & Sons . ISBN 0-471-48900-X
- Lehmann, EL ; Romano, JP (2005), Testing Statistical Hypotheses (tredje utg.), Springer .
- Särndal, Carl-Erik, Swensson, Bengt og Wretman, Jan (1992). Modellassistert spørreundersøkelse . Springer-Verlag . ISBN 0-387-40620-4 . CS1 maint: flere navn: forfatterliste ( lenke )
Videre lesning
-
Peirce, CS
- (1876), "Note on Theory of the Economy of Research" i Coast Survey Report , s. 197–201 (Vedlegg nr. 14), NOAA PDF Eprint . Gjengitt 1958 i Collected Papers of Charles Sanders Peirce 7 , avsnitt 139–157 og i 1967 i Operations Research 15 (4): s. 643–648, Sammendrag fra JSTOR .
- (1967) Peirce, CS (1967). "Merknad om teorien om økonomien i forskning". Operasjonsforskning . 15 (4): 643. doi : 10.1287 / opre.15.4.643 .
- (1877–1878), " Illustrasjoner av vitenskapens logikk "
- (1883), " A Theory of Probable Inference "
- og Jastrow, Joseph (1885), "On Small Differences in Sensation" i Memoirs of the National Academy of Sciences 3 : s. 73–83. Eprint .
- Bickel, Peter J. & Doksum, Kjell A. (2001). Matematisk statistikk: Grunnleggende og utvalgte emner . I (Second (oppdatert utskrift 2007) red.). Pearson Prentice-Hall. ISBN 0-13-850363-X .
- Davison, AC (2003) Statistiske modeller . Cambridge University Press. ISBN 0-521-77339-3
- Lehmann, Erich (1983). Teori om punktestimering .
- Liese, Friedrich & Miescke, Klaus-J. (2008). Statistisk beslutningsteori: estimering, testing og utvelgelse . Springer. ISBN 0-387-73193-8 .
Eksterne linker
- Media relatert til statistisk teori på Wikimedia Commons