Z -test - Z-test

Null-hypotese-reigon-eng.png

En Z -test er enhver statistisk test som fordelingen av teststatistikken under nullhypotesen kan tilnærmes med en normalfordeling . Z-tester tester gjennomsnittet av en fordeling. For hvert signifikansnivåkonfidensintervallet , den Z -forsøks har en enkelt kritisk verdi (for eksempel 1,96 til 5% tohalet) som gjør den mer praktisk enn den Students t -test hvis kritiske verdier er definert av prøvestørrelsen ( gjennom de tilsvarende frihetsgrader ).

Gjelder

På grunn av den sentrale grensesetningen er mange teststatistikker omtrent normalfordelt for store prøver. Derfor kan mange statistiske tester enkelt utføres som omtrentlige Z -tester hvis prøvestørrelsen er stor eller populasjonsvariansen er kjent. Hvis populasjonsvariansen er ukjent (og derfor må estimeres ut fra selve prøven) og utvalgsstørrelsen ikke er stor ( n <30), kan studentens t -test være mer passende.

Fremgangsmåte

Slik utfører du en Z -test når T er en statistikk som er omtrent normalfordelt under nullhypotesen er som følger:

Først estimere den forventede verdi μ av T under nullhypotese, og oppnå et estimat s av standardavviket av T .

For det andre, bestem egenskapene til T  : en eller to haler.

For Nullhypotese H 0 : μ≥μ 0 vs alternativ hypotese H 1 : μ <μ 0 , er den lavere/venstrehale (en halet).

For Nullhypotese H 0 : μ≤μ 0 vs alternativ hypotese H 1 : μ> μ 0 , er den øvre/høyre hale (en halet).

For Nullhypotese H 0 : μ = μ 0 vs alternativ hypotese H 1 : μ ≠ μ 0 , er den tohalet.

For det tredje, beregne standardpoengsummen  :

,

hvilke en-halede og to-halede p -verdier kan beregnes som Φ ( Z ) (for tester med nedre/venstre hale), Φ ( -Z ) (for øvre/høyre-halede tester) og 2Φ (-| Z | ) (for tohalede tester) der Φ er standard normal kumulativ fordelingsfunksjon .

Bruk i lokasjonstesting

  1. Begrepet " Z -test" brukes ofte for å referere spesifikt til en -prøves lokaliseringstest som sammenligner gjennomsnittet av et sett med målinger til en gitt konstant når prøvevariansen er kjent. For eksempel, hvis de observerte dataene X 1 , ..., X n er (i) uavhengige, (ii) har et felles gjennomsnitt μ, og (iii) har en felles varians σ 2 , så har gjennomsnittet av prøven X gjennomsnittlig μ og varians .
  2. Nullhypotesen er at gjennomsnittsverdien til X er et gitt tall μ 0 . Vi kan bruke X   som en teststatistikk, og avvise nullhypotesen hvis X  -μ 0 er stor.
  3. For å beregne den standardiserte statistikken må vi enten vite eller ha en omtrentlig verdi for σ 2 , som vi kan beregne fra . I noen applikasjoner er σ 2 kjent, men dette er uvanlig.
  4. Hvis prøvestørrelsen er moderat eller stor, kan vi erstatte utvalgsvariansen med σ 2 , noe som gir en plug-in test. Den resulterende testen vil ikke være en eksakt Z -test siden usikkerheten i utvalgsvariansen ikke blir redegjort for -det vil imidlertid være en god tilnærming med mindre prøvestørrelsen er liten.
  5. En t -test kan brukes til å redegjøre for usikkerheten i utvalgsvariansen når dataene er nøyaktig normale .
  6. Forskjell mellom Z-test og t-test: Z-test brukes når prøvestørrelsen er stor (n> 50), eller populasjonsvariansen er kjent. t-test brukes når prøvestørrelsen er liten (n <50) og populasjonsvariansen er ukjent.
  7. Det er ingen universell konstant der prøvestørrelsen generelt anses å være stor nok til å rettferdiggjøre bruk av plug-in-testen. Typiske tommelfingerregler: utvalgsstørrelsen bør være 50 observasjoner eller mer.
  8. For store prøvestørrelser gir t -testprosedyren nesten identiske p -verdier som Z -testprosedyren.
  9. Andre lokaliseringstester som kan utføres som Z -tester er lokaliseringstesten med to prøver og den parede differansetesten .

Betingelser

For at Z -testen skal gjelde, må visse betingelser være oppfylt.

  • Plage parametere bør være kjent, eller estimert med høy nøyaktighet (et eksempel på en plage parameter vil være standardavviket i en ett-prøve lokaliseringstest). Z -tester fokuserer på en enkelt parameter, og behandler alle andre ukjente parametere som faste på deres sanne verdier. På grunn av Slutskys teorem kan det i praksis begrunnes å "plugge inn" konsekvente estimater av plageparametere. Men hvis prøvestørrelsen ikke er stor nok til at disse estimatene er rimelig nøyaktige, kan det hende at Z -testen ikke fungerer godt.
  • Teststatistikken bør følge en normalfordeling . Vanligvis appellerer man til den sentrale grensesetningen for å begrunne at en teststatistikk varierer normalt. Det er mye statistisk forskning på spørsmålet om når en teststatistikk varierer omtrent normalt. Hvis variasjonen av teststatistikken er sterkt ikke -normal, bør det ikke brukes en Z -test.

Hvis estimater for plageparametere er plugget inn som diskutert ovenfor, er det viktig å bruke estimater som er passende for måten dataene ble samplet på . I det spesielle tilfellet av Z -tester for ett eller to prøvelokaliseringsproblem, er det vanlige prøvestandardavviket bare passende hvis dataene ble samlet inn som en uavhengig prøve.

I noen situasjoner er det mulig å utarbeide en test som på riktig måte redegjør for variasjonen i plug-in-estimater av plageparametere. I tilfelle av ett og to prøveplasseringsproblemer, gjør en t -test dette.

Eksempel

Anta at i en bestemt geografisk region er gjennomsnittet og standardavviket for score på en lesetest henholdsvis 100 poeng og 12 poeng. Vi er interessert i score på 55 elever på en bestemt skole som fikk en gjennomsnittlig poengsum på 96. Vi kan spørre om denne gjennomsnittlige poengsummen er vesentlig lavere enn det regionale gjennomsnittet - det vil si at elevene på denne skolen kan sammenlignes med en enkel tilfeldig utvalg på 55 studenter fra regionen som helhet, eller er poengsummen overraskende lav?

Beregn først standardfeilen til gjennomsnittet:

hvor er populasjonsstandardavviket.

Beregn deretter z -poengsummen , som er avstanden fra gjennomsnittet for prøven til populasjonsgjennomsnittet i enheter av standardfeilen:

I dette eksemplet behandler vi populasjonsgjennomsnittet og variansen som kjent, noe som ville være passende hvis alle studenter i regionen ble testet. Når populasjonsparametere er ukjente, bør en students t-test utføres i stedet.

Klasserommet gjennomsnittlig poengsum er 96, noe som er -2.47 standardavvik enheter fra populasjonen gjennomsnittet på 100. Ser opp z -score i en tabell over standard normalfordeling kumulativ sannsynlighet, finner vi at sannsynligheten for å observere en standard normal verdi under −2,47 er omtrent 0,5 - 0,4932 = 0,0068. Dette er den ensidige p- verdien for nullhypotesen om at de 55 studentene er sammenlignbare med et enkelt tilfeldig utvalg fra populasjonen av alle testtakere. Den tosidige p -verdien er omtrent 0,014 (to ganger den ensidige p -verdien).

En annen måte å si ting på er at med sannsynlighet 1 - 0,014 = 0,986 ville et enkelt tilfeldig utvalg på 55 studenter ha en gjennomsnittlig testscore innenfor 4 enheter av populasjonsgjennomsnittet. Vi kan også si at vi med 98,6% tillit avviser nullhypotesen om at de 55 testtakerne er sammenlignbare med et enkelt tilfeldig utvalg fra populasjonen av testtakere.

The Z -test forteller oss at de 55 elevene i området har en uvanlig lav gjennomsnittlig test score sammenlignet med de fleste enkle stikkprøver av samme størrelse fra befolkningen i test-takers. En mangel på denne analysen er at den ikke vurderer om effektstørrelsen på 4 poeng er meningsfull. Hvis vi i stedet for et klasserom vurderte en subregion som inneholdt 900 studenter hvis gjennomsnittlige poengsum var 99, ville nesten samme z -score og p -verdi bli observert. Dette viser at hvis prøvestørrelsen er stor nok, kan svært små forskjeller fra nullverdien være svært statistisk signifikant. Se statistisk hypotesetesting for ytterligere diskusjon av dette problemet.

Z -andre tester enn lokaliseringstester

Plasseringstester er de mest kjente Z -testene. En annen klasse Z -tester oppstår i maksimal sannsynlighetsestimering av parametrene i en parametrisk statistisk modell . Maksimale sannsynlighetsestimater er omtrent normale under visse forhold, og deres asymptotiske varians kan beregnes ut fra Fisher -informasjonen. Det maksimale sannsynlighetsestimatet dividert med standardfeilen kan brukes som en teststatistikk for nullhypotesen om at populasjonsverdien til parameteren er lik null. Mer generelt, hvis er maksimal sannsynlighetsestimat for en parameter θ, og θ 0 er verdien av θ under nullhypotesen,

kan brukes som en Z -teststatistikk.

Når du bruker en Z -test for maksimale sannsynlighetsestimater, er det viktig å være oppmerksom på at den normale tilnærmingen kan være dårlig hvis prøvestørrelsen ikke er tilstrekkelig stor. Selv om det ikke er noen enkel, universell regel som angir hvor stor prøvestørrelsen må være for å bruke en Z -test, kan simulering gi en god ide om hvorvidt en Z -test er passende i en gitt situasjon.

Z -tester brukes når det kan argumenteres for at en teststatistikk følger en normalfordeling under nullhypotesen av interesse. Mange ikke -parametriske teststatistikker, for eksempel U -statistikk , er omtrent normale for store nok utvalgsstørrelser, og blir derfor ofte utført som Z -tester.

Se også

Referanser

  • Sprinthall, RC (2011). Grunnleggende statistisk analyse (9. utg.). Pearson Education. ISBN 978-0-205-05217-2.
  • Casella, G. , Berger, RL (2002). Statistisk slutning . Duxbury Press. ISBN  0-534-24312-6 .
  • Douglas C.Montgomery, George C.Runger. (2014). Anvendt statistikk og sannsynlighet for ingeniører . (6. utg.). John Wiley & Sons, inc. ISBN  9781118539712 , 9781118645062 .