Grunnfeil i grunnrenten - Base rate fallacy

Den grunnpris feilslutningen , også kalt grunnpris forsømmelse eller base rate forspenning , er en type feilslutning . Hvis de blir presentert med relatert grunnrenteinformasjon (dvs. generell informasjon om prevalens) og spesifikk informasjon (dvs. informasjon som bare gjelder et bestemt tilfelle), har folk en tendens til å ignorere basisrenten til fordel for den individuelle informasjonen, i stedet for å integrere de to riktig .

Forsømmelse av grunnrente er en spesifikk form for den mer generelle forsømmelsesforsømmelsen .

Falskt positivt paradoks

Et eksempel på feil i grunnrenten er det falske positive paradokset . Dette paradokset beskriver situasjoner der det er flere falske positive testresultater enn sanne positive. For eksempel tester 50 av 1000 mennesker positivt for en infeksjon, men bare 10 har infeksjonen, noe som betyr at 40 tester var falske positive. Sannsynligheten for et positivt testresultat bestemmes ikke bare av nøyaktigheten av testen, men også av egenskapene til den utvalgte populasjonen. Når prevalensen, andelen av dem som har en gitt tilstand, er lavere enn testens falske positive rate, vil selv tester som har en veldig lav sjanse til å gi et falskt positivt i et enkelt tilfelle gi mer falske enn sanne positive totalt sett . Paradokset overrasker de fleste.

Det er spesielt bakvendt ved tolkning av et positivt resultat i en test på en lav-prevalens populasjonen etter å ha behandlet med positive resultater som trekkes fra en høy prevalens befolkning. Hvis den falske positive frekvensen av testen er høyere enn andelen av den nye populasjonen med tilstanden, kan en testadministrator hvis erfaring er hentet fra testing i en populasjon med høy prevalens, av erfaring konkludere med at et positivt testresultat vanligvis indikerer en positivt emne, når det faktisk er større sannsynlighet for at en falsk positiv har skjedd.

Eksempler

Eksempel 1: Sykdom

Høy forekomstpopulasjon

Antall
personer
Smittet Uinfisert Total
Test
positiv
400
(ekte positivt)
30
(falskt positivt)
430
Test
negativ
0
(falsk negativ)
570
(ekte negativt)
570
Total 400 600 1000

Tenk deg å kjøre en smittsom sykdomstest på en befolkning A på 1000 personer, der 40% er smittet. Testen har en falsk positiv rate på 5% (0,05) og ingen falsk negativ rate. Det forventede resultatet av de 1000 testene på populasjon A ville være:

Infisert og test indikerer sykdom ( sann positiv )
1000 × 40/100 = 400 mennesker vil få en sann positiv
Uinfisert og test indikerer sykdom (falskt positivt)
1000 × 100 - 40/100 × 0,05 = 30 personer vil motta en falsk positiv
De resterende 570 testene er korrekt negative.

Så, i populasjon A , kan en person som får en positiv test være over 93% trygg (400/30 + 400) at det korrekt indikerer infeksjon.

Lav forekomstpopulasjon

Antall
personer
Smittet Uinfisert Total
Test
positiv
20
(sant positivt)
49
(falskt positivt)
69
Test
negativ
0
(falsk negativ)
931
(ekte negativt)
931
Total 20 980 1000

Vurder nå den samme testen som ble brukt på populasjon B , der bare 2% er infisert. Det forventede resultatet av 1000 tester på populasjon B ville være:

Infisert og test indikerer sykdom ( sann positiv )
1000 × 2/100 = 20 mennesker ville motta en sann positiv
Uinfisert og test indikerer sykdom (falskt positivt)
1000 × 100 - 2/100 × 0,05 = 49 personer vil motta en falsk positiv
De resterende 931 (= 1000 - (49 + 20)) testene er korrekt negative.

I populasjon B er faktisk bare 20 av de 69 totale menneskene med et positivt testresultat faktisk smittet. Så sannsynligheten for å faktisk bli smittet etter at en blir fortalt at en er infisert er bare 29% (20/20 + 49) for en test som ellers ser ut til å være "95% nøyaktig".

En tester med erfaring fra gruppe A kan finne det som et paradoks at i gruppe B er et resultat som vanligvis hadde indikert korrekt infeksjon vanligvis en falsk positiv . Forvirringen av den bakre sannsynligheten for infeksjon med den tidligere sannsynligheten for å motta et falskt positivt er en naturlig feil etter å ha mottatt et helsefarlig testresultat.

Eksempel 2: Fulle sjåfører

En gruppe politifolk har alkometere som viser falsk fylli i 5% av tilfellene der sjåføren er edru. Breathalyzers klarer imidlertid aldri å oppdage en virkelig full person. En av tusen bilister kjører beruset. Anta at politifolkene deretter stopper en sjåfør tilfeldig for å administrere en alkometertest. Det indikerer at sjåføren er full. Vi antar at du ikke vet noe annet om dem. Hvor stor er sannsynligheten for at de virkelig er fulle?

Mange vil svare så høyt som 95%, men den riktige sannsynligheten er omtrent 2%.

En forklaring på dette er som følger: i gjennomsnitt for hver 1000 testede sjåfører,

  • 1 sjåfør er full, og det er 100% sikkert at for den sjåføren er det et sant positivt testresultat, så det er 1 ekte positivt testresultat
  • 999 sjåfører er ikke fulle, og blant disse sjåførene er det 5% falske positive testresultater, så det er 49,95 falske positive testresultater

Derfor er sannsynligheten for at en av driverne blant 1 + 49,95 = 50,95 positive testresultater virkelig er full .

Gyldigheten av dette resultatet er imidlertid avhengig av gyldigheten av den første antagelsen om at politimannen stoppet sjåføren helt tilfeldig, og ikke på grunn av dårlig kjøring. Hvis det eller en annen ikke-vilkårlig årsak til å stoppe sjåføren var tilstede, innebærer beregningen også sannsynligheten for at en beruset sjåfør kjører kompetent og en ikke-beruset sjåfør som kjører (in-) kompetent.

Mer formelt kan den samme sannsynligheten for omtrent 0,02 fastslås ved bruk av Bayes teorem . Målet er å finne sannsynligheten for at sjåføren er full, gitt at alkometeren indikerte at han er full, noe som kan representeres som

der D betyr at alkometeren indikerer at sjåføren er full. Bayes teorem forteller oss det

Vi ble fortalt følgende i første avsnitt:

og

Som du kan se fra formelen, trenger man p ( D ) for Bayes 'setning, som man kan beregne ut fra de foregående verdiene ved å bruke loven om total sannsynlighet :

som gir

Når du kobler disse tallene inn i Bayes 'teorem, finner du det

Eksempel 3: Terroristidentifikasjon

I en by med 1 million innbyggere lar det være 100 terrorister og 999 900 ikke-terrorister. For å forenkle eksemplet antas det at alle menneskene i byen er innbyggere. Dermed er sannsynligheten for at en tilfeldig valgt innbygger i byen er en terrorist, 0,0001, og sannsynligheten for at den samme innbyggeren er en ikke-terrorist er 0,9999. I et forsøk på å fange terroristene, installerer byen et alarmsystem med et overvåkningskamera og automatisk programvare for ansiktsgjenkjenning .

Programvaren har to feilrater på 1%:

  • Den falske negative frekvensen: Hvis kameraet skanner en terrorist, ringer en bjelle 99% av tiden, og den vil ikke ringe 1% av tiden.
  • Den falske positive frekvensen: Hvis kameraet skanner en ikke-terrorist, vil en klokke ikke ringe 99% av tiden, men den vil ringe 1% av tiden.

Anta nå at en innbygger utløser alarmen. Hva er sjansen for at personen er en terrorist? Med andre ord, hva er P (T | B), sannsynligheten for at en terrorist er blitt oppdaget gitt klokken? Noen som gjør "grunnrenten feil" vil antyde at det er en 99% sjanse for at den oppdagede personen er en terrorist. Selv om slutningen ser ut til å være fornuftig, er det faktisk dårlig resonnement, og en beregning nedenfor viser at sjansen for at de er en terrorist faktisk er nær 1%, ikke i nærheten av 99%.

Tanken kommer fra forvirring mellom to forskjellige feilfrekvenser. 'Antall ikke-klokker per 100 terrorister' og 'antall ikke-terrorister per 100 klokker' er ikke-relaterte mengder. Den ene er ikke nødvendigvis lik den andre, og de trenger ikke engang å være nesten like. For å vise dette, bør du vurdere hva som skjer hvis et identisk alarmsystem ble satt opp i en andre by uten terrorister i det hele tatt. Som i den første byen, lyder alarmen for 1 av hver 100 ikke-terroristiske innbyggere som oppdages, men i motsetning til i den første byen, lyder alarmen aldri for en terrorist. Derfor er 100% av alle anledninger med alarmen for ikke-terrorister, men en falsk negativ rate kan ikke engang beregnes. 'Antall ikke-terrorister per 100 klokker' i byen er 100, men P (T | B) = 0%. Det er null sjanse for at en terrorist er blitt oppdaget gitt ringeklokken.

Tenk deg at hele den første byens befolkning på en million mennesker passerer foran kameraet. Omtrent 99 av de 100 terroristene vil utløse alarmen-og det samme vil om 9999 av de 999 900 ikke-terroristene. Derfor vil rundt 10.098 mennesker utløse alarmen, blant dem vil rundt 99 være terrorister. Så sannsynligheten for at en person som utløser alarmen faktisk er en terrorist, er bare omtrent 99 av 10.098, noe som er mindre enn 1%, og veldig, veldig langt under vårt første gjetning på 99%.

Grunnrentefeilen er så misvisende i dette eksemplet fordi det er mange flere ikke-terrorister enn terrorister, og antallet falske positive (ikke-terrorister skannet som terrorister) er så mye større enn de sanne positive (terrorister skannet som terrorister).

Funn i psykologi

I eksperimenter har det vist seg at folk foretrekker individuell informasjon fremfor generell informasjon når førstnevnte er tilgjengelig.

I noen eksperimenter ble studentene bedt om å estimere gjennomsnittene for karakterpoeng (GPA) til hypotetiske studenter. Når elevene fikk relevant statistikk om GPA -distribusjon, hadde de en tendens til å ignorere dem hvis de fikk beskrivende informasjon om den aktuelle eleven, selv om den nye beskrivende informasjonen åpenbart hadde liten eller ingen relevans for skolens prestasjoner. Dette funnet har blitt brukt til å argumentere for at intervjuer er en unødvendig del av opptaksprosessen ved høyskoler fordi intervjuer ikke klarer å velge vellykkede kandidater bedre enn grunnleggende statistikk.

Psykologene Daniel Kahneman og Amos Tversky forsøkte å forklare dette funnet i form av en enkel regel eller "heuristisk" kalt representativitet . De hevdet at mange dommer knyttet til sannsynlighet, eller årsak og virkning, er basert på hvor representativt en ting er for en annen, eller for en kategori. Kahneman anser forsømmelse av grunnrente for å være en spesifikk form for forlengelsesforsømmelse . Richard Nisbett har hevdet at noen attribusjonelle forstyrrelser som den grunnleggende attribusjonsfeilen er forekomster av grunnrentefeil: folk bruker ikke "konsensusinformasjonen" ("basisrenten") om hvordan andre oppførte seg i lignende situasjoner og foretrekker i stedet enklere disposisjonelle attributter .

Det er betydelig debatt i psykologi om forholdene der folk gjør eller ikke setter pris på grunnrenteinformasjon. Forskere i heuristikk-og-forstyrrelser-programmet har understreket empiriske funn som viser at folk har en tendens til å ignorere basisrater og gjøre slutninger som bryter visse normer for sannsynlighetsgrunnlag, for eksempel Bayes 'teorem . Konklusjonen fra denne forskningslinjen var at menneskelig sannsynlighetstankegang er grunnleggende feilaktig og utsatt for feil. Andre forskere har understreket koblingen mellom kognitive prosesser og informasjonsformater, og hevdet at slike konklusjoner generelt ikke er berettiget.

Tenk igjen Eksempel 2 ovenfra. Den nødvendige slutningen er å estimere (bakre) sannsynlighet for at en (tilfeldig plukket) sjåfør er full, gitt at alkometer -testen er positiv. Formelt sett kan denne sannsynligheten beregnes ved bruk av Bayes 'teorem , som vist ovenfor. Det er imidlertid forskjellige måter å presentere relevant informasjon på. Vurder følgende, formelt ekvivalente variant av problemet:

 1 av 1000 sjåfører kjører full. Breathalyzerne klarer aldri å oppdage en virkelig full person. For 50 av de 999 sjåførene som ikke er beruset, viser alkoholmåleren feilaktig fyllesyke. Anta at politimennene deretter stopper en sjåfør tilfeldig, og tvinger dem til å ta en alkometerstest. Det indikerer at de er fulle. Vi antar at du ikke vet noe annet om dem. Hvor stor er sannsynligheten for at de virkelig er fulle?

I dette tilfellet presenteres den relevante numeriske informasjonen - p (full), p ( D | beruset), p ( D | edru) - når det gjelder naturlige frekvenser med hensyn til en bestemt referanseklasse (se referanseklasseproblem ). Empiriske studier viser at menneskers slutninger samsvarer nærmere med Bayes 'regel når informasjon presenteres på denne måten, noe som hjelper til med å overvinne grunnrøvingssømming hos lekfolk og eksperter. Som en konsekvens anbefaler organisasjoner som Cochrane Collaboration å bruke denne formen for kommunikasjon av helsestatistikk. Å lære folk å oversette slike Bayesianske resonnementproblemer til naturlige frekvensformater er mer effektivt enn bare å lære dem å koble sannsynligheter (eller prosent) til Bayes 'teorem. Det har også blitt vist at grafiske fremstillinger av naturlige frekvenser (f.eks. Ikonoppstillinger) hjelper folk med å gjøre bedre slutninger.

Hvorfor er naturlige frekvensformater nyttige? En viktig grunn er at dette informasjonsformatet letter den nødvendige slutningen fordi det forenkler de nødvendige beregningene. Dette kan sees når du bruker en alternativ måte å beregne nødvendig sannsynlighet p (full | D ):

hvor N (full ∩ D ) angir antall sjåfører som er beruset og får et positivt alkometer -resultat, og N ( D ) angir det totale antallet tilfeller med et positivt alkometer -resultat. Ekvivalensen mellom denne ligningen og den ovennevnte følger av sannsynlighetsteoriens aksiomer, ifølge hvilken N (full ∩ D ) = N × p ( D | full) × p (full). Viktigere, selv om denne ligningen formelt tilsvarer Bayes 'regel, er den ikke psykologisk ekvivalent. Å bruke naturlige frekvenser forenkler slutningen fordi den nødvendige matematiske operasjonen kan utføres på naturlige tall, i stedet for normaliserte brøker (dvs. sannsynligheter), fordi det gjør det høye antallet falske positiver mer gjennomsiktig, og fordi naturlige frekvenser viser et "nestet sett struktur".

Ikke alle frekvensformater letter Bayesian -resonnement. Naturlige frekvenser refererer til frekvensinformasjon som er et resultat av naturlig prøvetaking , som beholder basisfrekvensinformasjon (f.eks. Antall berusede sjåfører når de tar et tilfeldig utvalg av sjåfører). Dette er forskjellig fra systematisk prøvetaking , der basisrater er fastsatt på forhånd (f.eks. I vitenskapelige eksperimenter). I sistnevnte tilfelle er det ikke mulig å utlede den bakre sannsynligheten p (beruset | positiv test) fra å sammenligne antall sjåfører som er beruset og teste positivt sammenlignet med det totale antallet mennesker som får et positivt alkometerresultat, fordi grunnrenteinformasjon er ikke bevart og må eksplisitt gjeninnføres ved bruk av Bayes 'teorem.

Se også

Referanser

Eksterne linker