Evolusjonært stabil strategi - Evolutionarily stable strategy

Evolusjonært stabil strategi
Et løsningskonsept i spillteori
Forhold
Delmengde av Nash likevekt
Supersett av Stokastisk stabil likevekt , Stabil Strong Nash likevekt
Kryss med Subgame perfekt likevekt , skjelvende hånd perfekt likevekt , perfekt Bayesisk likevekt
Betydning
Foreslått av John Maynard Smith og George R. Price
Brukt til Biologisk modellering og evolusjonær spillteori
Eksempel Hawk-due

En evolusjonært stabil strategi ( ESS ) er en strategi (eller sett med strategier) som er ugjennomtrengelig når den blir vedtatt av en befolkning i tilpasning til et bestemt miljø, det vil si at den ikke kan fortrenges av en alternativ strategi (eller et sett med strategier) som kan være roman eller i utgangspunktet sjelden. Introdusert av John Maynard Smith og George R. Price i 1972/3, er det et viktig konsept innen atferdsøkologi , evolusjonspsykologi , matematisk spillteori og økonomi , med anvendelser innen andre felt som antropologi , filosofi og statsvitenskap .

I spillteoretiske termer er en ESS en likevektsforbedring av Nash-likevekten , og er en Nash-likevekt som også er "evolusjonært stabil ." Når det er fast i en populasjon, er naturlig utvalg alene tilstrekkelig for å forhindre at alternative ( mutante ) strategier erstatter den (selv om dette ikke utelukker muligheten for at en bedre strategi, eller et sett med strategier, vil dukke opp som svar på selektivt press som følge av miljøendring).

Historie

Evolusjonært stabile strategier ble definert og introdusert av John Maynard Smith og George R. Pris i 1973 Nature papir. Slik var tiden det tok i fagfellevurderingen av artikkelen for Nature at dette ble innledet av et essay fra 1972 av Maynard Smith i en essays-bok med tittelen On Evolution . Essayet fra 1972 blir noen ganger sitert i stedet for 1973-papiret, men det er mye mer sannsynlig at universitetsbiblioteker har eksemplarer av Nature . Papirer i naturen er vanligvis korte; i 1974 publiserte Maynard Smith et lengre papir i Journal of Theoretical Biology . Maynard Smith forklarer videre i sin 1982-bok Evolution and Theory of Games . Noen ganger siteres disse i stedet. Faktisk har ESS blitt så sentralt i spillteorien at det ofte ikke blir gitt noen sitering, ettersom leseren antas å være kjent med den.

Maynard Smith formaliserte matematisk et verbalt argument fra Price, som han leste mens han fagfellevurderte Prices papir. Da Maynard Smith innså at den noe uorganiserte Price ikke var klar til å revidere artikkelen for publisering, tilbød han å legge til Price som medforfatter.

Konseptet ble hentet fra RH MacArthur og WD Hamiltons arbeid med kjønnsforhold , avledet av Fishers prinsipp , spesielt Hamiltons (1967) konsept om en uslåelig strategi . Maynard Smith ble i fellesskap tildelt Crafoord-prisen for 1999 for sin utvikling av konseptet evolusjonært stabile strategier og anvendelsen av spillteori på evolusjonen av atferd.

Bruk av ESS:

Motivasjon

Den Nash likevekt er den tradisjonelle løsningen konseptet i spillteori . Det avhenger av spillernes kognitive evner. Det antas at spillerne er klar over spillets struktur og prøver bevisst å forutsi motstandernes trekk og maksimere sine egne utbytter . I tillegg antas det at alle spillerne vet dette (se allmennkunnskap ). Disse antagelsene brukes deretter til å forklare hvorfor spillerne velger Nash-likevektsstrategier.

Evolusjonært stabile strategier motiveres helt annerledes. Her antas det at spillernes strategier er biologisk kodet og arvelige . Enkeltpersoner har ingen kontroll over strategien og trenger ikke å være klar over spillet. De reproduserer seg og er underlagt kreftene ved naturlig seleksjon , med utbyttet av spillet som representerer reproduksjonssuksess (biologisk kondisjon ). Det er forestilt seg at alternative strategier for spillet av og til oppstår, via en prosess som mutasjon . For å være en ESS, må en strategi være motstandsdyktig mot disse alternativene.

Gitt de radikalt forskjellige motiverende antagelsene, kan det komme som en overraskelse at ESSes og Nash-likevekt ofte sammenfaller. Faktisk tilsvarer hver ESS en Nash-likevekt, men noen Nash-likevekt er ikke ESS-er.

Nash likevekt

En ESS er en raffinert eller modifisert form av en Nash-likevekt . (Se neste avsnitt for eksempler som kontrasterer de to.) I en Nash-likevekt, hvis alle spillere adopterer sine respektive deler, kan ingen spillere ha nytte av å bytte til noen alternativ strategi. I et tospillerspill er det et strategipar. La E ( S , T ) representerer payoff for å spille strategi S mot strategi T . Strategiparet ( S , S ) er en Nash-likevekt i et tospillerspill hvis og bare hvis for begge spillere, for hvilken som helst strategi T :

E ( S , S ) ≥ E ( T , S )

I denne definisjonen kan en strategi T S være et nøytralt alternativ til S (å score like bra, men ikke bedre). En Nash likevekt er antatt å være stabil selv om T score likt, under forutsetning av at det ikke er noen langvarig insentiv for spillere å adoptere T istedenfor S . Dette faktum representerer utgangspunktet for ESS.

Maynard Smith og Price spesifiserer to betingelser for at en strategi S skal være en ESS. For alle T S , heller

  1. E ( S , S )> E ( T , S ) eller
  2. E ( S , S ) = E ( T , S ) og E ( S , T )> E ( T , T )

Den første tilstanden kalles noen ganger en streng Nash-likevekt. Den andre kalles noen ganger "Maynard Smiths andre tilstand". Det andre vilkåret betyr at selv om strategien T er nøytral med hensyn til Utbetalingen mot strategien S , befolkningen i spillere som fortsetter å spille strategi S har en fordel når du spiller mot T .

Det er også en alternativ, sterkere definisjon av ESS, på grunn av Thomas. Dette legger ulik vekt på Nash-likevektskonseptets rolle i ESS-konseptet. Etter terminologien gitt i den første definisjonen ovenfor, krever denne definisjonen at for alle T S

  1. E ( S , S ) ≥ E ( T , S ) og
  2. E ( S , T )> E ( T , T )

I denne formuleringen spesifiserer den første betingelsen at strategien er en Nash-likevekt, og den andre spesifiserer at Maynard Smiths andre betingelse er oppfylt. Merk at de to definisjonene ikke er nøyaktig ekvivalente: for eksempel er hver rene strategi i koordineringsspillet nedenfor en ESS etter den første definisjonen, men ikke den andre.

Med ord ser denne definisjonen slik ut: Utbetalingen til den første spilleren når begge spillerne spiller strategi S er høyere enn (eller lik) utbetalingen til den første spilleren når han bytter til en annen strategi T og den andre spilleren beholder sin strategi S og utbetalingen til den første spilleren når bare motstanderen endrer strategien til T er høyere enn utbetalingen i tilfelle begge spillerne endrer strategiene til T.

Denne formuleringen fremhever tydeligere rollen til Nash-likevektstilstanden i ESS. Det gir også en naturlig definisjon av relaterte begreper som et svakt ESS eller et evolusjonært stabilt sett .

Eksempler på forskjeller mellom Nash-likevekt og ESSer

Samarbeide Defekt
Samarbeide 3, 3 1, 4
Defekt 4, 1 2, 2
Fangens dilemma
EN B
EN 2, 2 1, 2
B 2, 1 2, 2
Skad din nabo

I de fleste enkle spill sammenfaller ESSes og Nash-likevekt perfekt. For eksempel er det i fangens dilemma bare en Nash-likevekt, og dens strategi ( Defekt ) er også en ESS.

Noen spill kan ha Nash-likevekt som ikke er ESS-er. For eksempel er din nabo (hvis utbetalingsmatrise vises her) til skade både ( A , A ) og ( B , B ) Nash-likevekt, siden spillerne ikke kan gjøre det bedre ved å bytte bort fra noen av dem. Imidlertid er bare B en ESS (og en sterk Nash). En er ikke en ESS, så B kan nøytralt invadere en befolkning på A strateger og dominerer, fordi B skårer høyere mot B enn A gjør mot B . Denne dynamikken fanges opp av Maynard Smiths andre tilstand, siden E ( A , A ) = E ( B , A ), men det er ikke slik at E ( A , B )> E ( B , B ).

C D
C 2, 2 1, 2
D 2, 1 0, 0
Skad alle
Sving ut Oppholde seg
Sving ut 0,0 −1, + 1
Oppholde seg + 1, −1 −20, −20
Kylling

Nash-likevekt med like scorende alternativer kan være ESS-er. For eksempel, i spillet Skad alle , er C en ESS fordi den tilfredsstiller Maynard Smiths andre betingelse. D- strateger kan midlertidig invadere en befolkning av C- strateger ved å score like bra mot C , men de betaler en pris når de begynner å spille mot hverandre; C scorer bedre mot D enn D gjør . Så selv om E ( C , C ) = E ( D , C ), er det også slik at E ( C , D )> E ( D , D ). Som et resultat er C en ESS.

Selv om et spill har ren strategi Nash-likevekt, kan det være at ingen av disse rene strategiene er ESS. Tenk på kyllingspillet . Det er to rene Nash-likevektstrategier i dette spillet ( Swerve , Stay ) og ( Stay , Swerve ). I fravær av ukorrelert asymmetri er verken Swerve eller Stay imidlertid ESS-er. Det er en tredje Nash-likevekt, en blandet strategi som er en ESS for dette spillet (se Hawk-dove-spillet og det beste svaret for forklaring).

Dette siste eksemplet peker på en viktig forskjell mellom Nash-likevekt og ESS. Nash-likevekt er definert på strategisett (en spesifikasjon av en strategi for hver spiller), mens ESS er definert i form av strategier i seg selv. Likevekten definert av ESS må alltid være symmetrisk , og dermed ha færre likevektspunkter.

Vs. evolusjonært stabil tilstand

I populasjonsbiologi er de to begrepene om en evolusjonært stabil strategi (ESS) og en evolusjonært stabil tilstand nært knyttet sammen, men beskriver forskjellige situasjoner.

I en evolusjonært stabil strategi, hvis alle medlemmene av en befolkning adopterer den, kan ingen mutantstrategi invadere. Når nesten alle medlemmer av befolkningen bruker denne strategien, er det ikke noe "rasjonelt" alternativ. ESS er en del av klassisk spillteori .

I en evolusjonært stabil tilstand gjenopprettes en populasjons genetiske sammensetning ved valg etter en forstyrrelse, hvis forstyrrelsen ikke er for stor. En evolusjonært stabil tilstand er en dynamisk egenskap for en befolkning som går tilbake til å bruke en strategi, eller en blanding av strategier, hvis den blir forstyrret fra den opprinnelige tilstanden. Det er en del av populasjonsgenetikk , dynamisk system eller evolusjonær spillteori . Dette kalles nå konvergent stabilitet.

B. Thomas (1984) bruker begrepet ESS på en individuell strategi som kan være blandet, og evolusjonært stabil befolkningstilstand på en populasjonsblanding av rene strategier som formelt kan være ekvivalent med den blandede ESS.

Hvorvidt en populasjon er evolusjonært stabil, forholder seg ikke til dens genetiske mangfold: den kan være genetisk monomorf eller polymorf .

Stokastisk ESS

I den klassiske definisjonen av en ESS kan ingen mutantstrategi invadere. I endelige populasjoner kan en hvilken som helst mutant i prinsippet invadere, om enn med lav sannsynlighet, og antyde at ingen ESS kan eksistere. I en uendelig populasjon kan en ESS i stedet defineres som en strategi som, hvis den blir invadert av en ny mutantstrategi med sannsynlighet p, vil være i stand til å motinvadere fra et enkelt startende individ med sannsynlighet> p, som illustrert av utviklingen av innsats-sikring .

Fangens dilemma

Samarbeide Defekt
Samarbeide 3, 3 1, 4
Defekt 4, 1 2, 2
Fangens dilemma

En vanlig modell for altruisme og sosialt samarbeid er Fangens dilemma . Her ville en gruppe spillere samlet sett ha det bedre hvis de kunne spille Cooperate , men siden Defect klarer seg bedre, har hver enkelt spiller et insentiv til å spille Defect . En løsning på dette problemet er å innføre muligheten for gjengjeldelse ved at enkeltpersoner spiller spillet gjentatte ganger mot samme spiller. I det såkalte iterated Prisoners dilemmaet spiller de samme to individene fangens dilemma om og om igjen. Mens Fangens dilemma bare har to strategier ( Samarbeid og Defekt ), har det gjentatte Fangens dilemma et enormt antall mulige strategier. Siden et individ kan ha forskjellige beredskapsplaner for hver historie, og spillet kan gjentas et ubestemt antall ganger, kan det faktisk være uendelig mange slike beredskapsplaner.

Tre enkle beredskapsplaner som har fått betydelig oppmerksomhet er Always Defect , Always Cooperate og Tit for Tat . De to første strategiene gjør det samme uavhengig av den andre spillerens handlinger, mens sistnevnte svarer på neste runde ved å gjøre det som ble gjort mot den i forrige runde - den svarer på Samarbeid med Samarbeid og Defekt med Defekt .

Hvis hele populasjonen spiller Tit-for-Tat og en mutant oppstår som spiller Always Defect , vil Tit-for-Tat overgå Always Defect . Hvis populasjonen av mutanten blir for stor - vil prosentandelen av mutanten holdes liten. Tit for Tat er derfor en ESS, med hensyn til bare disse to strategiene . På den annen side vil en øy med Always Defect- spillere være stabil mot invasjonen av noen få Tit-for-Tat- spillere, men ikke mot et stort antall av dem. Hvis vi introduserer Always Cooperate , er ikke en befolkning av Tit-for-Tat lenger en ESS. Siden en populasjon av Tit-for-Tat- spillere alltid samarbeider, oppfører strategien Always Cooperate seg identisk i denne befolkningen. Som et resultat blir en mutant som spiller Always Cooperate ikke eliminert. Imidlertid, selv om en befolkning på Always Cooperate og Tit-for-Tat kan eksistere, hvis det er en liten prosentandel av befolkningen som Always Defect er , er det selektive trykket mot Always Cooperate , og til fordel for Tit-for-Tat . Dette skyldes lavere utbytte av å samarbeide enn de som defekter i tilfelle motstanderens mangler.

Dette demonstrerer vanskelighetene med å bruke den formelle definisjonen av en ESS på spill med store strategirom, og har motivert noen til å vurdere alternativer.

Menneskelig oppførsel

Feltene sosiobiologi og evolusjonær psykologi forsøker å forklare dyre- og menneskelig atferd og sosiale strukturer, i stor grad når det gjelder evolusjonært stabile strategier. Sosiopati (kronisk antisosial eller kriminell oppførsel) kan være et resultat av en kombinasjon av to slike strategier.

Evolusjonært stabile strategier ble opprinnelig vurdert for biologisk evolusjon, men de kan gjelde for andre sammenhenger. Faktisk er det stabile tilstander for en stor klasse av adaptiv dynamikk . Som et resultat kan de brukes til å forklare menneskelig atferd som mangler genetisk påvirkning.

Se også

Referanser

Videre lesning

Eksterne linker