Spill teori - Game theory

Spillteori er studiet av matematiske modeller for strategiske interaksjoner blant rasjonelle beslutningstakere . Den har applikasjoner innen alle samfunnsvitenskapelige felt , så vel som innen logikk , systemvitenskap og informatikk . Opprinnelig adresserte den nullsumsspill , der hver deltakers gevinster eller tap er nøyaktig balansert med de andre deltakernes. I det 21. århundre gjelder spillteori for et bredt spekter av atferdsrelasjoner, og er nå et paraplybegrep for vitenskapen om logisk beslutningstaking hos mennesker, dyr og datamaskiner.

Moderne spillteori begynte med ideen om blandet strategi-likevekt i to-personers nullsumspill og beviset av John von Neumann . Von Neumanns originale bevis brukte Brouwer-punktpunktssetningen på kontinuerlige tilordninger til kompakte konvekse sett , som ble en standardmetode innen spillteori og matematisk økonomi . Hans oppgave ble fulgt av boken Theory of Games and Economic Behavior fra 1944 , skrevet sammen med Oskar Morgenstern , som vurderte samarbeidsspill av flere spillere. Den andre utgaven av denne boken ga en aksiomatisk teori om forventet nytte, som tillot matematiske statistikere og økonomer å behandle beslutningstaking under usikkerhet.

Spillteori ble utviklet mye på 1950 -tallet av mange lærde. Det ble eksplisitt brukt på evolusjon på 1970 -tallet, selv om lignende utvikling går tilbake minst så langt som på 1930 -tallet. Spillteori har blitt anerkjent som et viktig verktøy på mange felt. Fra og med 2014, med Nobel Memorial Prize in Economic Sciences som gikk til spillteoretikeren Jean Tirole , har elleve spillteoretikere vunnet Nobelprisen i økonomi. John Maynard Smith ble tildelt Crafoord -prisen for sin anvendelse av evolusjonær spillteori .

Historie

Forløpere

Diskusjoner om matematikk i spill begynte lenge før fremveksten av moderne matematisk spillteori. Cardano arbeid på sjansespill i Liber de ludo aleae ( Bok på sjansespill ), som ble skrevet rundt 1564, men utgitt posthumt i 1663, formulert noen av feltets grunnleggende ideer. På 1650 -tallet utviklet Pascal og Huygens forventningsbegrepet om resonnement om sjansens oppbygning , og Huygens publiserte sin gamblingregning i De ratiociniis in ludo aleæ ( On Reasoning in Games of Chance ) i 1657.

I 1713 analyserte et brev tilskrevet Charles Waldegrave et spill kalt "le Her". Han var en aktiv jakobitt og onkel til James Waldegrave , en britisk diplomat. I dette brevet gir Waldegrave en minimax blandet strategiløsning til en to-personers versjon av kortspillet le Her , og problemet er nå kjent som Waldegrave-problem . I sine Recherches sur les principes mathématiques de la théorie des richesses ( Researches into the Mathematical Principles of the Theory of Wealth ), regnet Antoine Augustin Cournot som et duopol og presenterer en løsning som er spillets Nash -likevekt .

I 1913 publiserte Ernst Zermelo Über eine Anwendung der Mengenlehre auf die Theorie des Schachspiels ( On an Application of Set Theory to Theory of the Game of Chess ), som beviste at den optimale sjakkstrategien er strengt bestemt . Dette banet vei for mer generelle teoremer.

I 1938 beviste den danske matematiske økonom Frederik Zeuthen at den matematiske modellen hadde en vinnende strategi ved å bruke Brouwers fastpunktssetning . I sin bok Applications aux Jeux de Hasard fra 1938 og tidligere notater beviste Émile Borel et minimax-teorem for to-personers nullsummatrisespill bare når utbetalingsmatrisen var symmetrisk og gir en løsning på et ikke-trivielt uendelig spill (kjent på engelsk som Blotto -spill ). Borel formodede ikke-eksistensen av blandet strategi-likevekt i endelige to-personers nullsumspill , en formodning som ble påvist feil av von Neumann.

Fødsel og tidlig utvikling

John von Neumann

Spillteori eksisterte egentlig ikke som et unikt felt før John von Neumann publiserte avisen On the Theory of Strategy Games i 1928. Von Neumanns originale bevis brukte Brouwers fastpunktssetning på kontinuerlige kartlegginger i kompakte konvekse sett , som ble en standardmetode i spillteori og matematisk økonomi . Hans oppgave ble fulgt av boken Theory of Games and Economic Behavior fra 1944 som ble skrevet sammen med Oskar Morgenstern . Den andre utgaven av denne boken ga en aksiomatisk bruksteori , som reinkarnerte Daniel Bernoullis gamle teori om nytte (om penger) som en uavhengig disiplin. Von Neumanns arbeid innen spillteori kulminerte i denne boken fra 1944. Dette grunnleggende arbeidet inneholder metoden for å finne gjensidig konsistente løsninger for to-personers nullsumspill. Etterfølgende arbeid fokuserte først og fremst på kooperativ spillteori, som analyserer optimale strategier for grupper av individer, forutsatt at de kan håndheve avtaler mellom dem om riktige strategier.

John Nash

I 1950 dukket den første matematiske diskusjonen om fangens dilemma opp, og et eksperiment ble utført av bemerkelsesverdige matematikere Merrill M. Flood og Melvin Dresher , som en del av RAND Corporation 's undersøkelser av spillteori. RAND forfulgte studiene på grunn av mulige anvendelser for global atomstrategi . Omtrent på samme tid utviklet John Nash et kriterium for gjensidig konsistens av spillerens strategier kjent som Nash -likevekten , gjeldende for et større utvalg av spill enn kriteriet foreslått av von Neumann og Morgenstern. Nash beviste at hver begrenset n-spiller, ikke-null-sum (ikke bare to-spiller null-sum) ikke-samarbeidende spill har det som nå er kjent som en Nash-likevekt i blandede strategier.

Spillteorien opplevde en stor aktivitet på 1950 -tallet, hvor begreper om kjernen , det omfattende formspillet , fiktivt spill , gjentatte spill og Shapley -verdien ble utviklet. På 1950 -tallet kom også de første anvendelsene av spillteori til filosofi og statsvitenskap .

Prisvinnende prestasjoner

I 1965 introduserte Reinhard Selten sitt løsningskonsept om subgame perfect equilibria , som ytterligere foredlet Nash -likevekten. Senere ville han også introdusere skjelvende hånd perfeksjon . I 1994 Nash, Selten og Harsanyi ble Economics nobelprisvinnere for deres bidrag til økonomisk spillteori.

På 1970 -tallet ble spillteorien mye brukt i biologi , hovedsakelig som et resultat av arbeidet til John Maynard Smith og hans evolusjonært stabile strategi . I tillegg ble begrepene korrelert likevekt , skjelvende hånd perfeksjon og felles kunnskap introdusert og analysert.

I 2005 fulgte spillteoretikerne Thomas Schelling og Robert Aumann Nash, Selten og Harsanyi som nobelprisvinnere. Schelling jobbet med dynamiske modeller, tidlige eksempler på evolusjonær spillteori . Aumann bidro mer til likevektsskolen, introduserte likevektsforstørrelse og korrelert likevekt og utviklet en omfattende formell analyse av antagelsen om felles kunnskap og konsekvensene av den.

I 2007 ble Leonid Hurwicz , Eric Maskin og Roger Myerson tildelt Nobelprisen i økonomi "for å ha lagt grunnlaget for mekanismedesignteori ". Myersons bidrag inkluderer ideen om riktig likevekt , og en viktig utdannet tekst: Game Theory, Analysis of Conflict . Hurwicz introduserte og formaliserte begrepet insentivkompatibilitet .

I 2012 ble Alvin E. Roth og Lloyd S. Shapley tildelt Nobelprisen i økonomi "for teorien om stabile tildelinger og praktisering av markedsdesign". I 2014 gikk Nobel til spillteoretikeren Jean Tirole .

Spilltyper

Kooperativ / ikke-samarbeidsvillig

Et spill er samarbeidende hvis spillerne er i stand til å inngå bindende forpliktelser eksternt håndhevet (f.eks. Gjennom kontraktsrett ). Et spill er ikke-samarbeidsvillig hvis spillere ikke kan inngå allianser eller hvis alle avtaler må være selvhåndhevende (f.eks. Gjennom troverdige trusler ).

Kooperative spill blir ofte analysert gjennom rammen av kooperativ spillteori , som fokuserer på å forutsi hvilke koalisjoner som vil danne, de felles handlingene som gruppene tar og de resulterende kollektive gevinstene. Det er i motsetning til den tradisjonelle ikke-samarbeidsvillige teorien som fokuserer på å forutsi enkeltspillers handlinger og utbetalinger og analysere Nash-likevekt . Fokuset på individuell utbetaling kan resultere i et fenomen kjent som Tragedy of the Commons , hvor ressurser brukes til et kollektivt ineffektivt nivå. Mangelen på formell forhandling fører til forverring av offentlige goder gjennom overforbruk og under bestemmelser som stammer fra private insentiver.

Kooperativ spillteori gir en tilnærming på høyt nivå ettersom den bare beskriver strukturen, strategiene og utbetalingene til koalisjoner, mens ikke-samarbeidende spillteori også ser på hvordan forhandlingsprosedyrer vil påvirke fordelingen av utbetalinger i hver koalisjon. Ettersom ikke-kooperativ spillteori er mer generell, kan kooperative spill analyseres gjennom tilnærmingen til ikke-samarbeidende spillteori (det motsatte holder ikke), forutsatt at det blir gjort tilstrekkelige forutsetninger for å omfatte alle mulige strategier tilgjengelig for spillere på grunn av muligheten av ekstern håndhevelse av samarbeid. Selv om bruk av en enkelt teori kan være ønskelig, er det i mange tilfeller utilstrekkelig informasjon tilgjengelig for å nøyaktig modellere de formelle prosedyrene som er tilgjengelige under den strategiske forhandlingsprosessen, eller den resulterende modellen ville være for kompleks til å tilby et praktisk verktøy i den virkelige verden. I slike tilfeller gir kooperativ spillteori en forenklet tilnærming som tillater analyse av spillet for øvrig uten å måtte gjøre noen antagelser om forhandlingsmakter.

Symmetrisk / asymmetrisk

	E	F
E	1, 2	0, 0
F	0, 0	1, 2
Et asymmetrisk spill

Et symmetrisk spill er et spill hvor utbetalingen for å spille en bestemt strategi bare avhenger av de andre strategiene som brukes, ikke av hvem som spiller dem. Det vil si at hvis identiteten til spillerne kan endres uten å endre utbetalingen til strategiene, så er et spill symmetrisk. Mange av de vanligste 2 × 2 -spillene er symmetriske. Standardrepresentasjonene for kylling , fangens dilemma og hjortejakten er alle symmetriske spill. Noen forskere vil også vurdere visse asymmetriske spill som eksempler på disse spillene. Imidlertid er de vanligste gevinstene for hvert av disse spillene symmetriske.

De mest studerte asymmetriske spillene er spill der det ikke er identiske strategisett for begge spillerne. For eksempel har ultimatum -spillet og lignende diktatorspillet forskjellige strategier for hver spiller. Det er imidlertid mulig for et spill å ha identiske strategier for begge spillerne, men likevel være asymmetrisk. For eksempel er spillet som er avbildet i denne seksjonens grafikk asymmetrisk til tross for at det har identiske strategisett for begge spillerne.

Nullsum / ikke-nullsum

	EN	B
EN	–1, 1	3, –3
B	0, 0	–2, 2
Et nullsumspill

Nullsumsspill er et spesielt tilfelle av spill med konstant sum, der valg av spillere verken kan øke eller redusere tilgjengelige ressurser. I null-sum-spill går den totale fordelen til alle spillerne i et spill, for hver kombinasjon av strategier, legger den alltid til null (mer uformelt, en spiller fordeler bare på lik linje med andre). Poker eksemplifiserer et nullsumspill (ignorerer muligheten for husets kutt), fordi man vinner akkurat det beløpet motstanderne taper. Andre nullsumspill inkluderer matchende øre og de fleste klassiske brettspill inkludert Go og sjakk .

Mange spill som er studert av spillteoretikere (inkludert det berømte fangenes dilemma ) er spill uten nullsum, fordi utfallet har nettoresultater større eller mindre enn null. Uformelt, i spill uten nullsum, tilsvarer ikke en gevinst fra en spiller nødvendigvis et tap med en annen.

Spill med konstant sum tilsvarer aktiviteter som tyveri og pengespill, men ikke den økonomiske situasjonen der det er potensielle gevinster ved handel . Det er mulig å forvandle et hvilket som helst spill til et (muligens asymmetrisk) nullsumspill ved å legge til en dummy-spiller (ofte kalt "brettet") hvis tap kompenserer spillernes nettogevinster.

Samtidig / sekvensiell

Samtidig spill er spill der begge spillerne beveger seg samtidig, eller i stedet er de senere spillerne uvitende om de tidligere spillernes handlinger (noe som gjør dem effektivt samtidig). Sekvensielle spill (eller dynamiske spill) er spill der senere spillere har litt kunnskap om tidligere handlinger. Dette trenger ikke å være perfekt informasjon om hver handling fra tidligere spillere; det kan være veldig lite kunnskap. For eksempel kan en spiller vite at en tidligere spiller ikke utførte en bestemt handling, mens de ikke vet hvilken av de andre tilgjengelige handlingene den første spilleren faktisk utførte.

Forskjellen mellom samtidige og sekvensielle spill fanges opp i de forskjellige representasjonene som er diskutert ovenfor. Ofte brukes normal form for å representere samtidige spill, mens omfattende form brukes til å representere sekvensielle spill . Transformasjonen av omfattende til normal form er en måte, noe som betyr at flere omfattende formspill tilsvarer den samme normale formen. Følgelig er forestillinger om likevekt for samtidige spill utilstrekkelige for å resonnere om sekvensielle spill; se perfeksjon i underspillet .

Kort sagt, forskjellene mellom sekvensielle og samtidige spill er som følger:

	Sekvensiell	Samtidig
Normalt betegnet med	Beslutningstrær	Utbetalingsmatriser
Forhåndskunnskap om motstanderens trekk?	Ja	Nei
Tidsakse?	Ja	Nei
Også kjent som	Spill med omfattende form Omfattende spill	Strategispill Strategisk spill

Cournot -konkurranse

Cournot -konkurransemodellen innebærer at spillere velger mengden av et homogent produkt som skal produseres uavhengig og samtidig, hvor marginalkostnaden kan være forskjellig for hvert firma og firmaets utbetaling er fortjeneste. Produksjonskostnadene er offentlig informasjon, og firmaet har som mål å finne sin profittmaksimerende mengde basert på hva de tror det andre firmaet vil produsere og oppføre seg som monopoler. I dette spillet ønsker bedrifter å produsere i monopolmengde, men det er et høyt insentiv til å avvike og produsere mer, noe som reduserer markedsklaringsprisen. For eksempel kan bedrifter bli fristet til å avvike fra monopolmengden hvis det er lav monopolmengde og høy pris, med sikte på å øke produksjonen for å maksimere profitten. Imidlertid gir dette alternativet ikke den høyeste gevinsten, ettersom selskapets evne til å maksimere fortjenesten avhenger av markedsandelen og elastisiteten i markedets etterspørsel. Cournot -likevekten oppnås når hvert firma opererer på sin reaksjonsfunksjon uten incitament til å avvike, ettersom de har den beste responsen basert på de andre selskapenes produksjon. I spillet når bedriftene Nash -likevekten når Cournot -likevekten oppnås.

Likevekt for Cournot kvantitetskonkurranse

Bertrand -konkurranse

Den Bertrand konkurranse , antar homogene produkter og en konstant marginal kostnad og spillere velger prisene. Likevekten i priskonkurranse er der prisen er lik marginalkostnader, forutsatt fullstendig informasjon om konkurrentenes kostnader. Derfor har selskapene et insentiv til å avvike fra likevekten fordi et homogent produkt med en lavere pris vil oppnå hele markedsandelen, kjent som en kostnadsfordel.

Perfekt informasjon og ufullkommen informasjon

Et spill med ufullkommen informasjon (den stiplede linjen representerer uvitenhet fra spiller 2, formelt kalt et informasjonssett )

En viktig delmengde av sekvensielle spill består av spill med perfekt informasjon . Et spill er perfekt informasjon hvis alle spillere, ved hvert trekk i spillet, kjenner trekkene som alle andre spillere tidligere har gjort. I virkeligheten kan dette brukes på firmaer og forbrukere som har informasjon om pris og kvalitet på alle tilgjengelige varer i et marked. Et ufullkommen informasjonsspill spilles når spillerne ikke kjenner alle trekk som allerede er gjort av motstanderen, for eksempel et simultant bevegelsesspill. De fleste spill som er studert i spillteori er ufullkomne informasjonsspill. Eksempler på perfekt informasjonsspill inkluderer tic-tac-toe , brikker , uendelig sjakk og Go .

Mange kortspill er spill med ufullkommen informasjon, for eksempel poker og bridge . Perfekt informasjon forveksles ofte med fullstendig informasjon , som er et lignende konsept. Fullstendig informasjon krever at hver spiller kjenner strategiene og gevinstene som er tilgjengelige for de andre spillerne, men ikke nødvendigvis handlingene som er utført, mens perfekt informasjon er kunnskap om alle aspekter av spillet og spillerne. Spill med ufullstendig informasjon kan imidlertid reduseres til spill med ufullkommen informasjon ved å introdusere " bevegelser av natur ".

Bayesiansk spill

For en av forutsetningene bak begrepet Nash -likevekt, har hver spiller riktig tro på handlingene til de andre spillerne. I spillteori er det mange situasjoner der deltakerne ikke helt forstår egenskapene til sine motstandere. Forhandlere kan være uvitende om motstanderens verdsettelse av forhandlingsobjektet, selskaper kan være uvitende om motstanderens kostnadsfunksjoner, stridende kan være uvitende om motstanderens styrker, og jurymedlemmer kan være uvitende om sin kollegas tolkning av bevisene under rettssaken. I noen tilfeller kan det hende at deltakerne kjenner karakteren til motstanderen godt, men de vet kanskje ikke hvor godt motstanderen kjenner sin egen karakter.

Bayesiansk spill betyr et strategisk spill med ufullstendig informasjon. For et strategisk spill er beslutningstakere spillere, og hver spiller har en gruppe handlinger. En sentral del av den ufullkomne informasjonsspesifikasjonen er settet med stater. Hver stat beskriver en samling egenskaper som er relevante for spilleren, for eksempel deres preferanser og detaljer om dem. Det må være en tilstand for hvert sett med funksjoner som noen spillere tror kan eksistere.

eksempel på bayesisk spill

For eksempel hvor spiller 1 er usikker på om spiller 2 heller vil date henne eller komme bort fra henne, mens spiller 2 forstår spiller 1s preferanser som før. For å være spesifikk, antar at spiller 1 tror at spiller 2 ønsker å date henne med en sannsynlighet på 1/2 og komme bort fra henne med en sannsynlighet på 1/2 (denne evalueringen kommer sannsynligvis fra spiller 1s erfaring: hun står overfor spillere som vil å date henne halvparten av tiden i et slikt tilfelle og spillere som ønsker å unngå henne halvparten av tiden). På grunn av sannsynligheten involvert, krever analysen av denne situasjonen å forstå spillerens preferanse for trekningen, selv om folk bare er interessert i ren strategisk likevekt.

Kombinerende spill

Spill der vanskeligheten med å finne en optimal strategi stammer fra mangfoldet av mulige trekk kalles kombinatoriske spill. Eksempler inkluderer sjakk og go. Spill som involverer ufullkommen informasjon kan også ha en sterk kombinatorisk karakter, for eksempel backgammon . Det er ingen enhetlig teori om kombinatoriske elementer i spill. Det er imidlertid matematiske verktøy som kan løse bestemte problemer og svare på generelle spørsmål.

Spill med perfekt informasjon har blitt studert i kombinatorisk spillteori , som har utviklet nye representasjoner, for eksempel surrealistiske tall , samt kombinatoriske og algebraiske (og noen ganger ikke-konstruktive ) bevismetoder for å løse spill av visse typer, inkludert "loopy" spill som kan resultere i uendelig lange sekvenser av trekk. Disse metodene tar for seg spill med høyere kombinatorisk kompleksitet enn de som vanligvis vurderes i tradisjonell (eller "økonomisk") spillteori. Et typisk spill som har blitt løst på denne måten er Hex . Et beslektet studieretning, hentet fra teorien om beregningskompleksitet , er spillkompleksitet , som er opptatt av å estimere beregningsvanskeligheten med å finne optimale strategier.

Forskning innen kunstig intelligens har adressert både perfekte og ufullkomne informasjonsspill som har svært komplekse kombinatoriske strukturer (som sjakk, go eller backgammon) som det ikke er funnet bevisbare optimale strategier for. De praktiske løsningene involverer beregningsheuristikk, som beskjæring av alfa -beta eller bruk av kunstige nevrale nettverk som er opplært av forsterkningslæring , noe som gjør spill mer overkommelige i databehandling.

Uendelig lange kamper

Spill, som er studert av økonomer og spillere i den virkelige verden, er vanligvis ferdige med mange forskjellige trekk. Rene matematikere er ikke så begrenset, og sette teoretikere i spesielle studie spill som varer i uendelig mange trekk, med vinneren (eller annen Utbetalingen) ikke kjent før etter at alle disse trekkene er fullført.

Fokuset på oppmerksomhet er vanligvis ikke så mye på den beste måten å spille et slikt spill, men om en spiller har en vinnende strategi . (Det kan bevises ved bruk av valgfrie aksiomer at det er spill - selv med perfekt informasjon og hvor de eneste resultatene er "vinn" eller "tap" - som ingen av spillerne har en vinnende strategi for.) Eksistensen av slike strategier , for smart utformede spill, har viktige konsekvenser i beskrivende settteori .

Diskrete og kontinuerlige spill

Mye av spillteorien er opptatt av begrensede, diskrete spill som har et begrenset antall spillere, trekk, hendelser, utfall, etc. Mange begreper kan imidlertid utvides. Kontinuerlige spill lar spillerne velge en strategi fra et kontinuerlig strategisett. For eksempel er Cournot-konkurransen vanligvis modellert med at spillernes strategier er ikke-negative mengder, inkludert brøkmengder.

Differensielle spill

Differensielle spill som kontinuerlig forfølgelse og unnvikelse er kontinuerlige spill der utviklingen av spillernes tilstandsvariabler styres av differensialligninger . Problemet med å finne en optimal strategi i et differensialspill er nært knyttet til optimal kontrollteori . Spesielt er det to typer strategier: open-loop-strategiene blir funnet ved hjelp av Pontryagin-maksimumsprinsippet, mens strategiene for lukket sløyfe er funnet ved hjelp av Bellmans Dynamic Programming- metode.

Et spesielt tilfelle med differensialspill er spillene med en tilfeldig tidshorisont . I slike spill er terminaltiden en tilfeldig variabel med en gitt sannsynlighetsfordelingsfunksjon . Derfor maksimerer spillerne den matematiske forventningen til kostnadsfunksjonen. Det ble vist at det modifiserte optimaliseringsproblemet kan omformuleres som et rabattert differensialspill over et uendelig tidsintervall.

Evolusjonær spillteori

Evolusjonær spillteori studerer spillere som justerer sine strategier over tid i henhold til regler som ikke nødvendigvis er rasjonelle eller langsynte. Generelt er utviklingen av strategier over tid i henhold til slike regler modellert som en Markov -kjede med en tilstandsvariabel som den nåværende strategiprofilen eller hvordan spillet har blitt spilt i den siste fortiden. Slike regler kan inneholde etterligning, optimalisering eller overlevelse av de sterkeste.

Innen biologi kan slike modeller representere evolusjon , der avkom adopterer foreldrenes strategier og foreldre som spiller mer vellykkede strategier (dvs. tilsvarer høyere utbytte) har et større antall avkom. I samfunnsvitenskapene representerer slike modeller vanligvis strategisk justering av spillere som spiller et spill mange ganger i løpet av livet, og bevisst eller ubevisst av og til justerer strategiene sine.

Stokastiske utfall (og forhold til andre felt)

Individuelle beslutningsproblemer med stokastiske utfall betraktes noen ganger som "enspillers spill". Disse situasjonene anses ikke som spillteoretiske av noen forfattere. De kan modelleres ved å bruke lignende verktøy innenfor de beslektede fagområdene beslutningsteori , operasjonsforskning og områder med kunstig intelligens , spesielt AI-planlegging (med usikkerhet) og multi-agent system . Selv om disse feltene kan ha forskjellige motivatorer, er den involverte matematikken vesentlig den samme, f.eks. Ved bruk av Markov beslutningsprosesser (MDP).

Stokastiske utfall kan også modelleres når det gjelder spillteori ved å legge til en tilfeldig skuespiller som gjør "tilfeldige trekk" (" bevegelser av natur "). Denne spilleren regnes vanligvis ikke som en tredje spiller i det som ellers er et spill med to spillere, men tjener bare til å gi terningkast når det kreves av spillet.

For noen problemer kan forskjellige tilnærminger til modellering av stokastiske utfall føre til forskjellige løsninger. For eksempel er forskjellen i tilnærming mellom MDP og minimax-løsningen at sistnevnte vurderer det verste tilfellet i forhold til et sett med motstridende trekk, i stedet for å resonnere i forventning om disse trekkene gitt en fast sannsynlighetsfordeling. Minimax -tilnærmingen kan være fordelaktig der stokastiske usikkerhetsmodeller ikke er tilgjengelige, men kan også overvurdere ekstremt usannsynlige (men kostbare) hendelser, noe som dramatisk påvirker strategien i slike scenarier hvis det antas at en motstander kan tvinge en slik hendelse til å skje. (Se Black Swan -teorien for mer diskusjon om denne typen modelleringsspørsmål, spesielt når det gjelder å forutsi og begrense tap i investeringsbank.)

Generelle modeller som inkluderer alle elementer av stokastiske utfall, motstandere og delvis eller støyende observerbarhet (av trekk fra andre spillere) har også blitt studert. " Gullstandarden " anses å være delvis observerbart stokastisk spill (POSG), men få realistiske problemer er beregningsmessig gjennomførbare i POSG -representasjon.

Metagames

Dette er spill hvis spill er utviklingen av reglene for et annet spill, målet eller emnet spillet. Metagames søker å maksimere nytteverdien av regelsettet som er utviklet. Teorien om metaspill er knyttet til mekanismedesignteori .

Begrepet metagame analyse brukes også for å referere til en praktisk tilnærming utviklet av Nigel Howard. der en situasjon er utformet som et strategisk spill der interessenter prøver å realisere sine mål ved hjelp av alternativene som er tilgjengelige for dem. Senere utvikling har ført til formulering av konfrontasjonsanalyse .

Pooling spill

Dette er spill som råder over alle former for samfunn. Pooling -spill er gjentatte spill med skiftende utbetalingsbord generelt over en erfaren vei, og likevektsstrategiene deres tar vanligvis en form for evolusjonære sosiale konvensjoner og økonomiske konvensjoner. Samling av spillteori dukker opp for å formelt gjenkjenne samspillet mellom optimalt valg i ett spill og fremveksten av den kommende oppdateringsbanen for utbetalingstabeller, identifisere invariansens eksistens og robusthet og forutsi avvik over tid. Teorien er basert på topologisk transformasjonsklassifisering av utbetalingstabelloppdatering over tid for å forutsi varians og variasjon, og er også innenfor jurisdiksjonen til beregningsloven om tilgjengelig optimalitet for bestilt system.

Gjennomsnittlig feltspillteori

Mean field game theory er studiet av strategisk beslutningstaking i svært store populasjoner av små interagerende agenter. Denne klassen av problemer ble vurdert i økonomilitteraturen av Boyan Jovanovic og Robert W. Rosenthal , i ingeniørlitteraturen av Peter E. Caines , og av matematiker Pierre-Louis Lions og Jean-Michel Lasry.

Representasjon av spill

Spillene som studeres i spillteori er veldefinerte matematiske objekter. For å være fullstendig definert må et spill spesifisere følgende elementer: spillerne i spillet , informasjonen og handlingene som er tilgjengelig for hver spiller ved hvert avgjørelsespunkt, og gevinsten for hvert utfall. (Eric Rasmusen vises til disse fire "essensielle elementer" av forkortelsen "PAPI".) Et spill teoretiker vanligvis anvender disse elementer, sammen med en løsning konsept av deres valg, for å utlede et sett av likevekts strategier for hver spiller, slik at når disse strategiene brukes, ingen spiller kan tjene på å ensidig avvike fra strategien. Disse likevektsstrategiene bestemmer en likevekt for spillet - en stabil tilstand der enten ett utfall oppstår eller et sett med utfall oppstår med kjent sannsynlighet.

De fleste kooperative spill presenteres i den karakteristiske funksjonsformen, mens de omfattende og de normale formene brukes til å definere ikke -samarbeidende spill.

Omfattende form

Et omfattende formspill

Den omfattende formen kan brukes til å formalisere spill med en tidssekvensering av trekk. Spill her spilles på trær (som avbildet her). Her representerer hvert toppunkt (eller node) et valgpunkt for en spiller. Spilleren er spesifisert med et nummer som er oppført av toppunktet. Linjene ut av toppunktet representerer en mulig handling for den spilleren. Utbetalingen er angitt nederst på treet. Den omfattende formen kan sees på som en generalisering av et avgjørelsestre for flere spillere . For å løse et omfattende formspill må bakoverinduksjon brukes. Det innebærer å jobbe bakover opp spilletreet for å avgjøre hva en rasjonell spiller ville gjort ved det siste toppunktet på treet, hva spilleren med det forrige trekket ville gjort gitt at spilleren med det siste trekket er rasjonell, og så videre til det første toppunktet av treet er nådd.

Spillet på bildet består av to spillere. Måten dette spillet er strukturert på (dvs. med sekvensiell beslutningstaking og perfekt informasjon), " spiller " spiller først "ved å velge enten F eller U (rettferdig eller urettferdig). Neste i rekken, spiller 2 , som nå har sett spiller en ' s flytte, velger å spille enten A eller R . Når spiller 2 har gjort sitt valg, anses spillet som ferdig, og hver spiller får sin respektive gevinst. Anta at spiller 1 velger U og deretter spiller 2 velger A : Spiller 1 får deretter en gevinst på "åtte" (som i virkeligheten kan tolkes på mange måter, den enkleste er i form av penger, men kan bety ting for eksempel åtte feriedager eller åtte erobrede land eller til og med åtte flere muligheter til å spille det samme spillet mot andre spillere) og spiller 2 får en gevinst på "to".

Den omfattende formen kan også fange opp samtidige bevegelser og spill med ufullkommen informasjon. For å representere det, kobler enten en stiplet linje forskjellige hjørner for å representere dem som en del av det samme informasjonsmengden (dvs. spillerne vet ikke på hvilket tidspunkt de er), eller en lukket linje tegnes rundt dem. (Se eksempel i avsnittet om ufullkommen informasjon .)

Normal form

	Spiller 2 velger Venstre	Spiller 2 velger Høyre
Spiller 1 velger Opp	4 , 3	–1 , –1
Spiller 1 velger Ned	0 , 0	3 , 4
Normal form eller utbetalingsmatrise for et 2-spiller, 2-strategispill

Det normale (eller strategiske formet) spillet er vanligvis representert av en matrise som viser spillerne, strategiene og gevinster (se eksemplet til høyre). Mer generelt kan den representeres av en hvilken som helst funksjon som forbinder en gevinst for hver spiller med alle mulige kombinasjoner av handlinger. I det medfølgende eksemplet er det to spillere; den ene velger raden og den andre velger kolonnen. Hver spiller har to strategier, som er spesifisert av antall rader og antall kolonner. Utbetalingen er gitt i interiøret. Det første tallet er utbetalingen mottatt av radspilleren (spiller 1 i vårt eksempel); den andre er gevinsten for spaltespilleren (spiller 2 i vårt eksempel). Anta at spiller 1 spiller opp og at spiller 2 spiller venstre . Så får spiller 1 en gevinst på 4, og spiller 2 får 3.

Når et spill presenteres i normal form, antas det at hver spiller handler samtidig eller i det minste uten å vite den andres handlinger. Hvis spillere har litt informasjon om valgene til andre spillere, blir spillet vanligvis presentert i omfattende form.

Hvert omfattende spill har et ekvivalent normalformspill, men transformasjonen til normalform kan imidlertid resultere i en eksponentiell oppblåsing i størrelsen på representasjonen, noe som gjør det beregningsmessig upraktisk.

Karakteristisk funksjonsform

I spill som har flyttbart verktøy, gis det ikke separate belønninger; Den karakteristiske funksjonen bestemmer heller utbetalingen av hver enhet. Tanken er at enheten som er 'tom', så å si, ikke mottar en belønning i det hele tatt.

Opprinnelsen til denne formen er å finne i boken til John von Neumann og Oskar Morgenstern; når de så på disse tilfellene, gjettet de at når en fagforening dukker opp, virker den mot brøkdelen som om to individer spilte et normalt spill. Den balanserte utbetalingen av C er en grunnleggende funksjon. Selv om det er forskjellige eksempler som hjelper til med å bestemme koalisjonsmengder fra normale spill, ser det ikke ut til at alle i deres funksjonsform kan stammer fra slike. ${\ displaystyle \ mathbf {C}}$ ${\ displaystyle \ left ({\ frac {\ mathbf {N}} {\ mathbf {C}}} \ right)}$

Formelt sett blir en karakteristisk funksjon sett på som: (N, v), hvor N representerer gruppen mennesker og er en normal nytteverdi. ${\ displaystyle v: 2^{N} \ to \ mathbf {R}}$

Slike karakteristiske funksjoner har utvidet seg til å beskrive spill der det ikke er noe flyttbart verktøy.

Alternative spillrepresentasjoner

Alternative former for spillrepresentasjon eksisterer og brukes for noen underklasser av spill eller tilpasset behovene til tverrfaglig forskning. I tillegg til klassiske spillrepresentasjoner, koder noen av de alternative representasjonene også tidsrelaterte aspekter.

Navn	År	Midler	Type spill	Tid
Overbelastningsspill	1973	funksjoner	delsett av n-personers spill, samtidige trekk	Nei
Sekvensiell form	1994	matriser	2-personers spill med ufullkommen informasjon	Nei
Tidsbestemte spill	1994	funksjoner	2-personers spill	Ja
Galla	1997	logikk	n-personers spill med ufullkommen informasjon	Nei
Lokale effektspill	2003	funksjoner	delsett av n-personers spill, samtidige trekk	Nei
GDL	2005	logikk	deterministiske n-person-spill, samtidige trekk	Nei
Spill Petri-garn	2006	Petri nett	deterministiske n-person-spill, samtidige trekk	Nei
Kontinuerlige spill	2007	funksjoner	delsett av 2-personers spill med ufullkommen informasjon	Ja
PNSI	2008	Petri nett	n-personers spill med ufullkommen informasjon	Ja
Action -grafspill	2012	grafer, funksjoner	n-personers spill, samtidige trekk	Nei
Grafiske spill	2015	grafer, funksjoner	n-personers spill, samtidige trekk	Nei

Generelle og anvendte bruksområder

Som en metode for anvendt matematikk har spillteori blitt brukt til å studere et bredt spekter av menneskelig og dyrs atferd. Det ble opprinnelig utviklet innen økonomi for å forstå en stor samling av økonomisk atferd, inkludert oppførsel fra bedrifter, markeder og forbrukere. Den første bruken av spillteoretisk analyse var av Antoine Augustin Cournot i 1838 med sin løsning av Cournot-duopolet . Bruken av spillteori i samfunnsvitenskapen har utvidet seg, og spillteorien er også blitt brukt på politisk, sosiologisk og psykologisk atferd.

Selv om naturforskere fra før tjuende århundre som Charles Darwin kom med spillteoretiske uttalelser, begynte bruken av spillteoretisk analyse i biologi med Ronald Fishers studier av dyreadferd i løpet av 1930-årene. Dette arbeidet går foran navnet "spillteori", men det deler mange viktige funksjoner med dette feltet. Utviklingen innen økonomi ble senere brukt på biologi i stor grad av John Maynard Smith i boken Evolution and theory of Games fra 1982 .

I tillegg til å bli brukt til å beskrive, forutsi og forklare atferd, har spillteori også blitt brukt til å utvikle teorier om etisk eller normativ oppførsel og for å foreskrive slik oppførsel. I økonomi og filosofi har forskere brukt spillteori for å hjelpe til med å forstå god eller riktig oppførsel. Spillteoretiske argumenter av denne typen finnes helt tilbake til Platon . En alternativ versjon av spillteori, kalt kjemisk spillteori , representerer spillerens valg som metaforiske kjemiske reaktantmolekyler kalt "kunnskap". Kjemisk spillteori beregner deretter resultatene som likevektsløsninger til et system med kjemiske reaksjoner.

Beskrivelse og modellering

Et firetrinns tusenbeinsspill

Den primære bruken av spillteori er å beskrive og modellere hvordan menneskelige populasjoner oppfører seg. Noen forskere mener at ved å finne likevekten til spill kan de forutsi hvordan faktiske menneskelige populasjoner vil oppføre seg når de konfronteres med situasjoner som er analoge med spillet som studeres. Dette bestemte synet på spillteori har blitt kritisert. Det blir hevdet at forutsetningene fra spillteoretikere ofte blir krenket når de brukes på virkelige situasjoner. Spillteoretikere antar vanligvis at spillerne handler rasjonelt, men i praksis avviker menneskelig atferd ofte fra denne modellen. Spillteoretikere reagerer ved å sammenligne sine antagelser med de som brukes i fysikk . Selv om deres forutsetninger ikke alltid holder, kan de behandle spillteori som et rimelig vitenskapelig ideal som ligner på modellene som brukes av fysikere . Imidlertid har empirisk arbeid vist at i noen klassiske spill, for eksempel tusenbeinsspill , gjett 2/3 av gjennomsnittsspillet og diktatorspillet , spiller folk regelmessig ikke Nash -likevekt. Det pågår en debatt om viktigheten av disse eksperimentene og om analysen av eksperimentene fanger opp alle aspekter av den aktuelle situasjonen fullt ut.

Noen spillteoretikere, etter arbeidet til John Maynard Smith og George R. Price , har vendt seg til evolusjonær spillteori for å løse disse problemene. Disse modellene antar enten ingen rasjonalitet eller begrenset rasjonalitet fra spillernes side. Til tross for navnet forutsetter evolusjonær spillteori ikke nødvendigvis naturlig seleksjon i biologisk forstand. Evolusjonær spillteori inkluderer både biologisk så vel som kulturell evolusjon og også modeller for individuell læring (for eksempel fiktiv lekedynamikk).

Preskriptiv eller normativ analyse

	Samarbeide	Defekt
Samarbeide	-1, -1	-10, 0
Defekt	0, -10	-5, -5
Den fangens dilemma

Noen forskere ser ikke spillteori som et forutsigende verktøy for menneskers oppførsel, men som et forslag til hvordan mennesker bør oppføre seg. Siden en strategi, som tilsvarer en Nash -likevekt i et spill, utgjør ens beste svar på handlingene til de andre spillerne - forutsatt at de er i (samme) Nash -likevekt - spiller en strategi som er en del av en Nash -likevekt virker passende. Denne normative bruken av spillteori har også blitt utsatt for kritikk.

Økonomi og næringsliv

Spillteori er en hovedmetode som brukes i matematisk økonomi og næringsliv for å modellere konkurrerende atferd hos interaktive agenter . Søknadene inkluderer et bredt spekter av økonomiske fenomener og tilnærminger, for eksempel auksjoner , forhandlinger , sammenslåing og oppkjøpspriser , rettferdig oppdeling , duopoler , oligopoler , dannelse av sosiale nettverk , agentbasert beregningsøkonomi , generell likevekt , mekanismedesign og stemmesystemer ; og på tvers av slike brede områder som eksperimentell økonomi , atferdsøkonomi , informasjonsøkonomi , industriell organisasjon og politisk økonomi .

Denne forskningen fokuserer vanligvis på bestemte sett med strategier kjent som "løsningskonsepter" eller "likevekt" . En vanlig antagelse er at spillere handler rasjonelt. I ikke-samarbeidende spill er den mest kjente av disse Nash-likevekten . Et sett med strategier er en Nash -likevekt hvis hver representerer det beste svaret på de andre strategiene. Hvis alle spillerne spiller strategiene i en Nash -likevekt, har de ingen ensidig insentiv til å avvike, siden strategien er den beste de kan gjøre gitt det andre gjør.

Utbetalingen av spillet er vanligvis tatt for å representere nytten til individuelle spillere.

Et prototypisk papir om spillteori i økonomi begynner med å presentere et spill som er en abstraksjon av en bestemt økonomisk situasjon. Ett eller flere løsningskonsepter velges, og forfatteren demonstrerer hvilke strategisett i det presenterte spillet som er likevekt av riktig type. Økonomer og forretningsprofessorer foreslår to primære bruksområder (nevnt ovenfor): beskrivende og forskrivende .

Den Chartered Institute of Procurement & Supply (CIPS) fremmer kunnskap og bruk av spillteori innenfor rammen av virksomheten anskaffelser . CIPS og TWS Partners har gjennomført en rekke undersøkelser designet for å utforske forståelse, bevissthet og anvendelse av spillteori blant innkjøpsfolk . Noen av hovedfunnene i den tredje årlige undersøkelsen (2019) inkluderer:

bruk av spillteori for innkjøpsaktivitet har økt - den gang var den på 19% for alle respondentene
65% av deltakerne spår at bruken av spillteoriprogrammer vil vokse
70% av respondentene sier at de "bare har en grunnleggende eller en grunnleggende forståelse" av spillteori
20% av deltakerne hadde gjennomført opplæring i arbeid i spillteori
50% av respondentene sa at nye eller forbedrede programvareløsninger var ønskelige
90% av respondentene sa at de ikke har programvaren de trenger for arbeidet sitt.

Prosjektledelse

Fornuftig beslutningstaking er avgjørende for suksess i prosjekter. I prosjektledelse brukes spillteori for å modellere beslutningsprosessen til spillere, for eksempel investorer, prosjektledere, entreprenører, underentreprenører, myndigheter og kunder. Ganske ofte har disse spillerne konkurrerende interesser, og noen ganger er deres interesser direkte skadelige for andre spillere, noe som gjør scenerier for prosjektledelse godt egnet til å bli modellert av spillteori.

Piraveenan (2019) gir i sin anmeldelse flere eksempler hvor spillteori brukes til å modellere prosjektledelsesscenarier. For eksempel har en investor vanligvis flere investeringsalternativer, og hvert alternativ vil sannsynligvis resultere i et annet prosjekt, og derfor må et av investeringsalternativene velges før prosjektcharteret kan produseres. På samme måte har ethvert stort prosjekt som involverer underleverandører, for eksempel et byggeprosjekt, et komplekst samspill mellom hovedentreprenøren (prosjektlederen) og underleverandører, eller blant underleverandørene selv, som vanligvis har flere beslutningspunkter. For eksempel, hvis det er en tvetydighet i kontrakten mellom entreprenøren og underleverandøren, må hver bestemme hvor hardt de skal presse saken sin uten å sette hele prosjektet i fare, og dermed sin egen andel i det. På samme måte, når prosjekter fra konkurrerende organisasjoner lanseres, må markedsføringspersonalet bestemme hva som er den beste timingen og strategien for å markedsføre prosjektet, eller dets resulterende produkt eller tjeneste, slik at det kan få maksimal trekkraft i konkurranse. I hvert av disse scenariene er de nødvendige beslutningene avhengige av beslutninger fra andre spillere som på en eller annen måte har konkurrerende interesser i forhold til beslutningstakeren, og dermed ideelt sett kan modelleres ved hjelp av spillteori.

Piraveenan oppsummerer at to-spillers spill hovedsakelig brukes til å modellere prosjektledelsesscenarier, og basert på identiteten til disse spillerne brukes fem forskjellige typer spill i prosjektledelse.

Spill fra offentlig sektor-privat sektor (spill som modellerer offentlig – private partnerskap )
Entreprenør -entreprenør spill
Entreprenør -underleverandør spill
Underleverandør – underleverandør spill
Spill som involverer andre spillere

Når det gjelder spilltyper, brukes både kooperative så vel som ikke-samarbeidsvillige, normalformede så vel som omfattende-formede, og nullsum samt ikke-nullsummer for å modellere ulike prosjektledelsesscenarier.

Statsvitenskap

Anvendelsen av spillteori på statsvitenskap er fokusert på de overlappende områdene fair fair division , politisk økonomi , offentlig valg , krigsforhandlinger , positiv politisk teori og sosial valgteori . På hvert av disse områdene har forskere utviklet spillteoretiske modeller der spillerne ofte er velgere, stater, spesialinteressegrupper og politikere.

Tidlige eksempler på spillteori anvendt på statsvitenskap er gitt av Anthony Downs . I sin bok fra 1957 An Economic Theory of Democracy anvender han Hotelling -firmaets lokaliseringsmodell på den politiske prosessen. I den downsiske modellen forplikter politiske kandidater seg til ideologier på et endimensjonalt politisk rom. Downs viser først hvordan de politiske kandidatene vil konvergere til ideologien foretrukket av medianvelgeren hvis velgerne er fullt informert, men argumenterer deretter for at velgerne velger å forbli rasjonelt uvitende, noe som gir mulighet for kandidatdivergens. Spillteori ble brukt i 1962 på Cuban Missile Crisis under presidentskapet til John F. Kennedy.

Det er også blitt foreslått at spillteori forklarer stabiliteten til enhver form for politisk regjering. Ved å ta det enkleste tilfellet av et monarki, for eksempel, kan og kan kongen ikke opprettholde sin autoritet ved personlig å utøve fysisk kontroll over alle eller til og med et betydelig antall undersåtter. Suveren kontroll forklares i stedet med anerkjennelse fra hver innbygger at alle andre borgere forventer at hverandre skal se kongen (eller en annen etablert regjering) som personen hvis ordre vil bli fulgt. Koordinerende kommunikasjon mellom innbyggerne for å erstatte suveren er effektivt sperret, siden konspirasjon om å erstatte suveren generelt er straffbar som en forbrytelse. I en prosess som kan modelleres etter varianter av fangens dilemma , vil ingen borgere i perioder med stabilitet finne det rasjonelt å flytte for å erstatte suveren, selv om alle innbyggerne vet at de ville ha det bedre hvis de alle handlet samlet sett.

En spillteoretisk forklaring på demokratisk fred er at offentlig og åpen debatt i demokratier sender klar og pålitelig informasjon om deres intensjoner til andre stater. Derimot er det vanskelig å vite intensjonene til ikke -demokratiske ledere, hvilken effekt innrømmelser vil ha, og om løfter vil bli holdt. Dermed vil det være mistillit og uvilje til å gjøre innrømmelser hvis minst en av partene i en tvist er et ikke-demokrati.

Spillteorien spår imidlertid at to land fortsatt kan gå i krig, selv om lederne deres er klar over kostnadene ved å kjempe. Krig kan skyldes asymmetrisk informasjon; to land kan ha insentiver til å feilrepresentere mengden militære ressurser de har til rådighet, noe som gjør dem ute av stand til å løse tvister på en behagelig måte uten å ty til å kjempe. Dessuten kan krig oppstå på grunn av forpliktelsesproblemer: Hvis to land ønsker å avgjøre en tvist med fredelige midler, men hver ønsker å gå tilbake til vilkårene for dette forliket, kan de ikke ha noe annet valg enn å ty til krigføring. Til slutt kan det oppstå krig som følge av udelelighet.

Spillteori kan også bidra til å forutsi en nasjons svar når det er en ny regel eller lov som skal gjelde for den nasjonen. Et eksempel er Peter John Woods (2013) forskning som undersøker hva nasjoner kan gjøre for å redusere klimaendringer. Wood trodde dette kunne oppnås ved å inngå avtaler med andre nasjoner for å redusere klimagassutslipp . Imidlertid konkluderte han med at denne ideen ikke kunne fungere fordi den ville skape et fangedilemma for nasjonene.

Biologi

	Hauk	Due
Hauk	20, 20	80, 40
Due	40, 80	60, 60
Den hauk-due spill

I motsetning til de innen økonomi, blir gevinsten for spill i biologi ofte tolket som tilsvarende fitness . I tillegg har fokus vært mindre på likevekt som tilsvarer en forestilling om rasjonalitet og mer på de som ville opprettholdes av evolusjonære krefter. Den mest kjente likevekten innen biologi er kjent som den evolusjonært stabile strategien (ESS), først introdusert i ( Maynard Smith & Price 1973 ). Selv om den opprinnelige motivasjonen ikke innebar noen av de mentale kravene til Nash -likevekten , er hver ESS en Nash -likevekt.

I biologien har spillteori blitt brukt som modell for å forstå mange forskjellige fenomener. Den ble først brukt til å forklare utviklingen (og stabiliteten) av de omtrentlige kjønnsforholdene 1: 1 . ( Fisher 1930 ) antydet at kjønnsforholdene 1: 1 er et resultat av evolusjonære krefter som virker på individer som kan sees på som å prøve å maksimere antall barnebarn.

I tillegg har biologer brukt evolusjonær spillteori og ESS for å forklare fremveksten av dyrekommunikasjon . Analysen av signalspill og andre kommunikasjonsspill har gitt innsikt i utviklingen av kommunikasjon blant dyr. For eksempel synes mobbingatferden til mange arter, der et stort antall byttedyr angriper et større rovdyr, å være et eksempel på spontan fremvoksende organisasjon. Maur har også vist seg å utstillings feed-forward atferd beslektet med mote (se Paul Ormerod 's Butterfly Economics ).

Biologer har brukt spillet kylling for å analysere kampadferd og territorialitet.

I følge forordet til Evolution and theory of Games , ifølge Maynard Smith, "paradoksalt nok har det vist seg at spillteori lettere blir anvendt på biologi enn på feltet økonomisk oppførsel som den opprinnelig ble designet for". Evolusjonær spillteori har blitt brukt til å forklare mange tilsynelatende inkongruente fenomener i naturen.

Et slikt fenomen er kjent som biologisk altruisme . Dette er en situasjon der en organisme ser ut til å handle på en måte som gagner andre organismer og er skadelig for seg selv. Dette skiller seg fra tradisjonelle forestillinger om altruisme fordi slike handlinger ikke er bevisste, men ser ut til å være evolusjonære tilpasninger for å øke den generelle formen. Eksempler kan finnes hos arter som spenner fra vampyrflaggermus som får blodet de har fått fra en natts jakt og gir det til gruppemedlemmer som ikke har matet, til arbeiderbier som bryr seg om dronningbien hele livet og aldri parrer seg, til vervet aper som advarer gruppemedlemmer om et rovdyrs tilnærming, selv når det setter personens fare for å overleve i fare. Alle disse handlingene øker den generelle formen for en gruppe, men forekommer til en pris for den enkelte.

Evolusjonær spillteori forklarer denne altruismen med ideen om pårørendevalg . Altruister diskriminerer personene de hjelper og favoriserer slektninger. Hamiltons regel forklarer den evolusjonære begrunnelsen bak dette valget med ligningen $c <b \times r$ , der kostnaden c til altruisten må være mindre enn fordelen b for mottakeren multiplisert med koeffisienten relasjon r . De nærmere beslektede to organismer forårsaker at forekomsten av altruisme øker fordi de deler mange av de samme allelene. Dette betyr at det altruistiske individet, ved å sikre at allelen til sin nære slektning blir videreført gjennom overlevelsen til avkomet, kan gi avkall på muligheten til å få avkom selv fordi det samme antallet alleler blir videreført. For eksempel har det å hjelpe et søsken (i diploide dyr) en koeffisient på 1 ⁄ 2 , fordi (i gjennomsnitt) en person deler halvparten av allelene i søskenets avkom. Å sikre at nok av et søskens avkom overlever til voksen alder, utelukker nødvendigheten av at det altruistiske individet produserer avkom. Koeffisientverdiene avhenger sterkt av omfanget av spillefeltet; for eksempel hvis valget av hvem du vil favorisere inkluderer alle genetiske levende ting, ikke bare alle slektninger, antar vi at avviket mellom alle mennesker bare utgjør omtrent 1% av mangfoldet i spillefeltet, en koeffisient som var 1 ⁄ 2 i mindre felt blir 0,995. På samme måte hvis det anses at annen informasjon enn den av genetisk art (f.eks. Epigenetikk, religion, vitenskap, etc.) vedvarer gjennom tid, blir spillefeltet fortsatt større og avvikene mindre.

Datavitenskap og logikk

Spillteori har spilt en stadig viktigere rolle innen logikk og informatikk . Flere logiske teorier har et grunnlag i spillsemantikk . I tillegg har datavitenskapere brukt spill for å modellere interaktive beregninger . Spillteori gir også et teoretisk grunnlag for feltet multi-agent-systemer .

Hver for seg har spillteori spilt en rolle i online algoritmer ; spesielt k -server -problemet , som tidligere har blitt referert til som spill med flyttingskostnader og spill med forespørsel -svar . Yaos prinsipp er en spillteoretisk teknikk for å påvise lavere grenser for beregningskompleksiteten til randomiserte algoritmer , spesielt online algoritmer.

Fremveksten av Internett har motivert utviklingen av algoritmer for å finne likevekt i spill, markeder, beregningsauksjoner, peer-to-peer-systemer og sikkerhets- og informasjonsmarkeder. Algoritmespillteori og innenfor det algoritmisk mekanisme konstruksjon kombinerer beregningsalgoritme utforming og analyse av komplekse systemer med økonomisk teori.

Filosofi

	Hjort	Hare
Hjort	3, 3	0, 2
Hare	2, 0	2, 2
Hjortjakt

Spillteori har blitt brukt til flere bruksområder i filosofien . Som svar på to artikler av WVO Quine ( 1960 , 1967 ) brukte Lewis (1969) spillteori for å utvikle en filosofisk konvensjonell beretning . På den måten ga han den første analysen av felles kunnskap og brukte den til å analysere lek i koordinasjonsspill . I tillegg foreslo han først at man kan forstå mening når det gjelder signalspill . Dette senere forslaget har blitt forfulgt av flere filosofer siden Lewis. Etter Lewis (1969) spillteoretisk redegjørelse for konvensjoner, har Edna Ullmann-Margalit (1977) og Bicchieri (2006) utviklet teorier om sosiale normer som definerer dem som Nash-likevekt som følge av å omdanne et blandet motivspill til et koordinasjonsspill.

Spillteori har også utfordret filosofer til å tenke i form av interaktiv epistemologi : hva det betyr for et kollektiv å ha felles tro eller kunnskap, og hva er konsekvensene av denne kunnskapen for de sosiale resultatene som følge av interaksjoner mellom agenter. Filosofer som har jobbet på dette området inkluderer Bicchieri (1989, 1993), Skyrms (1990) og Stalnaker (1999).

I etikk har noen (særlig David Gauthier, Gregory Kavka og Jean Hampton) forfattere forsøkt å forfølge Thomas Hobbes 'prosjekt om å hente moral fra egeninteresse. Siden spill som fangenes dilemma utgjør en tilsynelatende konflikt mellom moral og egeninteresse, er det viktig å forklare hvorfor samarbeid er nødvendig av egeninteresse. Denne generelle strategien er en komponent i det generelle sosiale kontraktsynet i politisk filosofi (for eksempler, se Gauthier (1986) og Kavka (1986) ).

Andre forfattere har forsøkt å bruke evolusjonær spillteori for å forklare fremveksten av menneskelige holdninger om moral og tilsvarende dyreadferd. Disse forfatterne ser på flere spill, inkludert fangens dilemma, hjortjakt og Nash -forhandlingsspillet som en forklaring på fremveksten av holdninger om moral (se f.eks. Skyrms ( 1996 , 2004 ) og Sober and Wilson ( 1998 )).

Pris og detaljhandel

Spillteoriprogrammer brukes sterkt i prisstrategiene for detaljhandel og forbrukermarkeder, spesielt for salg av uelastiske varer . Med forhandlere som stadig konkurrerer mot hverandre om forbrukermarkedsandeler, har det blitt en ganske vanlig praksis for detaljister å rabattere visse varer med jevne mellomrom, i håp om å øke gangtrafikken i murstein og mørtel (nettstedbesøk for e-handelsforhandlere ) eller øke salget av tilleggsprodukter eller gratisprodukter.

Black Friday , en populær shoppingferie i USA, er når mange forhandlere fokuserer på optimale prisstrategier for å fange feriehandelsmarkedet. I Black Friday -scenariet spør forhandlere som bruker spillteoriprogrammer vanligvis "hva er den dominerende konkurrentens reaksjon på meg?" I et slikt scenario har spillet to spillere: forhandleren og forbrukeren. Forhandleren er fokusert på en optimal prisstrategi, mens forbrukeren er fokusert på det beste tilbudet. I dette lukkede systemet er det ofte ingen dominerende strategi ettersom begge spillerne har alternative alternativer. Det vil si at forhandlere kan finne en annen kunde, og forbrukere kan handle hos en annen forhandler. Gitt markedskonkurransen den dagen, ligger imidlertid den dominerende strategien for forhandlere i å utkonkurrere konkurrenter. Det åpne systemet forutsetter at flere forhandlere selger lignende varer, og et begrenset antall forbrukere krever varene til en optimal pris. En blogg av en professor ved Cornell University ga et eksempel på en slik strategi, da Amazon priset en Samsung TV $ 100 under detaljverdi, og effektivt underbygde konkurrenter. Amazon utgjorde en del av forskjellen ved å øke prisen på HDMI -kabler, ettersom det har blitt funnet at forbrukere er mindre prisdiskriminerende når det gjelder salg av sekundære varer.

Detaljmarkedet fortsetter å utvikle strategier og anvendelser av spillteori når det gjelder prising av forbruksvarer. De viktigste innsiktene som finnes mellom simuleringer i et kontrollert miljø og virkelige detaljhandelsopplevelser viser at anvendelsen av slike strategier er mer kompleks, ettersom hver forhandler må finne en optimal balanse mellom priser , leverandørforhold , merkevareimage og potensialet for å kannibalisere salg av mer lønnsomme varer.

Epidemiologi

Siden beslutningen om å ta en vaksine for en bestemt sykdom ofte blir tatt av enkeltpersoner, som kan vurdere en rekke faktorer og parametere for å ta denne avgjørelsen (for eksempel forekomst og forekomst av sykdommen, oppfattet og reell risiko forbundet med å pådra seg sykdommen , dødelighet, opplevd og reell risiko forbundet med vaksinasjon og økonomiske kostnader ved vaksinasjon), har teorien blitt brukt til å modellere og forutsi vaksinasjonsopptak i et samfunn.

I populærkulturen

Basert på boken fra Sylvia Nasar fra 1998 , ble livshistorien til spillteoretikeren og matematikeren John Nash omgjort til biopicen A Beautiful Mind fra 2001 , med Russell Crowe i hovedrollen som Nash.
1959 militær science fiction -roman Starship Troopers av Robert A. Heinlein nevnte "spillteori" og "teori om spill". I filmen med samme navn fra 1997 refererte karakteren Carl Jenkins til hans militære etterretningsoppgave som tildelt "spill og teori".
Filmen Dr. Strangelove fra 1964 satiriserer spillteoretiske ideer om avskrekkingsteori . For eksempel er kjernefysisk avskrekking avhengig av trusselen om å gjengjelde katastrofalt hvis et atomangrep blir oppdaget. En spillteoretiker kan hevde at slike trusler ikke kan være troverdige , i den forstand at de kan føre til ufullkommen likevekt i underspillet . Filmen tar denne ideen et skritt videre, med Sovjetunionen som uigenkallelig forplikter seg til en katastrofal atomreaksjon uten å gjøre trusselen offentlig.
1980 -tallets powerpop -band Game Theory ble grunnlagt av sanger/låtskriver Scott Miller , som beskrev bandets navn som hentydning til "studiet av å beregne den mest passende handlingen gitt en motstander ... for å gi deg selv den minste feilen".
Liar Game , en japansk manga fra 2005og TV -serier fra 2007, presenterer hovedpersonene i hver episode et spill eller problem som vanligvis er hentet fra spillteori, som demonstrert av strategiene som ble brukt av karakterene.
Romanen Spy Story fra 1974 av Len Deighton utforsker elementer fra Game Theory med hensyn til kalde krigshærøvelser.
2008 -romanen The Dark Forest av Liu Cixin utforsker forholdet mellom utenomjordisk liv, menneskehet og spillteori.
Den viktigste antagonisten Joker i filmen The Dark Knight presenterer spillteorikonsepter - spesielt fangens dilemma i en scene der han ber passasjerer i to forskjellige ferger bombe den andre for å redde sine egne.

Se også

Lister

Merknader

Referanser og videre lesing

Lærebøker og generelle referanser

Aumann, Robert J (1987), "spillteori", The New Palgrave: A Dictionary of Economics , 2 , s. 460–82.
Camerer, Colin (2003), "Introduction" , Behavioral Game Theory: Experiments in Strategic Interaction , Russell Sage Foundation, s. 1–25, ISBN 978-0-691-09039-9, arkivert fra originalen 14. mai 2011 , hentet 9. februar 2011, Beskrivelse .
Dutta, Prajit K. (1999), Strategier og spill: teori og praksis , MIT Press , ISBN 978-0-262-04169-0. Passer for bachelor- og handelsstudenter. https://b-ok.org/book/2640653/e56341 .
Fernandez, L F .; Bierman, H S. (1998), Spillteori med økonomiske anvendelser , Addison-Wesley , ISBN 978-0-201-84758-1. Passer for studenter på høyere nivå.
Gibbons, Robert D. (1992), Spillteori for anvendte økonomer , Princeton University Press , ISBN 978-0-691-00395-5. Passer for avanserte studenter.
- Utgitt i Europa som Gibbons, Robert (2001), A Primer in Game Theory , London: Harvester Wheatsheaf, ISBN 978-0-7450-1159-2.
Gintis, Herbert (2000), Spillteori utvikler seg: en problemsentrert introduksjon til modellering av strategisk atferd , Princeton University Press, ISBN 978-0-691-00943-8
Green, Jerry R .; Mas-Colell, Andreu ; Whinston, Michael D. (1995), Mikroøkonomisk teori , Oxford University Press , ISBN 978-0-19-507340-9. Presenterer spillteori på en formell måte egnet for kandidatnivå.
Joseph E. Harrington (2008) Spill, strategier og beslutningstaking , Worth, ISBN 0-7167-6630-2 . Lærebok egnet for studenter i anvendte felt; mange eksempler, færre formalismer i konseptpresentasjon.
Howard, Nigel (1971), Paradoxes of Rationality: Games, Metagames, and Political Behavior , Cambridge, MA : The MIT Press, ISBN 978-0-262-58237-7
Isaacs, Rufus (1999), Differential Games: A Mathematical Theory With Applications to Warfare and Pursuit, Control and Optimization , New York: Dover Publications , ISBN 978-0-486-40682-4
Maschler, Michael; Solan, Eilon; Zamir, Shmuel (2013), Game Theory , Cambridge University Press, ISBN 978-1-108-49345-1 . Undervisningslærebok.
Miller, James H. (2003), Game theory at work: how to use game theory to outthink and outmaneuver your competition , New York: McGraw-Hill , ISBN 978-0-07-140020-6. Passer for et generelt publikum.
Osborne, Martin J. (2004), En introduksjon til spillteori , Oxford University Press, ISBN 978-0-19-512895-6. Undervisningslærebok.
Osborne, Martin J .; Rubinstein, Ariel (1994), Et kurs i spillteori , MIT Press, ISBN 978-0-262-65040-3. En moderne introduksjon på høyere nivå.
Shoham, Yoav; Leyton-Brown, Kevin (2009), Multiagent Systems: Algorithmic, Game-Theoretic, and Logical Foundations , New York: Cambridge University Press , ISBN 978-0-521-89943-7, hentet 8. mars 2016
Watson, Joel (2013), Strategy: An Introduction to Game Theory (3. utgave) , New York: WW Norton and Co., ISBN 978-0-393-91838-0. En ledende lærebok på avansert lavere nivå.
McCain, Roger A. (2010), Roger McCains spillteori: En ikke -teknisk introduksjon til analyse av strategi (revidert red.), ISBN 978-981-4289-65-8
Webb, James N. (2007), Spillteori: beslutninger, interaksjon og evolusjon , Matematikk, Springer, ISBN 978-1-84628-423-6Konsekvent behandling av spilltyper som vanligvis kreves av forskjellige anvendte felt, f.eks. Markov beslutningsprosesser .

Historisk viktige tekster

Aumann, RJ ; Shapley, LS (1974), Values of Non-Atomic Games , Princeton University Press
Cournot, A. Augustin (1838), "Recherches sur les principes mathematiques de la théorie des richesses", Libraire des Sciences Politiques et Sociales
Edgeworth, Francis Y. (1881), Mathematical Psychics , London: Kegan Paul
Farquharson, Robin (1969), Theory of Voting , Blackwell (Yale UP i USA), ISBN 978-0-631-12460-3
Luce, R. Duncan ; Raiffa, Howard (1957), Spill og beslutninger: introduksjon og kritisk undersøkelse , New York: Wiley

gjengitt utgave: R. Duncan Luce; Howard Raiffa (1989), Spill og beslutninger: introduksjon og kritisk undersøkelse , New York: Dover Publications , ISBN 978-0-486-65943-5CS1 -vedlikehold: flere navn: forfatterliste ( lenke )

Maynard Smith, John (1982), Evolusjon og teorien om spill , Cambridge University Press , ISBN 978-0-521-28884-2
Maynard Smith, John ; Price, George R. (1973), "The logic of animal conflict", Nature , 246 (5427): 15–18, Bibcode : 1973Natur.246 ... 15S , doi : 10.1038/246015a0 , S2CID 4224989
Nash, John (1950), "Equilibrium points in n-person games", Proceedings of the National Academy of Sciences of the United States of America , 36 (1): 48–49, Bibcode : 1950PNAS ... 36 ... 48N , doi : 10.1073/pnas.36.1.48 , PMC 1063129 , PMID 16588946
Shapley, LS (1953), A Value for n-person Games, In: Contributions to the Theory of Games bind II, HW Kuhn og AW Tucker (red.)
Shapley, LS (1953), Stochastic Games, Proceedings of National Academy of Science Vol. 39, s. 1095–1100.
von Neumann, John (1928), "Zur Theorie der Gesellschaftsspiele", Mathematische Annalen , 100 (1): 295–320, doi : 10.1007/bf01448847 , S2CID 122961988Engelsk oversettelse: "On theory of Strategy Games", i AW Tucker og RD Luce, red. (1959), Bidrag til teorien om spill , v. 4, s. 42. Princeton University Press.
von Neumann, John ; Morgenstern, Oskar (1944), "Theory of games and economic behavior" , Nature , Princeton University Press , 157 (3981): 172, Bibcode : 1946Natur.157..172R , doi : 10.1038/157172a0 , S2CID 29754824
Zermelo, Ernst (1913), "Über eine Anwendung der Mengenlehre auf die Theorie des Schachspiels", Proceedings of the Fifth International Congress of Mathematicians , 2 : 501–4

Andre trykkreferanser

Ben David, S .; Borodin, Allan ; Karp, Richard ; Tardos, G .; Wigderson, A. (1994), "On the Power of Randomization in On-line Algorithms" (PDF) , Algorithmica , 11 (1): 2–14, doi : 10.1007/BF01294260 , S2CID 26771869
Downs, Anthony (1957), An Economic theory of Democracy , New York: Harper
Gauthier, David (1986), Moral etter avtale , Oxford University Press , ISBN 978-0-19-824992-4
Allan Gibbard , "Manipulering av avstemningsordninger: et generelt resultat", Econometrica , bind. 41, nr. 4 (1973), s. 587–601.
Grim, Patrick; Kokalis, Trina; Alai-Tafti, Ali; Kilb, Nicholas; St Denis, Paul (2004), "Making meaning happen", Journal of Experimental & Theoretical Artificial Intelligence , 16 (4): 209–243, doi : 10.1080/09528130412331294715 , S2CID 5737352
Harper, David ; Maynard Smith, John (2003), Animal signaler , Oxford University Press, ISBN 978-0-19-852685-8
Lewis, David (1969), Convention: A Philosophical Study, ISBN 978-0-631-23257-5 (2002-utgaven)
McDonald, John (1950–1996), Strategy in Poker, Business & War , WW Norton , ISBN 978-0-393-31457-1. En lekmanns introduksjon.
Papayoanou, Paul (2010), Game Theory for Business: A Primer in Strategic Gaming , Probabilistic , ISBN 978-0-9647938-7-3.
Quine, WvO (1967), "Truth by Convention", Philosophica Essays for AN Whitehead , Russel and Russel Publishers, ISBN 978-0-8462-0970-6
Quine, WvO (1960), "Carnap and Logical Truth", Synthese , 12 (4): 350–374, doi : 10.1007/BF00485423 , S2CID 46979744
Satterthwaite, Mark A. (april 1975), "Strategisikkerhet og pilens betingelser: eksistens- og korrespondanseteoremer for avstemningsprosedyrer og sosiale velferdsfunksjoner" (PDF) , Journal of Economic Theory , 10 (2): 187–217, doi : 10.1016/0022-0531 (75) 90050-2
Siegfried, Tom (2006), A Beautiful Math , Joseph Henry Press, ISBN 978-0-309-10192-9
Skyrms, Brian (1990), The Dynamics of Rational Deliberation , Harvard University Press , ISBN 978-0-674-21885-7
Skyrms, Brian (1996), Evolution of the social contract , Cambridge University Press, ISBN 978-0-521-55583-8
Skyrms, Brian (2004), hjortjakten og utviklingen av sosial struktur , Cambridge University Press, ISBN 978-0-521-53392-8
Nøktern, Elliott; Wilson, David Sloan (1998), Unto others: the evolution and psychology of uselfish behavior , Harvard University Press, ISBN 978-0-674-93047-6
Thrall, Robert M .; Lucas, William F. (1963), " -person games in partition function form", Naval Research Logistics Quarterly , 10 (4): 281–298, doi : 10.1002/nav.3800100126 ${\ displaystyle n}$
Dolev, Shlomi; Panagopoulou, Panagiota; Rabie, Mikael; Schiller, Elad Michael; Spirakis, Paul (2011), "Rasjonalitetsmyndighet for beviselig rasjonell oppførsel" , Proceedings of the 30th annual ACM SIGACT-SIGOPS symposium on Principles of distributed computing , s. 289–290, doi : 10.1145/1993806.1993858 , ISBN 978-1-4503-0719-2, S2CID 8974307
Chastain, E. (2014), "Algorithms, games, and evolution", Proceedings of the National Academy of Sciences , 111 (29): 10620–10623, Bibcode : 2014PNAS..11110620C , doi : 10.1073/pnas.1406556111 , PMC 4115542 , PMID 24979793

Eksterne linker

James Miller (2015): Introductory Game Theory Videos .
"Spill, teori om" , Encyclopedia of Mathematics , EMS Press , 2001 [1994]
Paul Walker: History of Game Theory Page .
David Levine: Spillteori. Papirer, forelesningsnotater og mye mer.
Alvin Roth: "Game Theory and Experimental Economics side" . Arkivert fra originalen 15. august 2000 . Hentet 13. september 2003 . - Omfattende liste over lenker til informasjon om spillteori på nettet
Adam Kalai: Spillteori og informatikk - Forelesningsnotater om spillteori og informatikk
Mike Shor: GameTheory.net - Forelesningsnotater, interaktive illustrasjoner og annen informasjon.
Jim Ratliff's Graduate Course in Game Theory (forelesningsnotater).
Don Ross: Gjennomgang av spillteori i Stanford Encyclopedia of Philosophy .
Bruno Verbeek og Christopher Morris: Spillteori og etikk
Elmer G. Wiens: Game Theory -Introduction, fungerte eksempler, spill to-personers nullsumspill online.
Marek M. Kaminski: Spillteori og politikk - Pensum og forelesningsnotater for spillteori og statsvitenskap.
Nettsteder om spillteori og sosiale interaksjoner
Kesten Green's Conflict Forecasting at Wayback Machine (arkivert 11. april 2011) - Se papirer for bevis på nøyaktigheten av prognoser fra spillteori og andre metoder .
McKelvey, Richard D., McLennan, Andrew M. og Turocy, Theodore L. (2007) Gambit: Software Tools for Game Theory .
Benjamin Polak: Open Course on Game Theory at Yale -videoer av kurset
Benjamin Moritz, Bernhard Könsgen, Danny Bures, Ronni Wiersch, (2007) Spieltheorie-Software.de: En applikasjon for spillteori implementert i JAVA .
Antonin Kucera: Stokastiske to-spillerspill .
Yu-Chi Ho: Hva er matematisk spillteori ; Hva er matematisk spillteori (#2) ; Hva er matematisk spillteori (#3) ; Hva er matematisk spillteori (#4) -Spillteori for mange personer ; Hva er matematisk spillteori? ( #5) - Avslutning, oppsummering og mitt eget syn

Languages

In other projects