Grim trigger - Grim trigger

I spillteori er grim trigger (også kalt den dystre strategien eller bare dystre ) en triggerstrategi for et gjentatt spill.

I utgangspunktet vil en spiller som bruker dyster utløser samarbeide, men så snart motstanderen defekterer (dermed tilfredsstiller utløserbetingelsen), vil spilleren som bruker grim utløser, defekte for resten av det gjentatte spillet. Siden en enkelt defekt av motstanderen utløser defection for alltid, er grim trigger den mest strengt utilgivelige strategien i et iterert spill.

I Robert Axelrods bok The Evolution of Cooperation kalles den dystre utløseren "Friedman", for en artikkel fra 1971 av James Friedman, som bruker konseptet.

Det uendelig gjentatte dilemmaet til fanger

Det uendelig gjentatte dilemmaet til fanger er et velkjent eksempel på den dystre triggerstrategien. Det normale spillet for to fanger er som følger:

Fange B.
Fange A.
Står stille (samarbeider) Forråde (defekt)
Står stille (samarbeider) 1, 1 -1, 2
Forråde (defekt) 2, -1 0, 0

I fangenes dilemma har hver spiller to valg i hver etappe:

  1. Samarbeide
  2. Defekt for umiddelbar gevinst

Hvis en spiller defekter, vil han bli straffet for resten av spillet. Faktisk har begge spillerne det bedre å tie (samarbeide) enn å forråde den andre, så det å spille (C, C) er den kooperative profilen mens de spiller (D, D), også den unike Nash -likevekten i dette spillet, er straffeprofil.

I den dystre trigger -strategien samarbeider en spiller i den første runden og i de påfølgende rundene så lenge motstanderen ikke avviker fra avtalen. Når spilleren finner ut at motstanderen har forrådt i forrige kamp, ​​vil han deretter hoppe for alltid.

For å evaluere underspillets perfekte likevekt (SPE) for følgende dystre triggerstrategi for spillet, er strategi S* for spillere i og j som følger:

  • Spill C i hver periode med mindre noen noen gang har spilt D tidligere
  • Spill D for alltid hvis noen har spilt D tidligere

Deretter er strategien en SPE bare hvis rabattfaktoren er . Med andre ord, verken spiller 1 eller spiller 2 blir incentivert til å gå ut av samarbeidsprofilen hvis rabattfaktoren er større enn halvparten.

For å bevise at strategien er en SPE, bør samarbeid være det beste svaret på den andre spillers samarbeid, og avhoppet bør være det beste svaret på den andre spilleren.

Trinn 1: Anta at D aldri er spilt så langt.

  • Spiller jeg får utbetalt fra C:
  • Spiller jeg får utbetalt fra D:

Da er C bedre enn D hvis . Dette viser at hvis , som spiller C er Pareto-optimal .

Trinn 2: Anta at noen har spilt D tidligere, så spiller spiller j uansett hva.

  • Spiller jeg får utbetalt fra C:
  • Spiller jeg får utbetalt fra D:

Siden det er optimalt å spille D.

Det foregående argumentet understreker at det ikke er noe insentiv til å avvike (ikke lønnsomt avvik) fra samarbeidsprofilen hvis , og dette gjelder for hvert underspill. Derfor er strategien for det uendelig gjentatte dilemma -spillet til fanger en Subgame Perfect Nash -likevekt.

I gjentatte strategikonkurranser for fangeres dilemma utfører grim trigger dårlig selv uten støy , og å legge til signalfeil gjør det enda verre. Dens evne til å true permanent avgang gir den en teoretisk effektiv måte å opprettholde tillit på, men på grunn av sin utilgivelige natur og manglende evne til å kommunisere denne trusselen på forhånd, fungerer den dårlig.

Dårlig trigger i internasjonale relasjoner

Under den dystre utløseren i internasjonale relasjonsperspektiv, samarbeider en nasjon bare hvis partneren aldri har utnyttet det tidligere. Fordi en nasjon vil nekte å samarbeide i alle fremtidige perioder når partneren defekter en gang, blir ubestemt fjerning av samarbeid en trussel som gjør en slik strategi til en begrensende sak. Selv om en grim utløser er et begrensende tilfelle, sier folkesetningen at en perfekt likevekt kan oppnås hvis begge nasjonene er tålmodige.

Grim trigger i bruker-nettverksinteraksjoner

Spillteori har nylig blitt brukt for å utvikle fremtidige kommunikasjonssystemer, og brukeren i bruker-nettverk-interaksjonsspillet som bruker den dystre trigger-strategien er et av slike eksempler. Hvis den grumme utløseren blir bestemt for å bli brukt i bruker-nettverk-interaksjonsspillet, forblir brukeren i nettverket (samarbeider) hvis nettverket opprettholder en viss kvalitet, men straffer nettverket ved å stoppe interaksjonen og forlate nettverket så snart bruker finner ut motstanderens feil. Antoniou et al. forklarer at "gitt en slik strategi har nettverket et sterkere insentiv til å holde løftet gitt for en viss kvalitet, siden det står overfor trusselen om å miste kunden for alltid."

Sammenligning med andre strategier

Tit for tat og dystre triggerstrategier er av lignende karakter fordi begge er triggerstrategi der en spiller nekter å hoppe først hvis han har evnen til å straffe motstanderen for å ha avbrutt. Forskjellen er imidlertid at den dystre utløseren søker maksimal straff for en enkelt avgang mens tit for tat er mer tilgivende, og tilbyr en straff for hver avgang.

Se også

Referanser