Dilemma del prigioniero

dilemma del prigioniero

King si avvicina a Kong e gli chiede di grattargli la schiena per liberarlo da alcune fastidiose zecche.

Kong esegue scrupolosamente il suo compito.

Poi i due gorilla si salutano e si allontanano.

Dopo qualche tempo Kong chiede a King lo stesso favore, ma riceve solamente uno sgarbato rifiuto.

Kong ha cooperato, ha tentato la “scommessa del dono”, come la chiama Alain Caillé nel libro “Il terzo paradigma”, ma la sua aspettativa è stata tradita.

Il paradigma del dono consta infatti di tre fasi: donare, ricevere e ricambiare.

In realtà il comportamento di King non è la norma nei gruppi di gorilla o altri animali sociali, i quali di solito cooperano tra di loro.

Però, a ben pensarci, perché lo fanno?

Le ricerche per cogliere il significato e le motivazioni del dono, in particolare nella nostra vita sociale, si sono molto intensificate dopo la pubblicazione del “Saggio sul dono” di Marcel Mauss nel 1924.

Dimostrata la grande diffusione, se non addirittura l’universalità, del dono, Mauss connette questo fenomeno a quell’ordine di fatti che va sotto il nome di scambio ed al principio della reciprocità che lo regola: fare dono significa marcare simbolicamente la necessità sociale dello scambio.

Il biologo Richard Dawkins ne “Il gene egoista” espone un’interpretazione del fenomeno del dono, basata sulla sua ipotesi di fondo secondo cui noi siamo semplicemente dei robot programmati per la conservazione del patrimonio genetico.

Il dilemma del prigioniero

La risposta di Dawkins si richiama al cosiddetto Dilemma del Prigioniero, un problema di Teoria dei Giochi ampiamente studiato in matematica ed usato come modello in economia e sociologia.

Una versione popolare del dilemma è la seguente.

Al e Cap vengono arrestati, chiusi in due celle isolate ed interrogati separatamente.

Essi sono fortemente indiziati di rapina a mano armata, ma sanno che la polizia non dispone di prove certe della loro colpevolezza.

Entrambi, assai preoccupati della propria sorte ma poco di quella del complice, fanno questo ragionamento: “Ho a disposizione due possibilità: confessare o tacere.

Infatti, se confesso ed il mio complice non parla, riceverò un trattamento clemente mentre il mio complice se la vedrà davvero brutta.

Ma invece, viceversa, il mio complice confessa ed io no, sarò io ad essere nei guai e lui sarà trattato meglio.

Se entrambi confessiamo, finiremo certo in prigione, ma godremo di un certo sconto sulla pena.

Infine se ci ostiniamo entrambi a tacere, saremo condannati solo per possesso illegale di armi da fuoco.

Insomma, se Al e Cap cooperano tra di loro (situazione CC) – ovvero non denunciano il complice – saranno condannati ad una pena lieve.

Se entrambi tradiscono (TT), saranno condannati ad una pena più alta ma non alla massima (perché hanno confessato).

Se Al tradisce e Cap coopera (TC), allora Al verrà condannato ad una pena scontata, mentre Cap riceverà una dura condanna.

Lo stesso accadrà ad Al, se è Cap l’unico a tradire (CT).

In generale il gioco viene espresso mediante i rispettivi guadagni degli opponenti, con quattro numeri r, p, q, s.

I rispettivi guadagni degli opponenti

Il primo, r, è il guadagno (alto) che ottiene il traditore in una delle situazioni TC o CT; in altre parole, r è il premio per il tradimento.

Il secondo, p, rappresenta il guadagno, uguale per entrambi, della situazione CC di mutua cooperazione.

Il terzo, q, è il guadagno, uguale per entrambi, della situazione TT di reciproco tradimento.

L’ultimo, s, rappresenta il guadagno (basso o nullo) di chi ha cooperato mentre l’altro tradisce; s rappresenta la punizione per l’ingenuo.

I numeri devono essere in ordine decrescente: r > p > q > s.

E’ ovvio che se si gioca una singola partita la strategia ottimale è quella di tradire.

Infatti Al ragiona così: se Cap gioca T, mi conviene giocare T perché q è maggiore di s; se Cap gioca C, mi conviene giocare T perché r è maggiore di p.

Allo stesso modo ovviamente ragiona Cap. Il risultato di una singola giocata sarà dunque TT.

Il caso del gioco ripetuto più volte

Molto più interessante è il caso del gioco ripetuto più volte.

Si suppone che ad ogni ripetizione (prova), i giocatori facciano le loro scelte simultaneamente e, subito dopo una prova, ciascuno venga a conoscenza della scelta effettuata dall’altro.

Inoltre è necessario supporre che il numero delle partite non sia noto a priori.

Il motivo di questa ipotesi è semplice.

Se il numero delle partite fosse, diciamo, dieci, giunti alla nona partita, ci si troverebbe nella stessa condizione del gioco non iterato: si dovrebbe scegliere T o C, ma già sappiamo che TT è la scelta obbligata.

Poiché la strategia della decima partita è fissata, abbiamo di fronte 9 partite e, continuando con questo “ragionamento del gambero”, si prova che alla fine la strategia razionale è, per 10 volte, TT, TT, …

Se però (come nella vita) il gioco può durare a lungo e non si sa quando finisce, vi possono essere strategie più interessanti.

Al può rischiare la “scommessa del dono” e giocare C.

A questo punto Cap dovrebbe capire che Al non sarà tanto stupido da continuare a prendere s mentre lui guadagna r, e che è vantaggioso guadagnare entrambi p piuttosto che q, per cui da un certo punto in poi si avrà CC, CC, …

Il gioco diventa ancora più interessante se vi sono più di due giocatori.

Robert Axelrod, professore di Scienze Politiche all’Università del Michigan, organizzò una serie di tornei tra esperti di teoria dei giochi; gli esperti fornivano “strategie” in base alle quali venivano scritti programmi che si affrontavano l’un l’altro in un computer.

Ogni programma giocava per un certo numero di mosse contro una copia di se stesso, contro tutti gli altri e contro RANDOM, un programma che coopera o tradisce a caso, senza tenere conto delle mosse dell’avversario.

I risultati della ricerca di Axelrod furono estremamente interessanti e pubblicati su Science nel 1980.

Alcune strategie erano complesse ed ingegnose, ma la vincente fu la “Tit for Tat” (TFT), inviata da Anatol Rapoport, psicologo e studioso della teoria dei giochi.

La TFT collabora sempre la prima volta, dopo di che ripete la mossa precedente dell’avversario.

La TFT ottenne sempre il punteggio medio più alto.

Un gioco tanto semplice può dare un insegnamento morale: si inizi sempre con la cooperazione!

A partire dai lavori seminali di Axelrod sono stati scritti più di 1000 articoli scientifici sul Dilemma del Prigioniero e le applicazioni di questo modello all’economia, all’evoluzione, alla politica, all’etica…

Un intero numero della rivista on line “The ethical spectacle” è stato nel 1995 dedicato al “Prisoner’s Dilemma”; il lettore interessato e “navigatore” può visitare il sito http://www.spectacle.org/995/index.html.

Giampietro Allasia e Umberto Cerruti, Università di Torino

Il dilemma del prigioniero

I rispettivi guadagni degli opponenti

Il caso del gioco ripetuto più volte

Il gioco diventa ancora più interessante se vi sono più di due giocatori.

Lascia un commento Annulla risposta