導(dǎo) 信任的進(jìn)化是一個(gè)博弈論游戲,那么這些博弈論是什么,他們各自的博弈原理又是什么?今天蕾米為大家?guī)硇湃蔚倪M(jìn)化博弈論,信任的進(jìn)化博弈原理解析,一起來了解一下游戲背后的哲理吧! 最...

信任的進(jìn)化是一個(gè)博弈論游戲,那么這些博弈論是什么,他們各自的博弈原理又是什么?今天蕾米為大家?guī)硇湃蔚倪M(jìn)化博弈論,信任的進(jìn)化博弈原理解析,一起來了解一下游戲背后的哲理吧!

最高分49分 最低分7分 博弈原理解析 網(wǎng)頁版在線玩

?罪犯困境

這是本游戲的基本博弈模型,對(duì)此最經(jīng)典的闡述為:兩個(gè)嫌疑犯作案后被警察抓住,分別關(guān)在不同的屋子里接受審訊。警察知道兩人有罪,但缺乏足夠的證據(jù)。警察告訴每個(gè)人:如果兩人都抵賴,各判刑一年;如果兩人都招供,各判八年;如果兩人中一個(gè)招供而另一個(gè)抵賴,坦白的放出去,抵賴的判十年。于是,每個(gè)囚徒都面臨兩種選擇:招供或抵賴。然而,不管同伙選擇什么,每個(gè)囚徒的最優(yōu)選擇是招供:如果同伙抵賴、自己招供的話放出去,抵賴的話判一年,招供比不招供好;如果同伙招供、自己也招供的話判八年,比起抵賴的判十年,招供還是比抵賴的好。結(jié)果,兩個(gè)嫌疑犯都選擇招供,各判刑八年。

信任的進(jìn)化博弈論 信任的進(jìn)化博弈原理解析

就像這個(gè)游戲機(jī)一樣,當(dāng)你投一個(gè)硬幣進(jìn)去,對(duì)方就會(huì)得到兩枚硬幣。顯然,對(duì)于總體來說,選擇合作得到的回報(bào)最高(每人失去1個(gè),得到2個(gè),總和4,增加2個(gè)),但對(duì)個(gè)人而言風(fēng)險(xiǎn)也是最大的(對(duì)方選擇欺騙,你-1,對(duì)方3,總和2),所以在這種局面下,欺騙變成了最優(yōu)策略。這樣的局面,歸根到底,是因?yàn)殡p方缺乏溝通而導(dǎo)致的。在無法信賴對(duì)手的一局游戲中,欺詐師往往會(huì)成為最后的贏家。有意思的是,囚徒困境推廣到確定的N局游戲中也是成立的。原因如下:對(duì)于第N局,由于不用擔(dān)心之后被報(bào)復(fù)(最后一局了嘛),最優(yōu)策略顯然是欺騙。對(duì)于第N-1局,由于已經(jīng)知道了對(duì)方下一局的最優(yōu)策略是欺騙,為了防止受到更多損失,最優(yōu)策略顯然也是欺騙。對(duì)于第N-2局,……所以,對(duì)于確定的N局游戲,最優(yōu)策略永遠(yuǎn)是欺騙。

信任的進(jìn)化博弈論 信任的進(jìn)化博弈原理解析

?重復(fù)困境

這個(gè)升級(jí)版的囚徒困境源于一個(gè)全世界的重復(fù)囚徒困境競(jìng)賽(也是這個(gè)游戲的來源)。在這個(gè)競(jìng)賽中,許多博弈論專家將自己的策略編寫成程序,和其它程序進(jìn)行博弈(沒錯(cuò),游戲里的策略是其中的一些)?經(jīng)過很多很多輪競(jìng)賽后,出人意料的是,最佳確定性策略被認(rèn)為是“以牙還牙”,這是阿納托爾·拉波波特(Anatol Rapoport,《合作的進(jìn)化》作者,也是競(jìng)賽的發(fā)起人)開發(fā)并運(yùn)用到錦標(biāo)賽中的方法。這個(gè)策略只不過是在博弈的開頭選擇合作,然后,采取對(duì)手前一回合的策略。

信任的進(jìn)化博弈論 信任的進(jìn)化博弈原理解析

在完美的博弈中,復(fù)讀機(jī)是最有效的。這種策略較好地規(guī)避了被欺騙的風(fēng)險(xiǎn)(被騙了還是要漲點(diǎn)記性),而對(duì)于合作者,顯然雙方都能獲得較高的利潤(rùn)。而對(duì)于有可能失誤的博弈(玩家準(zhǔn)備合作,但是由于各種不可控因素造成背叛的結(jié)果),更好些的策略是“寬恕地以牙還牙”,即當(dāng)你的對(duì)手背叛,在下一回合中你無論如何要以小概率(大約是1%~5%)時(shí)而合作一下。這是考慮到偶爾要從循環(huán)背叛的受騙中復(fù)原。至于更自由的博弈(可以選擇對(duì)手),比較好的策略是:前幾局選擇合作進(jìn)行試探,被多次欺騙后不再與此對(duì)手博弈(排擠掉欺詐師)

信任的進(jìn)化博弈論 信任的進(jìn)化博弈原理解析

最終,博弈學(xué)家統(tǒng)計(jì)所有策略得到這樣一個(gè)結(jié)論:最好的策略滿足四個(gè)因素:友善,報(bào)復(fù),寬容,不嫉妒。簡(jiǎn)單來說,表露合作的意向(讓潛在的合作者與你合作),不盲目樂觀(避免一直被欺詐師欺騙),適當(dāng)包容小的失誤(防止因誤會(huì)導(dǎo)致的互相不信任),不追求比對(duì)手更高的得分(更高意味著惡性競(jìng)爭(zhēng))。因此,一些學(xué)者們據(jù)此得到一種給人以烏托邦印象的結(jié)論,認(rèn)為自私的個(gè)人為了其自私的利益會(huì)趨向友善、寬恕和不嫉妒,即人人為我的社會(huì)可能建立在對(duì)利益的追求上。

信任的進(jìn)化博弈論 信任的進(jìn)化博弈原理解析

事實(shí)上,囚徒困境并不是那么簡(jiǎn)單,復(fù)讀機(jī)也并不總是最終的贏家。在短期博弈上,最有效的往往是欺騙。?在背叛的回報(bào)更高時(shí),欺騙往往能獲得最終勝利。?在失誤率過高時(shí),結(jié)果趨于混沌。

信任的進(jìn)化博弈論 信任的進(jìn)化博弈原理解析