五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊

策梅洛定理:游戲開始時(shí),結(jié)局就定了!博弈論與納什均衡(一)

2022-11-21 15:25 作者:李永樂老師官方  | 我要投稿

各位同學(xué)們大家好!我是李永樂老師。


之前我做了兩個(gè)系列節(jié)目:《漫談相對(duì)論》和《從亞里士多德到牛頓的宇宙》,我想,第三個(gè)系列節(jié)目就換換口味,講講數(shù)學(xué)的一個(gè)小分支,在經(jīng)濟(jì)學(xué)上又很有用的學(xué)問——博弈論吧。


我在北大讀書時(shí),學(xué)過一點(diǎn)經(jīng)濟(jì)學(xué),但是沒有系統(tǒng)學(xué)習(xí)過博弈論這門課。今天所講的都是我個(gè)人對(duì)博弈論的理解,如果有不準(zhǔn)確的地方,歡迎大家批評(píng)指正。在這個(gè)系列中,我把之前零零散散講過的博弈論內(nèi)容進(jìn)行了總結(jié),希望大家喜歡我的講述。


“弈”這個(gè)字,原本意思是下棋。請問各位同學(xué),你會(huì)下棋嗎?你下棋輸過嗎?如果我說,圍棋也好,象棋也好,其實(shí)都是有必勝法的,你們相信嗎?


我們假設(shè)有一個(gè)非常簡單的游戲,先手A和后手B各做一次決策(選擇上路或者下路),根據(jù)二人決策的結(jié)果,游戲的勝負(fù)如下。通過這個(gè)表格,你能知道游戲的結(jié)果是誰獲勝嗎?


圖片


也許有同學(xué)認(rèn)為:A的贏面大一些,因?yàn)锳有2種可能會(huì)贏,而B只有一種可能會(huì)贏。事實(shí)并非如此。這盤棋的結(jié)果一定是和棋(除非有一方實(shí)在腦子不太好用,才會(huì)輸?shù)簦?/p>

我們可以畫一個(gè)游戲樹來解釋:


圖片


我們看:如果先手A選擇上方,游戲進(jìn)入到一個(gè)由進(jìn)行B進(jìn)行決策的分支,這叫做一個(gè)子游戲。在這個(gè)子游戲中,B選上方就A獲勝,B選下方就B獲勝,B要選擇對(duì)自己有利的,所以他一定選擇下方。這個(gè)子游戲的結(jié)局是固定的,就是B獲勝。


如果先手A選擇下方,游戲進(jìn)入到另一個(gè)由B做決策的子游戲中,這時(shí)B選上方就A獲勝,B選下方就和棋,B要選擇對(duì)自己有利的,所以這個(gè)子游戲的結(jié)局一定是和棋。


我們再來考慮A:若A走上方,進(jìn)入子游戲1,一定B獲勝;A走下方,進(jìn)入子游戲2,一定和棋。A也要選擇對(duì)自己有利的,所以A選擇下方。最終的游戲就是和棋。


圖片


如果游戲復(fù)雜一些,也不過是分支變多,長度變長,但是只要我們從最后端的子游戲開始,一層層倒推,就一定能推算出在最優(yōu)策略下,游戲到底是先手勝,還是后手勝,還是和棋,這種勝負(fù)是不可避免的。


其實(shí),象棋也好,圍棋也好,它們與我剛才舉的例子沒有本質(zhì)不同,只是復(fù)雜度高得多。而且,由于制定了一些勝負(fù)以及和棋規(guī)則,下棋的步驟也是有限的。


理論上講,我們是可以畫出圍棋的游戲樹的,如果我們遍歷了所有情況,就能知道圍棋結(jié)局到底是先手必勝,還是后手必勝,或者一定是和棋了。只是,這個(gè)過程過于復(fù)雜。


以圍棋為例。圍棋在19x19=361個(gè)格子上輪流放棋子,所以每個(gè)格子有黑白空三種可能,整個(gè)圍棋棋盤上的狀態(tài)數(shù)上限是33?1=1.7×101?2,去掉一些重復(fù)和對(duì)稱,圍棋的狀態(tài)復(fù)雜度大約是101?2量級(jí)。


圖片


要知道:宇宙中的原子個(gè)數(shù)只有大約100?2個(gè),就算用宇宙中的一個(gè)原子代表一個(gè)圍棋局面,窮盡宇宙中所有的原子,也不能表示出圍棋所有的棋局局面。


圍棋的游戲樹就更難畫了。因?yàn)閲蹇梢蕴嶙樱辛丝瞻椎牡胤娇梢岳^續(xù)下,所以并不一定是填滿了棋盤就結(jié)束。不過,我們可以估計(jì)游戲樹的總層數(shù)和每一層的平均分支。根據(jù)統(tǒng)計(jì)和計(jì)算:一盤圍棋的平均手?jǐn)?shù)是150手,每一手的平均分支數(shù)是250種,所以整個(gè)圍棋的游戲樹復(fù)雜度大約是2501??≈103??。


圖片


理論上講,如果我們遍歷了所有103??種情況,就能知道圍棋結(jié)局到底是先手必勝,還是后手必勝,或者一定是和棋了。但是,這個(gè)計(jì)算量實(shí)在太大了。之前世界上最快的計(jì)算機(jī)富岳每秒最高可以計(jì)算100億億次浮點(diǎn)運(yùn)算,假如1次浮點(diǎn)運(yùn)算就能算出一條路徑,那么算完所有圍棋游戲的可能情況,需要103?2秒,而宇宙的年齡只有138億年,大約只等于101?秒。


圖片


雖然我們無法計(jì)算出這個(gè)最優(yōu)策略,但是顯然,這個(gè)最優(yōu)策略一定是存在的。

不僅僅是圍棋,所有的明棋都是這樣,只不過復(fù)雜度不同而已。


圖片


1913年,數(shù)學(xué)家策梅洛證明:對(duì)于一個(gè)兩人的完全信息游戲,一定存在一個(gè)策略,要么先手一定獲勝,要么后手一定獲勝,要么雙方一定平局,這就是澤梅洛定理。


圖片
策梅洛


策梅洛定理告訴我們:假設(shè)雙方都是棋類大師,對(duì)游戲樹了如指掌,這時(shí)候他們一定會(huì)采用統(tǒng)一的策略,讓游戲向固定的方向發(fā)展,最終的結(jié)局也是固定的。


因?yàn)?,任何一個(gè)人單方面的改變決策,都會(huì)對(duì)自己不利。正如我們剛才舉例的那個(gè)小游戲,如果A改變決策,將會(huì)讓B獲勝;如果B改變決策,將會(huì)讓A獲勝,雙方都為了自己的利益考慮,一定會(huì)出現(xiàn)A選擇下路,B也選擇下路的情況,最后游戲就一定是和棋。


實(shí)際上,在許多的博弈過程,都和下棋很像,參與博弈的幾方能采取的策略都是有限的。在1950年,著名的數(shù)學(xué)家約翰納什證明了一個(gè)更加普遍的結(jié)論:


圖片


只要參與博弈的幾方策略都是有限的,那么就一定存在一種平衡狀態(tài),大家都會(huì)采用這種平衡策略,而沒有單方面改變策略的動(dòng)力。這種平衡狀態(tài)就叫做納什均衡。這個(gè)規(guī)律就叫做納什定理。


剛才舉的下棋的例子,最優(yōu)策略就是納什均衡,策梅洛定理其實(shí)是納什定理的一個(gè)例子。在我們所處的世界中,無論是政治還是經(jīng)濟(jì),都充滿了博弈論和納什均衡的例子。你想了解更多嗎?關(guān)注我,下一回繼續(xù)帶大家漫談博弈論。





策梅洛定理:游戲開始時(shí),結(jié)局就定了!博弈論與納什均衡(一)的評(píng)論 (共 條)

分享到微博請遵守國家法律
宁河县| 苍山县| 涿州市| 叶城县| 浦县| 阳山县| 荔浦县| 黄石市| 锡林浩特市| 丹东市| 体育| 九寨沟县| 伊川县| 嘉定区| 景宁| 兴安县| 芷江| 辽宁省| 弋阳县| 商丘市| 阜新市| 广南县| 泰兴市| 金坛市| 青阳县| 长春市| 富民县| 鹤岗市| 页游| 临颍县| 石嘴山市| 桓台县| 鄂托克旗| 乐昌市| 察哈| 德化县| 南宫市| 莱州市| 武夷山市| 汽车| 玛曲县|