“在生活當中,我們經常會遇到與共識有關的問題。比如說下面一個故事。a、b兩人有事需要面談,他們要用短信的方式約定明天的見面時間和地點。不過,兩人的時間都非常寶貴,只有確信對方能夠出席時,自己才會到場。a給b發短信說,‘我們明天10:00在西直門地鐵站見吧’。不過,短信發丟了是常有的事情。為了確信b得知了此消息,a補充了一句,‘收到請回復’。b收到了之后,立即回復:‘已收到,明天10:00不見不散’。不過,b也有他自己的擔憂:a不是只在確認我要去了之后才會去嗎?萬一對方沒有收到我的確認短信,屆時沒有到場讓我白等一中午怎么辦?因此b也附了一句:‘收到此確認信請回復’。a收到確認信之后,自然會回復‘收到確認信’。但a又產生了新的顧慮:如果b沒收到我的回復,一定會擔心我因為沒收到他的回復而不去了,那他會不會也就因此不去了呢?為了確保b收到了回復,a也在短信末尾加上了‘收到請回復’。這個過程繼續下去,顯然是沒完沒了。其結果是,a、b兩人一直在確認對方的信息,但卻始終無法達成這么一個共識:‘我們都將在明天10:00到達西直門地鐵站’。”
“有些聰明的人或許會說,那還不簡單,a給b打個電話不就行了嗎?在生活當中,這的確是上述困境的一個最佳解決辦法。有意思的問題出來了:打電話和發短信有什么區別。使得兩人一下就把問題給解決了?主要原因可能是,打電話是‘在線’的,而發短信是‘離線’的。在打電話時,每個人都能確定對方在聽著,也能確定對方確定自己在聽著。等等,因此兩人說的任何一句話,都將會立即成為共識:不但我知道了,而且我知道你知道了,而且我知道你知道我知道了…”
“大法師當眾宣布‘島上至少有一個藍眼睛’,就是讓所有人都知道這一點。并且讓所有人都知道所有人都知道這一點,并且像這樣無限嵌套下去。這就叫做某條消息成為大家的共識。讓我們來看一下,如果這個消息并沒有成為共識,事情又會怎樣。”
“為了簡單起見,假定島上只有兩個藍眼睛。這兩個人都能看見對方是藍眼睛。因而他們都知道‘島上至少有一個藍眼睛’。但是,由于法師沒有出現,因此他倆都不知道,對方是否知道‘島上有藍眼睛’這件事。所以,到了第二天的時候,之前的推理就無法進行下去了,每個人心里都會想,對方沒有自殺完全有可能是因為對方不知道‘島上有藍眼睛’這件事。”
“類似地。如果島上有三個藍眼睛,那么除非他們都知道,所有人都知道所有人都知道了‘島上有藍眼睛’這件事。否則第四天的推理是不成立的,到了第三天,會有人覺得,那兩個人沒自殺僅僅是因為他們不知道對方也知道‘島上有藍眼睛’這件事罷了。繼續擴展到100個藍眼睛的情形,你會發現,‘互相知道’必須得嵌套100層。才能讓所有推理能順利進行下去。”
“實際上,我的題目條件也是不完整的。島上的所有人都非常清楚地知道上面這些條件和規則。應該改為:上面這些條件和規則是島上所有人的共識,或者說:島上所有人都知道上面這些條件和規則。并且所有人都知道所有人都知道,等等等等。如果沒有這個條件,剛才的推理也是不成立。比方說,雖然所有人都是無限聰明的,但是如果大家不知道別人也是無限聰明的,或者大家不知道大家知道別人也是無限聰明的,推理也會因為‘昨晚他沒自殺僅僅是因為他太笨了沒推出來’之類的想法而被卡住。”
韓衍聽完之后眼前一亮,似乎明白了。
劉猛教授繼續說道:“其實人的大腦很難想象這道題目的假設,所有的人都具有推理的能力,如果是用計算機程序實現的話就清楚多了,相當于每個人的思維都在無限循環之中,而大法師說的那句話則是打破所有人無限循環的中斷,將觸發一系列的連鎖反應。”
韓衍若有所思,劉猛心情很好,道:“我先不告訴你最后結果是什么不如先來討論博弈論。”
“1950年,加拿大數學家alberttucker提出了著名的‘囚徒困境‘。設想某個犯罪團伙的兩名成員被捕,他們被關在兩個不同的房間里分別受審。警方向兩人說了完全相同的話:首先坦言因證據不足,只能將兩人各判有期徒刑一年;但是,只要其中一人招供而另一人保持沉默,則前者會無罪釋放,后者會判有期徒刑三年;另外,如果兩人都招供了,則兩人各判有期徒刑兩年。如果兩人都保持沉默,他們加起來總共只關兩年,這對他們來說是最好的結局。但實際上呢?每個人都會發現,不管對方做出的決定是什么,如實招供總能讓自己少關一年。其結果就是,兩個人都會不約而同地選擇招供,于是兩人各判兩年,這對他們來說其實是最壞的結局。”
“囚徒困境要想成立,有個條件必不可缺:兩人今后永遠不會見面。這樣,每個人才能放心大膽地背叛對方,不用擔心自己會遭到報復。如果決策并不是一次性的,決策雙方今后還會反復相遇,情況就不一樣了。robertaxelrod的一書中提到,第一次世界大戰的西線戰場上曾經出現過一個非常有趣的現象:塹壕戰當中的英德士兵“相識”一段時間之后,會逐漸產生一種非常微妙的合作機制。比方說,一方的食物補給車輛駛入戰區后,另一方本來可以輕而易舉地炸掉它。但卻并沒有這么做,因為他們知道這么做的后果——對方會采取報復行動,這會搞得雙方都沒吃沒喝。久而久之,這種合作甚至會發展到,德軍士兵在英軍的射程范圍內來回走動。英軍士兵竟然無動于衷!”
“這是一個非常復雜的社會。每個人都想讓自己的利益最大化,于是在不該有合作的地方出現了合作,在不該有背叛的地方出現了背叛。數學家們建立了各種模型,來描述人們在利益驅動下制定決策的方式,于是就有了這樣一個數學分支——博弈論。”
“枯燥的說博弈論可能不好理解,下面我就給你講幾個例子。你自然就明白什么叫絕對理性和無限死循環。”劉猛教授笑著說道。
某家航空公司把兩個行李箱搞丟了。這兩個行李箱里裝的東西完全相同,但卻屬于a、b兩名不同的旅客。航空公司派出一名經理,與這兩名旅客協商賠償事宜。經理向這兩名旅客解釋說,航空公司方面無法為丟失的行李箱估價,因此需要讓兩名旅客各自獨立地寫下一個2到100之間的正整數。表示自己對行李箱的估價,單位是元。
如果這兩名旅客寫下的數完全相同,航空公司方面就認為這是行李箱的真實價值,并按照這個數目對兩名旅客進行賠付。但是,如果其中一名旅客寫下的數比另一名旅客更低,那么航空公司方面將會認為,前者的估價是真實的。航空公司將按照這個估價對兩名旅客進行賠付,但報出此價的旅客會多得2元作為獎勵。另一名旅客則會少得2元,作為估價過高的懲罰。舉個例子:若a、b兩人分別估價50元和40元,則a將會獲得38元。b將會獲得42元。
如果兩名旅客都是絕對理性的,并且上述所有條件都已經成為這兩名旅客的共識。那么,這兩名旅客將會寫下怎樣的數呢?
如果你是第一次聽說這個問題的話,你肯定不會相信這個問題的答案:最終結果是,兩個人都只估價2元。為什么呢?
容易想到,對于這兩個人來說。最好的結局便是兩人都估價100元,這樣一來。兩個人都會得到100元錢。然而,其中一個人肯定會動一下歪腦筋:“如果對方估價100元。我估價99元,那么航空公司會認為我是誠實的,我就可以得到101元了,而對方只能得到97元。”另一個人其實也想到了這一點,因而兩個人會不約而同地寫下99元,其結果就是,兩個人各得99元。
有趣的是,如果兩個人都想到了對方也會寫下99元,那么每個人都會發現,把自己的估價重新提高到100元是無益的,但是把自己的估價減小到98元,會讓自己的收益從99元提高到100元。結果,兩個人都會把估價改為98元。總之,兩個人都意識到了這一點:不管對方報多少錢,我比對方少報1元總是最佳的選擇。于是,這種惡性的心理戰將會一直持續下去,直到每個人都推出,自己應該把估價從3元改為2元。到了這一步,兩人終于不再有爭斗,于是就得到了剛才所說的答案。
如果這個時候有個人站出來說一句:“你們兩個這樣惡性斗爭下去每個人都會拿到最少的錢。”這句話看似是一句廢話,實際并非如此,這會讓兩人達成一種共識,不再繼續爭斗下去。
再者說,讓10個人玩一個這樣的游戲:給每個人都發100元錢,然后每個人都可以選擇捐出一部分錢;籌到的捐款將會用于投資,最后將會收回雙倍的錢,并且均分給所有人,即使大家出的錢不一樣多。最好的結局固然是,每個人都拿出100元,最終每個人都會得到200元。
但是,理性的決策者會這么想:“如果我只出99元錢,那么用于投資的基金就只有999元,最后大家將會獲得1998元的回報,每個人都會分得199.8元;但是,別忘了我手里還有1元,因此最終加在一塊兒,我不就有了200.8元了嗎?事實上,如果我干脆一分錢也不出,我就能坐享180元的回報,我手里將會擁有280元!”如果每個人都是絕對理性的,那么每個人都會發現,自己比別人出的少,總能讓自己更賺一些。最后的結果竟然是,每個人都不愿意拿出一分錢!
在生活當中,這樣的現象也很多,比方說中小學生補課的問題。最好的情況應該是,每個學校都不補課,這既保證了公平性,又減輕了孩子的負擔。然而,每個學校都會想,如果別的學校不補課,我們學校哪怕只補一個小時,我們就賺到了。當然,等到所有學校都意識到這一點后,每個學校都會爭著再多補一個小時。其結果就是,每個學校都在沒完沒了地補課,于是就有了這樣的悲慘現狀。
在博弈論中,如果玩家們都做好決策并把所做的決策公之于眾后,每個玩家都發現,單方面地修改自己的決策不會讓自己更賺,我們就把此時眾人的決策叫做一個“納什均衡”。這是以美國數學家約翰納什的名字命名的,看過電影應該對這個名字非常熟悉,所以說,研究博弈論很容易把自己搞成神經病,很容易陷入思維的無限死循環中,而且越是聰明的人研究博弈論越容易被關進精神病院。
劉猛最后說道:“回到我們藍眼睛的問題,也就是說:大法師說完那句話之后,第101天,所有藍眼睛的人都會發現自己是藍眼睛而集體自殺,第102天,剩下的900個棕色眼睛的人因為藍眼睛的人死光了,也就知道了自己眼睛的顏色也會集體自殺,最終的結果就是這個島徹底滅絕了。”
韓衍敲了敲腦袋,只覺得很腫脹,不好意思道:“劉猛教授,我的頭好疼,需要回去休息一下了。”