2013年5月19日 星期日

揭示善的力量:談談溝通的藝術(之一)――從博弈論的《囚徒困惑》談起(二)


.
作者: 小岩
【網2010年07月29日】

二、從博弈論的《囚徒困惑》談起

博弈論(game theory)通俗的講就是兩個人下棋的方法,就是關於對弈的決策,又稱對策論,是一門專業學問,是可以問鼎諾貝爾經濟學獎的大學問。人們耳熟能詳的博弈論事例恐怕就是當年的田忌賽馬了。實際上博弈論是研究兩人或多人之間競爭關係的一門學問,它是使用數學模型這個手段研究各種衝突模式的。我們在時事新聞中經常聽到的所謂「零和遊戲」(zero-sum game)或「非零和遊戲」(non-zero-sum game或positive-sum game)或所謂的「雙贏」,其實都是博弈論的術語,這可不是甚麼電子遊戲,這是專業術語。由於本人在二十多年前的一個學長室友是主攻博弈論研究的,所以我對博弈論多少也知曉一些,有所涉足,雖然達不到專業水平,但比起一般人可能知道的還是多一些。由於本文並不是通篇講述博弈論的,本文的核心還是要講述溝通的意義,因為經典博弈論《囚徒困惑》很能說明溝通的意義,所以我們拿出來講,並作為本系列的開篇。由於是借來一用,所以也借用了《30天讓你精通博弈學》一書的許多文字,特此說明。


博弈論是由美國數學家約翰・馮・諾伊曼創立的。1944年他與經濟學家奧斯卡・摩根斯坦合作發表了巨著《博弈論與經濟行為》,將博弈論引入了經濟領域,所以博弈論現在是經濟學的一個分支。

《囚徒困惑》往往是博弈論的開篇,它是數學家塔克1950年在斯坦福大學任客座教授時給一些心理學家們講授的,非常形象易懂,所以博弈論以後將類似問題都稱作《囚徒困惑》,廣為人知,並在哲學、倫理學、社會學、政治學、經濟學乃至生物學等學科中獲得了極其廣泛的應用,本文也可以算作多一個應用吧。

所謂《囚徒困惑》,我這裡只是原樣表述,先不做價值判斷,大意是這樣的:甲、乙兩個人一起帶槍作案,結果被警察發現抓了起來。警方懷疑,這兩個人可能還犯有其它重罪,但沒有證據。於是進行分別審訊,為了分化瓦解對方,警方告訴他們,如果主動坦白,可以減輕處罰;如果頑抗到底,一旦同夥招供,你要不招供就要受到嚴懲。當然,如果兩人都坦白,那麼所謂的「主動交代」就不那麼值錢了,在這種情況下,兩人還要受到懲罰,只不過比一人頑抗到底要輕一些。在這種情形下,兩個囚徒都會作出自己的選擇:或者供出他的同夥,即與警方合作,從而背叛他的同夥;或者保持沉默,也就是與他的同夥合作,而不與警方合作。這樣會出現以下幾種情況(為了更清楚的說明問題,往往給每種情況設定了具體刑期):

如果兩人都不坦白,警察會以非法攜帶槍支罪將二人各判刑一年;

如果其中一人招供而另一人不招供,坦白者作為證人將不會被起訴,另一人將會被判20年;

如果兩人都招供,則兩人都會因罪名各判10年。

那麼這兩個囚徒面對這樣的情況會怎麼辦呢?也就是他們應該選擇互相合作還是選擇互相背叛?

從表面上看,他們應該選擇互相合作,保持沉默,因為這樣他們倆都可以得到好的結果――只判刑一年,這是集體最優解。但是他們不得不仔細考慮對方可能採取甚麼選擇。這就是博弈論的所謂你的決策或選擇並不是孤立的,而是要建立在別人的決策或選擇的基礎之上,反之亦然。於是囚徒的困惑就這樣開始了。假設甲乙兩人都十分精明,而且都只關心減少自己的刑期,並不在乎對方被判多少年,請注意這個假設,認為人都是有私心的。

甲會這樣推理:假如乙不招,我只要一招供,我馬上就可以獲得自由,而不招卻要坐牢一年。顯然招比不招好;假如乙招了,我若不招,則我要坐牢20年,而招了只坐10年,顯然還是以招為好。所以無論乙招認還是不招認,我的最佳選擇都是招認。還是招了吧。

自然,乙也同樣精明與自私,也會如此推理。於是兩人都作出招供的選擇。這對他們兩個人個人來說都是最佳的,即最符合他們個體理性的選擇。依照博弈論的說法,這是本問題的唯一平衡點。只有在這一點上,任何一人單方面改變選擇,他只會得到較差的結果。而在別的點上,比如兩人都拒絕的情況,都有一人可以通過單方面改變來減少自己的刑期。

也就是說,對方背叛,你也背叛將會更好些。這意味着,無論對方如何行動,如果你認為對方將合作,你背叛能得到更多;如果你認為對方將背叛,你背叛你也能得到更多。你背叛對你似乎總是好的。這是一個令人寒心的結論。

為甚麼聰明的囚徒,卻無法得到最好的整體結果?兩個人都招供,對兩個人而言並不是集體的最優的選擇。無論對哪個人來說,兩個人都不招供,要比兩個人都招供要好得多,當然這是以局外人的角度看,是能夠跳出來不在其利益之中的角度看。以上就是對《囚徒困惑》的主要描述。

《30天讓你精通博弈學》一書的作者接下來說,《囚徒困惑》這個問題為我們探討合作是怎樣形成的,提供了極為形象的解說,產生不良結局的原因是因為囚徒二人都基於自私的角度開始考慮選擇,這導致最終合作沒有產生,不能夠達成集體最優解。那麼接下來我們本文的討論也就是從《囚徒困惑》這些假設條件開始的。

(待續)
.

沒有留言:

張貼留言