時間:2023-10-16 15:59:51
序論:在您撰寫博弈論的方法時,參考他人的優秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發您的創作熱情,引導您走向新的創作高度。
[中圖分類號]C3
[文獻標識碼]A
[文章編號]1671-511X(2012)04-0020-03
博弈論是研究理性人的互動的理論,或者說研究交互決策的理論。1928年,馮·諾依曼證明了博弈論的基本原理,宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦合著的《博弈論與經濟行為》將二人博弈推廣到n人博弈結構并將博弈論系統應用于經濟領域,奠定了這一學科的基礎和理論體系。1950-1951年,約翰·納什利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅定的基礎。塞爾頓、哈桑尼、謝林、奧曼等人的研究也大大推動了博弈論的發展。因此,盡管博弈論是一門新生的學科,但是它今天已經發展成為有較完善的理論體系的科學。
今天,博弈論已經成為社會科學的通用方法論。盡管它是演繹科學,對社會現象有強大的解釋力,然而,由于其理想主體的假定使得其演繹出的理論解與實際博弈結果存在差異。許多實驗經濟學家通過博弈實驗研究實際中人們的博弈過程,分析博弈論的演繹解與博弈實驗結果之間的差異。如2002年諾貝爾經濟學獎就頒發給了丹尼爾·卡尼曼和邁農·史密斯,他們是實驗經濟學的先驅。今天在西方學術界通過實驗來驗證博弈的理論結果已經成為一種潮流。本文下面設計并進行了一個博弈實驗,通過分析實驗結果與理論解的差異,分析博弈論作為社會科學方法論的局限性,并提出改進的可能路徑。
一、博弈實驗及結果分析
1 實驗描述
我們設計了如下的一個博弈實驗。該實驗的參與人是南京大學選修文化素質課“邏輯與科學方法基礎”的大學生,他們是二三年級的學生,文理科學生均有。
該實驗是以試題的形式進行的,該試題作為期末試卷中的最后一道題。該題目為:
在0-100之間選擇一個數字,規則是:若你選擇的數字“是或最接近”在座同學所選擇的數字的平均數的2/3(即在座同學所選數的總和除以總人數之后所得數字的2/3,如:若平均數為90,你應當選2/3×90=60),你將獲勝。請給出你選擇的理由。
實驗說明:
(1)實驗參與者即參加考試的學生,事前不知道這是一個實驗;
(2)該課程教師以講座的形式給實驗參與者傳授過博弈論知識,但沒有提到所進行的博弈;
(3)因為(2),他們中的大多數掌握“博弈”、“公共知識”等概念;
(4)試卷是保密的,沒有任何學生預先知道考試內容,考試過程中學生間無任何交流;
(5)該博弈的理論解(即納什均衡)為0或1。
2 實驗結果
對于考試中的每個學生,在這個博弈實驗中他能夠獲勝的關鍵是,他要準確猜測他人是如何選擇的,一旦他猜測正確,他將他猜測的平均數乘以2/3便是獲勝答案。
共有176人參加了考試。排除掉5個不明確的選擇,供分析的實際選擇數為171個(其中3個選擇非整數)。實驗結果為(按照數字大小排序):
“0”:46人;“1”:14人;“5”:1人;“9”:1人;“10”:4人;“12”:1人;“15”:3人;“20”:3人;“22”:18人;“22.44”:1人;“24”:1人;“25”:3人;“28”:2人;“29”:1人;“30”:4人;“32”:2人;“33”:24人;“100/3”:1人;“34”:4人;“35”:1人;“36”:2人;“38”:3人;“39”:1人;“40”:6人;“43”:1人;“44”:5人,“45”:3人;“47”:1人;“50”:3人;“58”:1人;“59”:1人;“60”:2人;“66”:1人;“67”:3人;“”:1人;“72”:1人;“75”:1人。
3 結果分析
在這些所選擇的數字中,最大的數字為75,最小的數字為0。171個數字相加后的平均數為21.91,本博弈勝出解:21.84×2/3=14.61。
這個博弈中,0和1是均衡解(下一部分將分析),它們是“理論解”。在該實驗中,0是所選最多的數字,共有46人選擇,比例為26.9%;選1的為14人,比例為8.2%。兩者相加共有60人,比例為35.1%。
從上述數據可以看出,在這場博弈中,“實驗解”為14.61,最接近該數的是14或15,這和“理論解”的“0”或“1”不同。在本實驗中,沒有人選擇14,而選擇15的有3人,這3人是該實驗的勝出者。
若按照區間來統計,實驗結果的分布情況見表1。本博弈實驗的“實驗解”14.61落在11-20之間。若我們把11-20看成是勝出區間,則有7人勝出。
對于這些選擇,有以下值得注意的幾點:
第一,67以上的選擇都是不理性的,因為參加考試的學生數為150-200之間,這是公共知識,即使所有的學生都選擇100,勝出的數字都不會超過67。但是還有3位學生選擇了大于67的數字,其中選擇的最大數為75。他們在給出這些選擇時沒有給出理由。
第二,分析學生所給出這些選擇的理由,可以看出,絕大部分選擇者在進行他們的選擇時考慮到了他人的選擇以及他人的推理。不同的人對他人的假定不同,所進行推理的步驟也不同。如選擇67的學生假定了他人都選擇100,因而選擇67是最優選擇;再比如選擇30-40之間的數字的同學,其理由大體上有兩個:或者認為平均數集中在50-60之間,其2/3就集中在35-40之間;或者認為都選100的話,66.7是最優選擇,都選擇66.7的話,44是最優選擇,而都選44的話,33是最優選擇。
第三,有三個區間處的選擇比例較高:0-10間為38.6%,21-30間為17.6%,31-40間為25.7%。從所給理由可看出,不同區間的選擇者考慮群體的互動推理的步驟存在差別,如0-10區間的選擇者考慮他人的推理步驟比31-40區間的選擇者多些。
第四,值得注意的是,11-20區間里的選擇較少(事實上是,在這個博弈中所選擇的數字落在這個區間是最有可能勝出的)。原因可能是,一旦選擇者進行了多步的互動推理,他們便能夠將這樣的推理進行下去,從而將選擇向理論解0或1靠近。
第五,有一些“智慧的”選擇者,他們知道理論解,但他們知道存在不完全理性的選擇,因而他們沒有選擇理論解。盡管他們的選擇沒有勝出,他們的推理是有智慧的。這里,本文選擇了其中2個。一位選擇22的學生是這樣給出他所選擇的理由的:“作為理性人,我不會選擇大于2/3×100的數,因為即使所有人都選擇最大數,平均數的2/3也不會超過2/3×100。如果大家和我一樣理智,那么大家都不會選擇大于2/3×100,那么我不會選擇大于100×2/3×2/3。因為他們選擇最大的他們可能會選的數,平均數的2/3也不會超過2/3×2/3×100。依此類推,如果全班都充分理智,那么全班最終都會選擇1,然而我不認為班里的人都是足夠理智,故平均數的2/3會大于1。根據兩次游戲,平均數的2/3在20~30。如果是我,我會選擇靠近20的數,那我就22吧?!币粋€選擇10的學生的理由是:“如果其他人都是隨機選擇,那么平均數最后可能接近于50,50×2/3≈33。但是,如果所有人都選擇接近33的數,那么33為平均數,33×2/3≈22……如此推理應該為1。但是并非所有人均是理性、均會如此計算。我對南大有信心,所以,我將數字選得接近1一點,選10?!?/p>
第六,有一些選擇是沒有考慮到他人的選擇。如有這樣一些理由:“大家都認為60是及格分,所以我選擇59”,“58是我的幸運數字”,等等。
二、博弈的理論解分析
本實驗是一個多人完全信息靜態博弈:參與者同時選擇行動,然后根據所有參與者的選擇,每個參與者得到各自的結果,每一參與者的收益函數在所有參與者之間是公共知識。
在這個實驗中,參加考試的176位學生是參與者,每個考生同時對0-100之間的數字進行選擇行動,即每個參與者的策略空間Si∈(0,100),即有101種可能的策略。根據所有考生的選擇,每個考生最后得出自己的結果,對每個考生來說,結果無非就是,自己的選擇是“大家所選數字的平均數的2/3”,勝出;要么與“大家所選數字的平均數的2/3”不一致,失敗。
我們假定該博弈的參與人都是絕對理性人(事實上,這個要求在實際中難以達到,這也是本文要得到的一個結論)。
我們來分析絕對理性人的推理過程。
在這個博弈中策略組合有176×101種,每種策略組合下,每個人的收益是公共知識。如:如所有人都選100,平均數為100,此時每人都失敗,勝出結果是100×2/3=67;如175人都選100,有一個人選擇了67,那么選100的人失敗,而選擇67的人勝出……所以這些是理性參與人的公共知識。
我們看到,任何人都不應該選67或以上,或者選擇67或以上是非理性的,因為所選擇的數字的最大平均數為100,此時勝出的數字為67,因此選擇67以上而獲勝的可能性是沒有。因此,作為理性人他們都不會選擇67或以上。
每個人都不會選擇67或以上,這本身也是公共知識。在這樣的公共知識的前提下,45以上的選擇都是不合理的,因為對每個人而言,只有在他人都選擇67以上,我選擇45或以上才是合理的(67的2/3約為45)。
每個人都不會選擇45或以上,這本身也是公共知識。于是,每個人都認為不應該選擇30或以上。
……
結論是:每個人選擇0或1是合理的,它們是該博弈的理論解。
事實上,每個人選擇0或都選擇1是納什均衡:對每個人而言,在其他人不改變選擇的情況下,當下的選擇是最優的。
在所有人均選擇0的情況下,因為對于每個人而言,若所有人都選擇0的話,0便成為平均數,該數的2/3還是0。這樣,他選擇0是最優選擇:在他人不改變選擇的情況下,他改變選擇將失敗。因此這點構成納什均衡。
在所有人均選擇1的情況下,同樣,對于每個人而言,在其他人選擇1的情況下,平均數1的2/3為0.67,此時1最接近該數。因此,他選擇1是最優選擇,并且若他改變了他的選擇他將失敗。因此,這點也構成納什均衡。
當然,面對多個納什均衡,作為理性的參與人作何選擇才能勝出呢?具體到這個博弈中,每個人要考慮的是,他選擇0還是選擇1才能勝出呢?
他會這樣思考:沒有理由認為其中一個比另外一個更有可能勝出,這樣,選擇0或1勝出的概率為50%,但是,他人能夠與我有同樣的想法。既然如此,期望平均數應該為0.5×1+0.5×0=0.5。于是,0.5的2/3接近0。因此,選擇0是最優選擇。
從上面的分析可見,盡管0和1是納什均衡點,但選擇。是最優選擇。
三、改進博弈論的可能路徑
本文已經表明,上述博弈是一個完全信息靜態博弈,然而,本實驗的實驗解(14.61)與理論解(0或1)之間發生偏離。本文認為,有兩個主要原因:
第一,博弈論中所假定的理想主體與實際中的決策主體不相符合。理想的博弈參與人是絕對理性人;他們能夠進行任何有窮步驟的推理,能夠分析所有有窮可能的情況,并且他們的推理、分析是在瞬時完成的,而實際博弈中人們是有界理性的。在我們的博弈實驗中若參與者是理想主體,他們能夠做本文上一部分那樣的分析,他們應當知道0和1是均衡解,也能夠預測O是最有可能實現的結果。本實驗表明,并不是所有人都能夠做出這樣分析的。并且,在實際中存在完全非理性的選擇,如本實驗中選擇大于67的3人,這不是完全偶然現象。
所謂“博弈”(Game),是指某些個人或組織作出相互有影響的決策,它不僅包括撲克、橋牌等游戲,也包含現實生活中大量的合作和沖突現象。博弈論又稱“對策論”,研究的核心是決策主體的行為發生直接相互作用時的決策以及這種決策的均衡問題。
博弈論的原始思想萌芽于2000多年前,中國春秋戰國時代的典籍如《孫子兵法》、《孫臏兵法》中都充滿了博弈的案例?!疤锛膳c齊王賽馬”就是我國耳熟能詳的博弈實例之一,但這不過是博弈思想的雛形,現代意義上的博弈論則是20世紀的貢獻了。一般認為,1944年同馮·諾伊曼(Von Neumann)和摩根斯坦恩(Morgenstern)合作發表的《博弈論與經濟行為》(The Theory of Games and Economic Behavior)提出合作博弈的基本模型,標志著現代博弈論的開始。50年代,博弈論巨匠輩出,納什(Nash)提出了非合作博弈論,塔科爾(Tucker)定義了“囚徒困境”,從而奠定了現代非合作博弈的理論基石。60后代,澤爾騰(Selten)將納什均衡引入動態分析,創立了“精煉納什均衡”的概念;海薩尼(Harsanyi)則把不完全信息引入博弈論研究,隨后出現了不完全信息博弈論。至此,博弈論的理論構架基本完成。
博弈論可以劃分為合作博弈(cooperative game)和非合作博弈(non-cooperative game)。二者的區別主要在于參與人能否在行為時達成有約束力的協議,達成則是合作博弈;反之,不能強制他方遵守協議,各參與人只能選擇自己的最優戰略,則是非合作博弈。合作博弈強調團體理性、效率、公平和公正;非合作博弈則強調個人理性、個人最優決策。我們談到的博弈多指非合作博弈。
博弈有兩種劃分:從參與人出場的先后順序來看,博弈分為靜態博弈(static game)和動態博弈(dynamic game)。靜態博弈指博弈參與人同時選擇行動或非同時行動但對前者行動一無所知;動態博弈指參與人行動有先后順序,且后行動者能夠觀察到先行動者的選擇。從參與人對其他參與人的知識來分析,博弈分為完全信息博弈和不完全信息博弈,前者指每一個參與人對其他參與人的特征、戰略和支付函數有確切的了解;后者則恰好相反。將兩種分析結合起來,我們就有四種類型的博弈:完全信息靜態博弈,完全信息動態博弈,不完全信息靜態博弈,不完全信息動態博弈。
1.完全信息靜態博弈:納什均衡
完全信息靜態博弈講的是,假設博弈中所有參與人事先達成一項協議,規定每個人的行為規則,那么,在沒有外在強制性約束時,參與人是否會自覺遵守協議。如果參與人自覺遵守該協議,則構成一個納什均衡:給定其他參與人遵守協議的情況下,沒有人積極偏離協議規則。換言之,如果一個協議不構成納什均衡,它就不可能自動實施,因為至少有一個參與人會違背這個協議,不滿足納什均衡要求的協議是沒有意義的?!扒敉嚼Ь场?Prisoner's Dilemma)和“性別戰”(Battle of theSexes)是任何一本博弈論著作都會提到的納什均衡特例。
2.完全信息動態博弈:子博弈精煉納什均衡
動態是世間萬物的基本特征。完全信息靜態博弈只是一種獨特的理想狀態。在現實中,當后一個參與人行動時,自然會根據前者的選擇而調整自己的選擇,而前者也會理性地預期到這一點,所以不可能不考慮自己的選擇對他人的影響。1965年,澤爾騰通過對動態博弈的分析,提出了“子博弈精煉納什均衡”的概念,它要求任何參與人在任何時間、地點的決策都是最優的,決策者應該隨機應變,而不是固守前謀。這就推導出子博弈的概念。當參與人的戰略在每一個子博弈中都構成納什均衡時,則形成“子博弈精煉納什均衡”。也就是說,組成“子博弈精煉納什均衡”的戰略必須在每一個子博弈中都是最優的。
3.不完全信息靜態博弈:貝葉斯納什均衡
不完全信息靜態博弈指的是,參與人共同行動,沒有機會觀察他人的選擇。每個參與人的最優戰略只能是在給定自己的類型和他人類型依從戰略的情況下,最大化自己的期望效用。在項目投標中各承包者的標價高低之爭就是一個應用例證。
4.不完全信息動態博弈:精煉貝葉斯納什均衡
在不完全信息動態博弈中,后行動者觀察前者的選擇并獲得其偏好、戰略空間等信息,修正自己的判斷;而先行為者也知道自己行為的效用,會有意識地選擇某種行動掩蓋或揭示自己的真實目的?!扒H技窮”就是一個不完全信息動態博弈的例證。
國際機制理論的理性主義流派概述
當前,國際機制的研究在理論與實踐層面都對國際關系理論學者形成沖擊,引起他們持續的濃厚興趣,并表現出非凡的整合能力,對國際機制研究的不同思路和方法加以整理和批評已經成為學者們重視的工作。德國著名國際機制理論家沃科爾·利特伯格認為,國際機制理論有兩種理性主義流派:新現實主義國際機制理論和新自由主義國際機制理論。(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theories of International
Regimes(London:Cambridge UniversityPress,1997),pp.1-2.)
新現實主義國際機制理論的基本出發點是行為體之間的權力資源分配極大地影響著機制的出現、某問題領域機制的存在及其性質,特別是合作中的利益分配;國家會考慮無政府狀態下的相對權力,對國際機制的效率形成制約。這些觀點都體現在霸權穩定理論中。利特伯格認為,霸權穩定理論是“基于權力的國際機制理論的經典理論模式”,(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theoriesof International
Regimes(London:Cambridge University Press,1997),pp.86.)而克勞福德認為,霸權穩定理論是新現實主義對機制產生最權威、最普遍認同的解釋。(注:Robert Crawford,Regime Theory inthe Post-Cold War World:Rethingking Neoliberal Approaches toInternational Relations(Dartmouth:Darmouth Publishing Company,1996),p.57.)霸權穩定理論的基本機制理論主張是:霸權國家建立了自己的霸權體系,并制定該體系的基本原則、規則、規范和決策程序,霸權國的實力與威望是其他國家接受這些國際機制的重要前提;霸權國利用這些機制維持霸權體系,最大限度地獲得自己的利益;同時,為了維持該體系,它愿意向體系內的其他國家提供“公共商品”(Public Goods),容忍“搭便車行為”(Free-rider);霸權國的衰落或急劇變化,則該體系的國際機制發生相應變化。
新自由主義機制理論在過去10多年影響巨大,成為分析國際機制的主流理論。其基本機制理論主張是:國家是追求絕對收益的理性自我主義者,只關心自己的得失;承認權力在國際機制中的作用,但認為國際機制是國際關系中的獨立變量(independent variable),強調國際機制在幫助國家實現共同利益中的重大作用;活躍在特定問題領域的國家擁有只能通過合作才能實現的共同利益;不確定性是國際機制形成理論的核心,世界政治存在廣泛的不確定性。國際機制幫助達成政府之間意愿的契合。行為體相信這種安排會幫助達成互利的安排。換言之,沒有國際機制,則協議無法達成。國際機制正是通過降低不確定性來促進國際合作的。新自由主義機制理論是國際機制理論的主流學派,其影響也最大。該派理論用相互依賴的概念將現實主義和自由主義結合起來,具有重要的理論整合意義。
博弈論與國際機制理論
在過去十多年里,國際機制理論在國際合作的分析中獨占翹楚,而博弈論在分析社會、經濟和政治現象中應用最為廣泛。兩種理論都以探討無政府狀態下的競爭與合作問題為核心命題。這種平行并非巧合,因為機制理論從博弈論中借取了許多知識能量。理解促進合作的戰略邏輯是解釋無政府狀態下國際機制起作用的關鍵。在討論霸權、問題聯系、相對收益和相互依賴時,博弈論的解釋力有目共睹。這些恰恰是國際機制理論討論的重心問題。(注:Andrew Kydd and Duncan Snidal,"Progress in Game-Theoritical Analysis of International Regimes",in Regime Theory and International
Relations,ed.Volker Rittberger(Oxford:Clarendon Press,1993),pp.112.)
早期的博弈論分析國際合作的總體問題,其目標在于探究國際合作在無政府狀態下如何發生,但對國際機制的特殊作用關注不夠,國際機制在合作中的作用沒有得到突出和明確的分析。克拉斯納、基歐漢等使用博弈論分析國際機制的作用,促使現實主義和自由制度主義的國際機制理論逐步成熟。
關鍵詞:群體決策;信息集結;博弈論;信息獲取;審議;透明性
一、引言
群體決策的研究涉及多個學科,不同學科對群體決策的研究所采取的方法和著重點不一樣。在經濟學、政治學、管理學領域對群體決策的研究側重于偏好的集結,較少考慮影響偏好形成的潛在背景信息。其中社會選擇理論與公共選擇理論利用數學分析的方法和福利經濟學的一些基本原理,研究如何“公平合理地”將群體成員的偏好集結為群體的偏好并據以作出群體的選擇,這方面的研究源于Condorcet投票悖論的提出,從20世紀50年代開始經過Arrow、Sen、Gibbard和Satterthwaite等人的進一步發展,已形成完整的理論體系,通過對理性社會選擇本質的剖析,促進了人們對選舉、立法以及政治機構運作等問題的理解。
在管理科學領域,對群體決策的研究主要強調如何通過對群體成員以不同形式表達的偏好的集結,使得群體成員就最終決策達成某種程度上的一致,而一致性則意味著“正確性”,這方面最具代表性的是社會決策圖式理論。
在社會心理學領域對群體決策的研究主要采用實驗性方法,通過對群體成員之間交互過程的分析研究群體決策的信息集結有效性,一般假定群體成員具有共同的目標,很少考慮決策過程中的策略,心理學研究的主要成果是對群體思維和群體極化現象的分析。
近年來國外出現了不少用博弈論作為理論工具研究群體決策信息集結問題的文獻,這些文獻主要發表于經濟學、政治學與政治經濟學期刊,通過對群體決策過程中群體成員的動機和理的分析,給出了一些與人們的直覺完全相反的結論。筆者將對此領域的研究進展從決策信息的獲取、審議過程中信息的披 露、透明性的影響與最優決策規則四個方面進行評述。需要說明的是,這四個方面緊密關聯,特別是決策群體成員的信息披露動機直接受到決策過程對公眾是否透明以及最終的投票表決規則的影響,而群體成員的信息獲取動機則部分地取決于信息披露動機,但由于利用博弈論分析群體決策問題的復雜性,現有的文獻主要還是相對集中于其中的一兩個方面。
文[1]是注意到此領域較早的綜述性文章,該文發表于1999年,討論了當時出現不久的研究政治機構信息集結作用的文獻,其中對最先考慮策略性投票表決行為的文[2-5]等進行了簡要介紹。同年9月份,《美國國家科學院院刊》發文評述了研究選舉的信息集結作用及因投票者私有信息的不準確而導致的策略性投票表決行為的成果[6],其中提及的部分研究工作尚處于未發表狀態。文[7]對研究貨幣政策委員會決策過程中的動機問題的文獻進行了系統討論。文[8]總結了貨幣政策委員會決策機制設計應該考慮的各種因素,對與群體決策相關的經濟學與社會心理學理論與實驗分析文獻進行了評述,其中討論了信息集結問題。應該說文[9]是目前評述基于博弈論的群體決策信息集結研究文獻較為全面和細致的文章,該文從策略性投票、信息獲取、利益沖突和交流四個方面進行了詳細評述,并討論了此領域的研究成果對貨幣政策委員會決策機制設計的參考價值。
本研究與文[9]的差別在于:第一,文[9]的討論基本上局限于基于博弈論的群體決策信息集結研究本身,而筆者從研究方法、研究對象與研究成果等方面將基于博弈論的群體決策信息集結研究與經濟學、政治學、管理學以及社會心理學領域對群體決策的傳統主流研究進行了對比,分析了博弈論作為理論工具研究群體決策信息集結問題的優缺點,并深入探討了現有研究工作存在的不足之處,也即指出了此領域可能的研究方向,因此,筆者的深度與廣度有所超越。第二,文[9]對此領域研究成果的評述思路稍顯混亂,文獻分類較不合理。第三,筆者特別關注了研究決策過程的透明性對群體成員信息獲取與信息披露動機以及投票表決行為的影響的文獻,而文[9]對此幾乎沒有涉及。第四,文[9]發表后此領域出現了不少具有重要參考價值的文獻,筆者對這些最新的文獻給予了較為詳細的評述。
二、決策信息的獲取
(一) Condorcet陪審團定理與搭便車問題
與決策問題相關的各類信息一般以分散的、局部的形式存在于社會系統,群體決策的意義之一,是可能更充分地利用這些信息,因而更有可能作出正確的決策。不考慮其他因素,僅從信息集結的角度看,讓更多擁有信息的個體參與決策可以改善決策質量,這種觀點符合人們的直覺,其形式化證明出自18世紀Condorcet給出的陪審團定理。該定理認為:群體決策可以有效集結信息,在多數決定規則下,增加群體成員數量可以增加作出正確決策的概率,并且隨著成員數量趨于無窮,作出正確決策的概率趨于1。
Condorcet陪審團定理及其后來的很多拓展往往都有個潛在的假設:群體決策者所掌握的與決策問題相關的信息是事前外部給定的,或是以零成本獲得的[9]。但對于許多現實決策情形,信息并不是不需要投入成本和努力就能輕易得到的,如審稿專家需要付出一定的時間和精力才能決定稿件是否符合錄用標準,因此決策者必須決定是否付出以及付出多少代價以獲取信息。而在群體決策中,與決策問題相關的信息是公共物品,因而存在典型的所謂社會惰化(social loafing)現象或搭便車問題(freerider problem)。
文[10]對陪審團決策中的信息獲取問題進行了研究,認為陪審員的信息準確程度取決于陪審團的大小,更大的陪審團的陪審員具有更少的動機認真聽取審判過程,所以更大的陪審團作出正確判決的概率可能更小,從而導致陪審團定理不再成立。文[11-17]進一步研究了群體決策中的理性無知(rational ignorance)問題,對仍能有效集結信息時信息獲取成本或成本函數需要滿足的條件進行了分析,這些文獻針對多數決定規則,假定所有群體成員具有完全相同的決策偏好。其中文[11,13-15]證明,當全體或部分群體成員的信息獲取成本函數在獲取零信息處的二階導數為零,則Condorcet陪審團定理仍然有效。
另外,文[18]通過一個僅有兩個成員的群體決策模型,指出群體成員間的交流可能會惡化信息獲取中的搭便車問題。在該文中,決策成員首先收集關于一項工程實施后果的信息,然后相互交流,再投票表決是否實施該項工程。文章指出,如果交流的作用僅限于信息集結,則交流可能會減少作出正確決策的概率,特別是當高質量的信息很容易獲得時,交流會減少決策成員收集信息的動機,加劇信息收集中的搭便車問題,但當信息收集需要付出高昂的代價時,更多的交流通常會增加作出正確決策的概率。
(二)搭便車問題避免措施
因為信息獲取活動一般是不可觀測的,搭便車者可以通過提供一個虛假的信息假裝已經給予了足夠的投入,所以無法通過有效的懲罰措施以阻止搭便車問題,只能夠從決策群體的成員組成和決策規則等方面考慮避免該問題的發生。
文[19-20]的研究結論從決策群體人員組成方面為避免信息獲取中的搭便車問題提供了理論參考,指出具有極端偏好的成員相對來說更具有收集高成本信息的動機,但這兩篇文獻的研究內容不屬于嚴格意義上的群體決策,因為其中的委員會成員僅負責收集與報告信息,自身并沒有決策權。在文[19]中,委員會成員在信息收集之前相互間沒有偏好差異,在投入不可觀測的努力收集信息后形成各自不同的政策偏好,該文證明最優的委員會規模和總的社會剩余有時會隨委員會成員偏好差異期望值的增大而增大,因為預期的偏好差異為成員提供了收集信息的動機。文[20]指出,如果信息收集的成本較低,委員會成員的偏好應該與決策者的偏好類似,這是因為一方面與決策者偏好類似的成員會收集決策者想要的信息,另一方面由于偏好類似所以在報告時不會產生信息的扭曲問題;如果信息收集的成本較高,則委員會應該由具有極端偏好的成員組成,只有這些成員才具有足夠強烈的動機付出代價收集信息,但因為信任問題,他們往往只會收集硬信息,即客觀上可驗證的信息。對于在投票表決前需要對決策選項進行審議的群體決策來說,文[20]的研究結論尤其具有參考價值。
從群體決策機制設計的角度看,如果存在信息獲取問題,則機制設計者必須既要考慮如何提供充分的激勵促使群體成員獲取信息,又要考慮如何有效集結成員所獲得的信息,以最大化群體決策的期望效用。
文[21]證明,采用適當保守的決策規則可以促進群體成員收集證據,從而改善決策質量。文[22-23]對存在信息獲取時的群體決策最優規則與最優群體成員數量進行了研究。文[22]指出,盡管一致性規則使每個群體成員的投票選擇對最終結果都具有決定性影響力,但一致性規則并不能為獲取信息提供適當的激勵,而且一致性規則特別不適合于信息較不準確的情形,也即更需要群體決策的情形,在只考慮單調純策略均衡的條件下,除非群體成員的信息足夠準確,否則一致性規則或接近于一致性規則的規則不可能最優。文[23]認為,為了提供足夠的信息獲取激勵,對于相當普遍的決策情形,事前最優的決策機制事后可能是非最優的,即不必然利用了所有群體成員獲取的信息導致從統計學角度有最優的信息集結,該事前最優的決策機制是在激勵成員獲取信息與最大程度提取成員信息之間折中的產物。需要指出的是,文[21-23]均假定決策群體成員具有相同的偏好。
三、審議過程中信息的披露
決策群體,尤其是規模較小的群體,一般會在投票表決前對決策選項進行審議,交流各自的私有信息。信息的共享能引起成員信念的收斂。但群體成員通常代表著不同的利益集體,具有不同的利益追求或偏好,因而具有操縱或隱藏私有信息的動機,從而限制了信息共享的可能性,成員間策略性的信息操縱與反操縱甚至導致比純粹偏好沖突更大程度上的意見不一致。
絕大多數群體決策文獻對審議(deliberation)、交流(communication)、辯論(debate)、廉價磋商(cheap talk)等類似表述用語沒有進行明確的區分,雖然這些用語在不同場合有一些微妙甚至較大的差異,如文[24]認為審議是辯論的子集。
研究審議對群體決策的影響的文獻一般將決策過程建模為兩階段博弈:先審議后正式投票表決,通過對貝葉斯Nash均衡策略和均衡存在條件的分析,研究審議是否以及如何對群體決策發生作用。這類文獻一般假定無論是以公共利益還是以私人利益作為評判標準,好的決策選擇總是部分取決于世界的真實狀態,而世界的真實狀態對決策群體成員來說無法確切知道,他們僅不對稱地掌握了有關世界真實狀態的部分信息。在正式投票表決之前的審議過程可以使群體成員有機會告訴其他成員他們所掌握的私有信息,然后,根據各自已掌握的關于世界真實狀態的部分信息,群體成員形成自己對世界真實狀態的判斷,進而根據自己的評判標準形成各自的決策選擇偏好,如果他們的決策選擇偏好不一致,就有可能在審議的過程中不披露自己的真實信息,或提供虛假的信息以誘導其他成員作出對自己有利的決策選擇。因此,此類文獻注重從信息集結角度對完全信息披露均衡和完全信息集結均衡的分析。
Coughlan在文[25]中認為,當所有群體成員的決策偏好完全相同或足夠接近,在審議過程中每個成員都具有真實披露私有信息的動機。文[26]則進一步證明,只要群體成員主觀上認為多數成員與他擁有共同偏好具有較大的可能性,客觀上的偏好差異不會影響信息的真實共享。然而,該文同時指出,審議并不總是能有效集結信息,特別是當群體成員沒有較強的先驗信念認為自己的價值取向就是群體主流的價值取向時,可能出現有意的相互欺騙。需要說明的是,在文[26]給出的模型中,所有群體成員的偏好或者完全相同,或者完全相反,與此相符的現實群體決策情形很少,甚至幾乎沒有。文[24,27-28]證明一致性規則在很多情況下為群體成員在審議過程中策略性地隱藏信息提供了動機,多數決定規則比一致性規則能引導出更多的信息共享。文[28]還證明,在相當一般的條件下,審議使得除一致性規則以外的所有其他規則具有相同的序貫均衡集合,也即審議使得所有的無否決權規則在序貫均衡方面等價,從而說明如果群體成員在投票表決前有向所有成員公開宣布各自私有信息的機會,那么采用除一致性規則以外的其他任何決策規則,都會產生相同的決策結果。文[29]對陪審團在審議階段信息的披露進行了實驗研究,以無約束力的意向性投票形式實現信息的交流,實驗結果與理論分析基本近似。
另外,文[30]給出了一個兩成員的交流與決策模型,兩個成員投票表決是否組成具有不確定回報的合伙關系,他們的偏好不一致且為私有信息。文章分析了均衡的特征,發現在均衡時僅有部分信息被傳遞,交流對于雙方的福利是有益的。
對于很多現實決策問題,決策者可能擁有客觀上可驗證的信息,即所謂硬信息(hard information)。文[31]對硬信息在具有偏好沖突的委員會中的交流進行了研究,證明完全信息集結均衡在偏好為私有信息的情況下比在偏好為常識情況下更有可能存在,即允許更大程度上的偏好差異;另外該文證明,如果信息可驗證,完全信息集結均衡的存在條件等同于完全信息披露均衡的存在條件。文[32]指出,在審議階段群體成員共享私有信息的動機一定程度上取決于其私有信息的可驗證性,如果決策成員能夠為自己的信息提供驗證材料,則一致性規則比其他規則提供了更強的信息共享激勵,更有可能實現完全信息共享。文章給出了在一致性規則下審議階段存在完全信息披露均衡的充分必要條件。
文[33]指出,盡管偏好與信息的差異可能使得部分成員在審議過程中具有錯誤表達私有信息的動機,但給予群體成員適當的外部激勵能消除此類動機,促進信息與偏好的完全集結,而且隨著群體規模的擴大,外部激勵的強度可以很小,外部激勵的具體措施包括對成員決策能力的肯定等。
四、透明性的影響
隨著社會的進步,公眾對涉及自身利益的重要決策過程的透明性提出了越來越高的要求。透明的決策過程意味著公眾可以評價決策群體成員的偏好、能力與貢獻,從而引起決策者對自身聲譽的關注,而對聲譽的關注既可能促進信息的獲取和真實信息的披露,但也有可能導致信息傳遞與投票表決行為的扭曲。
在文[34]中,委員會成員在前一時期表現出的決策能力影響了他在后一時期能否獲得連任,而作為委員會成員可為其帶來一定的效用。該文證明公開個人投票記錄可以促進委員會成員努力獲取信息。文[35]認為,僅公布最終決策結果,不公開個人投票記錄,會誘導委員會成員按照現有偏見作出投票選擇,因此,委員會的決策傾向于保守化,向公眾公開成員的投票記錄則能夠減少現有偏見對決策的影響。該文同時認為,群體決策機制的設計應該不僅考慮決策過程的透明性,也要考慮決策規則的適當性,如果決策規則選擇合適,則不透明的決策過程可能比透明的決策過程得到更好的決策結果。在文[34-35]所給出的模型中,都沒有考慮委員會成員在投票表決前可能會相互交流各自的私有信息。
在文[36]中,委員會代表公眾對一項新工程的實施與否進行表決,委員會成員既關心工程的實際價值,又關心委員會在公眾中的聲譽,如果維持現狀,不實施新工程,則暴露出委員會成員意見的不一致,從而給委員會的聲譽帶來負面影響,而公眾僅能注意到委員會的決策結果,事后不能觀測到工程的實際價值。該文證明,在審議階段,部分成員對聲譽的過分關注可能使他們不愿真實披露私有信息,而是夸大工程的價值,導致更容易采取實施新工程的決策。文[37]認為,公開委員會的具體審議記錄可能會降低決策質量。由于委員會成員關心公眾對其決策能力的判斷,使得他們在正式會議交流過程中可能隱藏內部存在的意見分歧,公眾對于決策過程透明性的要求,可能導致委員會在正式會議之前組織秘密的非正式預備會議,將真正實質性的討論從公開的正式會議階段轉移到秘密的預備會議階段,從而對公眾消除委員會內部意見的不一致,而非正式的會議更具有不穩定性,因此,透明性要求并不一定能增加社會福利。
在文[38-40]中,外部利益關聯者可以觀察到公開委員會每個成員的具體投票記錄和決策結果,但對于秘密委員會則只能看到最終決策結果,而委員會成員既關心決策結果又關心外部利益關聯者所給予的回報。文[38]和[39]認為,不公布委員會成員的個人投票記錄可以減少外部利益關聯者對決策的影響,在某些情況下秘密委員會優于公開委員會。文[39]還特別指出,由于隨著群體成員數量的增加,單個成員的投票對最終決策具有決定性影響的概率減小,對單個成員而言不誠實投票的代價隨之減小,所以對于公開委員會來說,其成員更容易因外部利益關聯者承諾給予的回報而不誠實投票,因此Condorcet陪審團定理可能不再成立。在文[40]中,對于秘密委員會,外部利益關聯者可以根據投票表決規則的閾值和最終決策結果對委員會成員的投票作出推斷。文章分析了秘密委員會的最優決策規則,指出決策規則中增加選擇某一選項需要的投票比例可能會導致該選項更容易成為最終決策結果,傳統看法認為降低決策規則的閾值可以防止委員會過于保守的看法未必正確,但對于公開委員會則不存在此問題。文[41]雖然不是直接研究透明性,但其研究結論與此處內容相關,該文通過一個博弈模型,說明在特定情況下,外部利益集團可以不用付出任何代價就能操縱委員會的決策。
另外,不少文獻從理論與實證兩方面研究了決策過程的透明性對貨幣政策委員會決策的影響。文[7,42]對這方面的文獻進行了綜述。文[42]區分了三種類型的透明性:決策目標透明性;知識透明性,這里的知識指決策所依據的經濟數據或經濟模型等;操作透明性,包括委員會會議記錄與投票記錄的透明性以及決策結果的透明性等。該文評述的文獻有部分運用了博弈理論作為分析工具。文[7]專門討論了貨幣政策委員會決策過程中的動機問題,指出貨幣政策委員會的最優規模與透明性等仍有待進一步研究。
類似于文[34],研究透明性對貨幣政策委員會決策信息集結有效性的影響的文獻,一般認為委員會成員希望得到社會公眾對其決策能力或決策偏好的正面評價,從而獲得連任的機會,如文[43]假設委員會成員希望公眾認為他是通貨膨脹的強硬抵制者,而最近的文獻如文[44-46]等,則假設委員會成員希望公眾認為他是具有較強決策能力者。文[44]認為,公開審議過程的詳細記錄會使得貨幣政策委員會成員不愿意表達不同的意見,該文通過對美聯儲聯邦公開市場委員會在被要求公開會議記錄之前和之后的會議記錄的分析說明了理論結果的有效性。文[45-46]分析了投票記錄的公開對委員會成員投票表決行為的影響,認為投票記錄對公眾的透明帶來的負面效應占主導地位,透明性不能增加社會福利。
五、最優決策規則
顯而易見,不同的決策規則極大地影響了群體決策的信息集結效率,尤其是決策群體成員的偏好或能力不完全一致時,決策規則更是直接影響了群體成員的投票選擇行為,進而影響了決策結果的正確性。前述文獻大多不同程度地討論了決策規則的比較和選擇,除此以外,另有部分文獻對各種情況下的最優決策規則進行了研究。
文[47-48]從最大化期望效用的角度對固定規模的委員會形式集體決策的最優決策規則進行了分析,文[49-50]研究了在特定約束條件下的最優決策規則。然而,這些早期的文獻都有個潛在的假設:決策成員僅按照自身獲得的信息作出投票選擇。文[2,51]等指出,即使決策群體成員的偏好完全一致,也不能保證一定能夠如Condorcet陪審團定理所預測的那樣有效集結各成員的信息,因為群體成員僅根據自身信息作出非策略性的選擇不符合理性要求,當且僅當所使用的決策規則為集結群體成員私有信息的最優規則時,所有群體成員僅按自身信息投票才是Nash均衡,而最優決策規則則取決于特定的決策情形。
文[52]證明,當采用文[48]所定義的最優決策規則時,所有成員僅按照自身獲得的信息投票表決形成Nash均衡,但僅按自身信息投票可能不是有效的,因為部分成員聯合決定策略性投票可以增加期望效用。文[53]討論了投票者對不同決策選項具有可用基數表示的效用時的誠實投票問題,試圖給出當決策機制允許多種消息類型時誠實投票的準確定義。為使投票者具有誠實投票的動機,文[54]提出了一種在隨機選擇的投票表決集合上運用多數決定規則得到最終決策的方法,在對所有投票者的表決結果運用多數決定規則和僅對投票表決結果的隨機抽樣子集運用多數決定規則之間進行隨機選擇,可以激勵投票者誠實投票,從而得到Condorcet陪審團定理的有效性收斂結果。
文[55]基于陪審員的私有信息和策略性表決行為構建了一個陪審團決策模型,證明一致同意規則可能會導致無辜被告得到有罪判決和有罪被告得到無罪判決這兩種錯誤的概率都增加。文[56]分析了決策群體所投票表決的決策選項不獨立于投票表決規則的情形:給定決策群體的投票表決規則,提案者向決策群體提出一個要么完全接受要么完全拒絕的議案,群體投票表決是接受還是拒絕該議案。該文證明由于一致同意規則能促使提案者提出更有吸引力的議案,所以增加了決策群體的期望效用,在某些情況下,一致同意規則甚至是Pareto最優的表決規則,因為它也增加了提案者的期望效用,即使提案者與決策群體的利益追求可能完全相反??偨Y考慮一致性規則的文獻[22,24,27,28,32,55,56],可見博弈分析得到的結論往往與人們直觀上的認識截然相反,一致性規則是不是合適的決策規則完全取決于特定的決策情形。
既然投票表決規則直接影響了投票者的投票選擇行為,那么,對于群體決策機制的設計者來說,他在選擇投票表決規則時是否需要考慮投票者在各種表決規則下的投票行為,換言之,機制設計者關于投票者在各種規則下的博弈行為的信念是否會影響到最優決策規則的選擇。文[57-58]對此問題進行了研究,其中假設群體成員的決策偏好完全一致。文[57]分析了決策成員的能力存在差異且這種差異是常識的情況下的投票表決規則,指出最優的匿名單調投票規則并不取決于成員是否按照自身信息投票或策略性投票。類似于文[57]的結論,文[58]認為,決策機制設計者對最優投票表決規則的選擇與機制設計者關于投票者在不同表決規則下的投票行為的信念無關,在該文中,機制設計者為決策群體選擇投票表決規則,其目的是為了最大化決策群體的期望福利,文章證明,僅從信息集結的角度看,關于投票者在各種表決規則下的投票行為的不同假設對于最優決策規則的選擇來說,結論是一樣的,不同的行為假設導致相同的結論。對于具有相同偏好的決策群體來說,文[57-58]的研究結論大大簡化了決策規則的選擇。
現實中的決策群體往往存在具有極端偏好的成員,這些成員的存在為信息的有效集結帶來較大的困難。文[59]對存在極端偏好者和中立者的群體面對二分決策問題時的最優決策規則進行了研究,考慮了決策成員之間存在轉移支付的情況,指出最優投票表決規則相對于轉移支付可能性的大小來說是非單調的。文[60]對由兩類具有完全相反的偏好的成員所組成的委員會決策進行了分析,對比了一致性規則與非一致性規則的信息集結效率。文[61]給出了一個現實中較難接受的非單調性決策規則――超多數懲罰(supermajority penalty)規則,當選擇某一選項的投票過多時,將該選項作為群體決策最終結果的概率反而會下降,該文證明,當對于每個選項都存在極端偏好者時,超多數懲罰規則是最優匿名激勵相容規則。
前述文獻都假定群體成員的偏好相互獨立,而文[62]對群體成員具有相互關聯但不完全相同的偏好的情況進行了分析,其中的決策選擇空間是連續的,該文分別討論了采用平均規則與中值規則時所對應博弈的對稱貝葉斯Nash均衡的存在性問題,并比較了這兩種規則在不同偏好關聯程度下的性能。
由于從眾心理,群體成員經常會根據對其他成員行為的觀察相應調整自己的行為。文[63-64]對從眾心理對群體決策的影響進行了研究,其中假定群體成員一方面希望選出好的決策選項,另一方面又希望自己成為勝出的一方。文[63]分析了群體規模較大時同時投票機制與順序投票機制的均衡特征和信息集結質量,文[64]指出這種從眾心理導致同時存在多個均衡,而且對于這些均衡中的多數,信息不能被有效集結。文[64]從某種程度上說明了最優決策規則設計的困難。
六、現有研究工作的不足之處
其一,社會選擇理論與公共選擇理論以及管理學領域對群體決策的研究,主要考慮偏好集結的有效性,而其中的偏好則是指對決策選項的偏好,這種偏好取決于決策者對最終結果的更根本意義上的偏好和對世界真實狀態的信念。在現實社會中,純粹以偏好的有效集結為終極目標的重要群體決策問題幾乎不存在,例如社會選擇理論與公共選擇理論最重要的應用領域――選舉,既是偏好集結(這里指更根本意義上的偏好),更是信息集結。僅考慮偏好的集結問題,不考慮偏好的形成過程以及信息在偏好形成過程中的潛在作用,無法分析群體內外部交流與互動等對決策的影響,無法解釋現實中的很多現象,因而對相關決策機制設計的指導作用較為有限。
其二,社會心理學從認知的角度研究群體決策,其結論出自于對實驗和經驗數據的統計學分析,易于為人們接受。但由于從實驗或經驗數據中利用統計學方法推導出群體的偏好分布參數極為困難,所以無法深入研究群體決策過程中因偏好不一致而導致的隱藏與扭曲私有信息等策略。
其三,與社會選擇理論和公共選擇理論一樣,用博弈論研究群體決策信息集結問題的文獻也是以理性選擇假設作為判斷與決策的微觀基礎。盡管所有群體成員嚴格按照貝葉斯規則更新自己的信念等完全理性假設對于心理學家和普通人來說都是難以接受的,但博弈論文獻還是以其數學分析的簡潔與嚴謹顛覆了很多直覺上的認識,通過對群體決策者動機的分析,有助于我們理解決策機制的哪些方面可能會引起不利于決策目標實現的策略,進而有助于決策機制的改進。隨著群體成員偏好差異程度和決策問題重要程度的增加,審議方式和決策規則趨向于書面化和正規化,群體思維與群體極化現象將很少出現,決策結果也將更接近于博弈分析的預測。
目前對群體決策信息集結問題的研究尚處于起步階段,還有很多不完善之處,在某些方面甚至存在根本性的缺陷。
第一,可能是受到信息經濟學研究的誤導,本領域的很多理論與實驗分析文獻,包括一些奠基性的文獻,混淆了信息與在信息基礎上形成的判斷。真實信息的披露不會引起其他群體成員以及公眾對自己決策能力的負面評價,更不會如判斷的披露那樣引起認知上的從眾,如果決策者掌握了確鑿可靠的信息,則其不會因為其他人基于其他信息產生的不同看法而輕易改變自己的信念。
除個別文獻外,現有研究群體決策信息集結問題的文獻幾乎都是將審議完全等同于信息經濟學領域的廉價磋商,將交流限制為每個群體成員同時向所有其他成員發送一輪公開的消息。在現實群體決策過程中,審議至少包括對各方面提供的信息的真實性的審議,以及對信息與世界真實狀態之間的邏輯關聯(即潛在的決策模型)的審議。因此,將審議建模為完全的廉價磋商的現實意義極為有限,對于偏好差異較大的群體更是如此。
第二,客觀上難以驗證的信息的可接受性,取決于接收者對于信息發送者的偏好的信念,例如,人們有充分的理由懷疑壟斷企業單方面提供的企業運營成本數據的真實性。另一方面,在很多情況下,信息的軟硬程度(可驗證程度)與信息獲取者和信息接收者的成本投入相關。因此,群體成員獲取可驗證信息與不可驗證信息的動機,以及群體成員對信息軟硬程度的投入,既取決于是否有審議階段以及審議方式和決策規則,也取決于群體成員的偏好和群體成員關于群體偏好差異程度的先驗信念。諸如此類問題現有文獻幾乎沒有涉及。
群體決策在現代社會無處不在,如政府部門對重大戰略性問題的決策、公司董事會對重要項目投資與實施問題的決策、審判委員會對犯罪嫌疑人的判決、專家對科學基金項目申請書的評審等。從組織或社會的目標出發,針對特定的決策問題,為了盡可能作出正確的決策,應該如何組成決策群體,選擇何種決策規則?此類群體決策的科學化與民主化問題很久以來一直是管理、政治、法律和經濟等領域討論的中心,其研究結果對于各類政治、社會、經濟組織的運行機制設計具有重要的意義。
中國學者對群體決策的理論與方法進行了大量的研究,提出了不少新的概念和方法,作出了很多重要貢獻,國家自然科學基金委員會對群體決策理論與方法研究也較為重視,曾將其列為優先資助領域。但根據現有的各類文獻和歷年的基金項目研究摘要,總體感覺國內對決策群體成員的動機和理考慮較少,到目前為止還沒有發現國內其他學者利用博弈論研究群體決策信息集結問題。
筆者試圖利用不完全信息博弈論和機制設計理論,研究決策群體成員的策略性信息獲取、信息傳遞和投票表決行為,揭示決策群體人員組成、審議方式、決策規則、透明性等決策機制的各個方面對群體決策的信息集結有效性的具體影響。并試圖從信息集結角度,為一些典型公共決策情形優化決策機制。
參考文獻:
[1] PIKETTY T. The informationaggregation approach to political institutions[J]. European Economic Review, 1999, 43(4-6):791-800.
[2] AUSTENSMITH D, BANKS J. Information aggregation, rationality, and the Condorcet jury theorem[J]. American Political Science Review, 1996, 90(1):34-45.
[3] FEDDERSEN T, PESENDORFER W. The swing voter’s curse[J]. American Economic Review, 1996, 86(3):408-424.
[4] FEDDERSEN T, PESENDORFER W. Voting behavior and information aggregation in elections with private information[J]. Econometrica, 1997, 65(9):1029-1058.
[5] MYERSON R. Extended Poisson games and the Condorcet jury theorem[J]. Games and Economic Behavior, 1998, 25(1):111-131.
[6] FEDDERSEN T, PESENDORFER W. Elections, information aggregation, and strategic voting[J]. Proceedings of the National Academy of Sciences of the United States of America, 1999, 96:10572-10574.
[7] FUJIKI H. The monetary policy committee and the incentive problem: A selective survey[J]. Monetary and Economic Studies, 2005, 23(S1):37-82.
[8] VANDENBUSSCHE J. Elements of optimal monetary policy committee design[EB/OL]. IMF Working Paper No. 06/277, 2006. (2006-06-30) 省略/external/pubs/ft/wp/2006/wp06277.pdf.
[9] GERLING K, GRNER H, KIEL A, SCHULTE E. Information acquisition and decision making in committees: A survey[J]. European Journal of Political Economy, 2005, 21(3):563-597.
[10] Mukhopadhaya K. Jury Size and the Free Rider Problem[J]. The Journal of Law, Economics, and Organization, 2003, 19:24-44.
[11] MARTINELLI C. Would rational voters acquire costly information?[J]. Journal of Economic Theory, 2006, 129(1):225-251.
[12] MARTINELLI C. Rational ignorance and voting behavior[J]. International Journal of Game Theory, 2007, 35(3):315-335.
[13] KITAHARA M, SEKIGUCHI Y. Condorcet’s jury theorem under costly information acquisition[EB/OL]. Working Paper, University of Tokyo, 2004. (2004-04-25).e.utokyo.ac.jp/cemano/research/DP/documents/coef54.pdf.
[14] KITAHARA M, SEKIGUCHI Y. Aggregate accuracy under majority rule with heterogeneous cost functions[J]. Economics Bulletin, 2006, 4(25):1-8.
[15] KITAHARA M, SEKIGUCHI Y. Condorcet jury theorem or rational ignorance[J]. Journal of Public Economic Theory, 2008, 10(2):281-300.
[16] BAG P, LEVINE P, SPENCER C. A note on: Jury size and the free rider problem[J]. Economics Bulletin, 2006, 4(3):1-12.
[17] TRIOSSI M. Costly information acquisition. Better to toss a coin?[EB/OL]. Working Paper, Collegio Carlo Alberto, 2010.(2010-03-15).webmanager.cl/prontus_cea/cea_2010/site/asocfile/ASOCFILE120100127120554.pdf.
[18] SWANK O, WRASAI P. Deliberation, information aggregation, and collective decision making[EB/OL]. Working Paper, Tinbergen Institute, 2003.(2003-06-20) .tinbergen.nl/discussionpapers/02006.pdf.
[19] CAI H. Costly participation and heterogeneous preferences in informational committees[J]. The RAND Journal of Economics. 2009, 40(1):173-189.
[20] BENIERS K, SWANK O. On the composition of committees[J]. Journal of Law, Economics, and Organization, 2004, 20(2): 353-378.
[21] LI H. A theory of conservatism[J]. Journal of Political Economy, 2001, 109(3):617-636.
[22] NICOLA P. Committee design with endogenous information[J]. Review of Economic Studies, 2004, 71(1):165-191.
[23] GERARDI D, YARIV L. Information acquisition in committees[J]. Games and Economic Behavior, 2008, 62(2):436-459.
[24] AUSTENSMITH D, FEDDERSEN T. Deliberation and voting rules[M]//AUSTENSMITH D, DUGGAN J. Social choice and strategic decisions. Berlin: Springer Berlin Heidelberg, 2005:269-316.
[25] COUGHLAN P. In defense of unanimous jury verdicts: Mistrials, communication, and strategic voting[J]. American Political Science Review, 2000, 94(2): 375-393.
[26] MEIROWITZ A. In defense of exclusionary deliberation: Communication and voting with private beliefs and values[J]. Journal of Theoretical Politics, 2007, 19(3): 301-327.
[27] AUSTENSMITH D, FEDDERSEN T. Deliberation, preference uncertainty, and voting rules[J]. American Political Science Review, 2006, 100: 209-217.
[28] GERARDI D, YARIV L. Deliberative voting[J]. Journal of Economic Theory, 2007, 134(1): 317-338.
[29] GUARNASCHELLI S, MCKELVEY R, PALFREY T. An experimental study of jury decision rules[J]. American Political Science Review, 2000, 94: 407-423.
[30] DORASZELSKI U, GERARDI D, SQUINTANI F. Communication and voting with doublesided information[J]. Contributions to Theoretical Economics, 2003, 3(1), Article 6.
[31] SCHULTE E. Information aggregation and preference heterogeneity in committees[J]. Theory and Decision, 2010, 69(1):97118.
[32] MATHIS J. Deliberation with partially verifiable information[EB/OL]. THEMA Working Papers No. 2006-03, (2006-08-20). ucergy.fr/IMG/2006-03.pdf.
[33] MEIROWITZ A. Designing institutions to aggregate preferences and information[J]. Quarterly Journal of Political Science, 2006, 1(4): 373-392.
[34] GERSBACH H, HAHN V. Information acquisition and transparency in committees[EB/OL]. CEPR Discussion Paper no. 6677, London, Centre for Economic Policy Research, (2009-06-20). papers.省略/sol3/papers.cfm?abstract_id=1084060.
[35] LEVY G. Decision making in committees: Transparency, reputation and voting rules[J]. American Economic Review, 2007, 97(1):150-168.
[36] VISSER B, SWANK O. On committees of experts[J]. The Quarterly Journal of Economics. 2007, 122(1):337-372.
[37] SWANK O, VISSER B. Is transparency to no avail? Committee decisionmaking, premeetings, and credible deals[EB/OL]. Working Paper, Tinbergen Institute, (2009-06-18). people.few.eur.nl/bvisser/articles/Transparency%20Dec%202009.pdf.
[38] SEIDMANN D. A Theory of voting patterns and performance in private and public committees[EB/OL]. CeDEx Discussion Paper 2009-06, (2009-10-15). nottingham.ac.uk/economics/cedex/papers/2009-06.pdf.
[39] FELGENHAUER M, GRUNER H. Committees and special interests[J]. Journal of Public Economic Theory, 2008, 10(2): 219-243.
[40] SEIDMANN D. Optimal quotas in private committees[J]. The Economic Journal, 2008, 118(525):16-36.
[41] DAL B E. Bribing voters[J]. American Journal of Political Science, 2007, 51(4):789-803.
[42] HAHN V. Transparency in monetary policy: A survey[J]. IFO Studien, 2002, 48(3):429-455.
[43] SIBERT A. Monetary policy committees: Individual and collective reputations[J]. The Review of Economic Studies, 2003, 70(3):649-665.
[44] MEADE E, STASAVAGE D. Publicity of debate and the incentive to dissent: Evidence from the US Federal Reserve[J]. The Economic Journal, 2008, 118(528):695-717.
[45] HAHN V. Committees, sequential voting and transparency[J]. Mathematical Social Sciences, 2008, 56(3):366-385.
[46] HANS G, HAHN V. Should the individual voting records of central bankers be published?[J]. Social Choice and Welfare, 2008, 30(4):655-683.
[47] NITZAN S, PAROUSH J. Optimal decision rules in uncertain dichotomous choice situation[J]. International Economic Review, 1982, 23:289-297.
[48] BENYASHAR R, NITZAN S. The optimal decision rule for fixedsize committees in dichotomous choice situations: The general result[J]. International Economic Review, 1997, 38:175-186.
[49] BENYASHAR R, KHULLER S, KRAUS S. Optimal collective dichotomous choice under partial order constraints[J]. Mathematical Social Science, 2001, 41:349-364.
[50] KRAUS S. Optimal collective dichotomous choice under quota constraints[J]. Economic Theory, 2002, 19:839-852.
[51] MCLENNAN A. Consequences of the Condorcet jury theorem for beneficial information aggregation by rational agents[J]. American Political Science Review, 1998, 92:413-418.
[52] BENYASHAR R. Information is important to Condorcet jurors[J]. Public Choice, 2006, 127(3):305-319.
[53] BALLESTER M, REYBIEL P. Does uncertainty lead to sincerity? Simple and complex voting mechanisms[J]. Social Choice and Welfare, 2009, 33(3):477-494.
[54] LASLIER J, WEIBULL J. Providing incentives for informative voting[EB/OL]. Working Paper, Ecole Polytechnique, (2006-10-10). hal.inria.fr/docs/00/24/30/42/PDF/2007-01-04-1531.pdf.
[55] FEDDERSEN T, PESENDORFER W. Convicting the innocent: The inferiority of unanimous jury verdicts under strategic voting[J]. The American Political Science Review, 1998, 92(1):23-35.
[56] BOND P, ERASLAN H. Strategic voting over strategic proposals[J]. Review of Economic Studies, 2009, 77(2):459-490.
[57] BENYASHAR R, MILCHTAICH I. First and second best voting rules in committees[J]. Social Choice and Welfare, 2007, 29(3):453486.
[58] COSTINOT A, KARTIK N. On optimal voting rules with homogeneous preferences[EB/OL]. Working Paper, Massachusetts Institute of Technology,(2009-05-25). econmit.edu/files/3732.
[59] MEHMET B, PARIMAL K B. Committee decisions with partisans and sidetransfers[J]. Theory and Decision, 2002, 52(3):267286.
[60] JAEHOON K. A model of adversarial committees[EB/OL]. Working Paper, University of Rochester, (2005-09-12).省略.rochester.edu/~jaek/Adversarial.pdf.
[61] CHWE M. Anonymous procedures for Condorcet’s model: Robustness, nonmonotonicity, and optimality[J]. Quarterly Journal of Political Science, 2010, 5(1):4570.
[62] GRNER H, KIEL A. Collective decisions with interdependent valuations[J]. European Economic Review, 2004, 48(5):1147-1168.
【關鍵詞】博弈論;社交網絡;訪問控制;SNS
1、引言
隨著移動通信、光纖通信、云計算、多媒體等技術的快速發展,有效促進了社交網絡平臺的普及和應用,已經誕生了QQ、微信、微博、BBS、Twitter、Facebook等社交網絡平臺,這些社交服務采用了SNS模式,可以為人們提供交友、購物、學習等多種服務,擴大了人們生活交際的渠道和平臺,進一步改善人們的生活質量和水平[1]。社交網絡發展過程中,訪問控制一直是人們研究的重點,論文基于筆者多年的研究,詳細地分析了社交網絡應用發展過程,探討了基于博弈論的社交網絡訪問控制應用設計功能,構建完善的用戶信任機制、損益機制和病毒防御機制,能夠提高社交網絡訪問控制能力和成效。
2、社交網絡應用分析
隨著Web2.0的誕生,人們社交服務采用的SNS平臺已經得到了廣泛應用,其以人為本,具有真實化、個性化、互動性等多種特征,目前已經誕生了多種SNS網站,比如LinkedIn、微博、BBS等[2]。具體的社交網絡應用發展包括以下幾個方面:
(1)高校型SNS平臺。高校SNS平臺發展起步較早,一直走在社交網絡的前言,目前常用的高校社交網絡平臺為人人網、BBS、Facebook等,擴展了高校學生交友、學習、就業渠道,豐富高校學生的精神文化生活,
(2)商務型SNS平臺。商務交往是企業發展的重要途徑,商務活動是企業推廣產品、市場營銷的重要任務,構建商務型SNS平臺,可以為企業構建商務圈,為企業發展提供合作交流、洽談渠道,目前最為常用的商務SNS平臺為LinkedIn,該平臺擁有將近7500萬家企業入住,涉及電商、旅游、工業、農業等多個領域。
目前,隨著SNS服務平臺引入更加先進的推廣技術,社交網絡在各個領域如雨后春筍,誕生了飯否、美團、占座等多個平臺,覆蓋了人們工作、生活和學習的各個領域,促進了人們生活信息化、便捷化,具有重要的作用和意義。
3、博弈論在社交網絡訪問控制中的應用設計
3.1構建完善的用戶信任機制
目前,許多網絡構建信任機制常用的方法是根據網絡節點操作記錄,判定使用主體可信度[3]。社交網絡用戶信任可以利用博弈論的網絡節點信任數值計算方法,確定用戶的信任度,計算過程中利用的數據包括用戶注冊時間、發帖數量和朋友圈人數等,具體的計算方法如下:
(1)用戶驅動方法。用戶驅動方法可以根據自己的社會關系、朋友圈確定用戶信任度,比如用戶和朋友圈的許多人都擁有一個共同好友,則該好友的可信度就判定為較高,比較符合用戶的實際情況,具有較高的靈活性。
(2)機器驅動方法。機器驅動方法可以通過SNS平臺的發現機制、推薦機制進行執行,平臺可以搜集用戶的詳細信息,利用用戶的瀏覽記錄、消費記錄等行為,統計計算用戶的信任值,可以迅速、客觀、簡單地分類用戶,具有自動推薦等特點。
(3)混合驅動方法。混合驅動方法在集成用戶驅動、機器驅動等方法的優點,自動計算和確定用戶信任度,為用戶推薦朋友圈,并且通過用戶判定之后方可建立信任機制,提高了信任可識別性,具有重要的作用。
3.2構建用戶損益機制
社交網絡用戶損益是通過朋友圈人數進行確定的,朋友圈人數越多,收益越大,朋友圈人數越少,損失就越大。但是,用戶朋友越多,個人信息和隱私泄露的概率就變大,為用戶信息帶來了較大的風險。構建用戶損益機制,可以防止網絡欺騙,鼓勵用戶之間真誠交流。基于博弈論的用戶損益機制包括欺騙與非欺騙服務、誠實與拒絕服務等博弈策略。如果用戶認為來訪人員帶來的損失超過收益,存在欺騙訪問行為,可以通過網絡將舉報信息發送至服務器或管理員處,通過監管對訪問人員進行懲罰;當系統認為收益超過損失,判定為誠實訪問,將其列入到用戶的朋友圈,擴展用戶的朋友圈人數,提升用戶收益?;诓┺恼摰挠脩魮p益機制可以較為準確地識別欺騙訪問、誠實訪問,強化欺騙訪問的處罰力度,促使用戶不能使用社交網絡實施欺騙行為,減少欺騙用戶數量,提高誠實訪問用戶數量,促進社交網絡能夠健康運行和發展。
3.3構建網絡病毒防御機制
隨著社交網絡服務平臺的普及,其在為人們帶來高質量、信息化生活的同時,也為人們帶來了潛在的安全威脅,造成人們的信息丟失,進而錢財、生命安全受到侵害,嚴重的損害了社交網絡正常運行和發展。基于博弈論的網絡病毒防御機制可以將用戶進行分類,分別是合法用戶、攻擊威脅用戶,這兩種用戶屬于非合作性質的博弈,一方的損失必然伴隨一方的獲利,是一種非零和的博弈,兩者之間的損失和收益是不對等的,并且博弈策略偏向維護合法用戶,也就是收益時對合法用戶影響較大,損失時對攻擊威脅用戶影響較大,這種策略可以阻止網絡攻擊,降低病毒對社交網絡合法用戶的侵害,具有重要的作用和意義。
4、結束語
隨著社交網絡平臺的快速誕生,社交網絡保存了海量的用戶信息,因此亟需提高訪問控制管理水平,以便保證用戶信息的安全性。論文基于博弈論設計了一種訪問控制方法,可以構建用戶信任機制、損益機制和病毒防御機制,更加符合人們參與社交網絡的應用背景,提高人們社交服務的信息化水平,具有重要的作用。
參考文獻
[1]孟憲佳,馬建峰,王一川,等.面向社交網絡中多背景的信任評估模型[J].西安交通大學學報,2015,49(4):73-77.
[2]陳慶麗,張志勇,向菲,等.面向多媒體社交網絡的訪問控制模型[J].西安電子科技大學學報:自然科學版,2014(6):181-187.
[3]劉娜,葉春曉.線上社交網絡訪問控制模型綜述[J].計算機系統應用,2014(5):1-7.
作者簡介
郝宗波,男,漢,19770528,籍貫四川,副高級,研究方向:社交網絡、軟件工程。
【關鍵詞】 博弈論 電力項目 管理方法 創新
隨著經濟的進步和科技的發展,電力市場逐漸繁榮和發展起來,電力建設項目增多。電力項目管理需要實現對電力工程成本、質量以及工期的管理,傳統的電力項目管理方法很難實現對三大控制目標的有效平衡,很多情況下,電力企業為了保障電力項目質量,就要加大成本的投入,或是為了趕工期而忽視質量,這樣不利于電力項目的建設。博弈論在電力項目管理中的應用不僅可以有效的解決這一難題,還會實現電力項目管理方法的創新。
1 國內外電力項目管理方法概述
(1)我國傳統的電力項目管理方法。受技術和成本的限制,我國電力項目管理大致上經過了三個發展階段,首先是建國初期的統包統管和外商包建模式,電力項目管理的重要性沒有得到充分的認識,建設單位往往投入較大的成本,項目管理的專業化太低,電力項目管理的整體水平不高。其次是三方體制和指揮部模式,這一模式還是具有協調難度較大和管理水平較低的問題。自1988年以來我國開始學習工程項目管理模式,對電力建設市場進行了相應的改革,資本金制、法人責任制、工程監理制、招標投標制以及經濟合同制逐漸應用到電力項目的建設過程中,電力項目的管理方式有了一定的進步和創新。
(2)國外電力項目管理方法。國外比較傳統的電力項目管理模式是業主方進行項目管理。近年來,快速軌道方式以及階段發包模式得到了快速的應用,該種管理模式可以最大限度的縮短工期,節省工程項目成本。BOT建造、運營以及移交管理模式是一種依靠私人資本進行基礎設施建設的項目管理方式,代建制模式是依靠政府招標來選擇合適的項目管理單位。電力項目管理模式不一而足,建設單位要根據工期、成本以及質量的問題,綜合各種因素進行選擇。
2 我國傳統電力項目管理方法中存在的不足
隨著改革開放的深入和電力市場的繁榮和發展,工程項目監理制度和招標承包制度逐漸引入了電力項目的建設市場,電力建設可以優先選擇信譽較好的施工單位,這對提高電力項目工程的施工質量、提高投資效益以及進行科學決策都是有利的。但是,該種電力項目管理方式中,電力項目承包商和業主之間是對抗關系,承包商中標的價格較低,承包商以及業主在履行合約的過程中經常會遇到索賠問題。
(1)合同訂立的問題。由于業主和承包商之間的對抗關系,只有規范化和精細化電力項目承包合同,一些模棱兩可的問題才能有效的避免。由于電力項目的建設涉及到氣候、地質和水文等很多不可控因素,在這種情況下,電力項目承包建設合同的條款越來越細,但是在電力項目的建設過程中,還是存在一些問題。業主和承包商均將合同作為爭奪利益的方式,在一些問題不能及時解決的情況下,很容易引發問題甚至是訴訟。
(2)項目轉包現象普遍。電力項目建設涉及的地區范圍較廣,很多電力項目建設的工期較長,電力項目建設過程中分包和轉包的現象普遍。這也直接導致了不重視合同、體制和觀念落后、法律法規不健全以及管理角色定位錯誤的問題,電力項目的施工質量、施工進度以及成本都很難控制。電力項目建設的損失較大。目前,我國雖然引進了工程招標投標制度,但是工程承包模式以及工程建設監理的模式還沒有得到真正的解決,電力項目管理還存在眾多的問題,現有的電力項目管理方法不能滿足電力項目建設國家化的要求。
3 基于博弈論的電力項目管理方法新模式的提出
(1)博弈論概述。對于博弈論的研究始于19世紀,經濟學家對金融寡頭問題進行了深入的研究,1944年《博弈論與經濟學》一書系統的闡述了博弈論理論體系,博弈論不僅在數學領域、經濟學領域得到了快速的發展,還在經濟、政治、生物進化等領域得到了重要的應用。博弈論在項目管理中的應用則是指通過承諾、協議和制裁而具有約束力。博弈是利益的分配,博弈論在電力項目管理中應用可以創新管理模式和管理方法。近年來,相關專家都對博弈論在電力項目管理中的應用進行了深入的研究,對質量、成本和工期項目管理對象進行了分析,并對施工行為和監理行為進行了分析。目前,博弈論在電力項目管理中的應用雖然是還沒有系統的論證體系,但是博弈論可以改變電力項目管理中業主和承包商的對抗關系,促進雙方之間信息的充分交流,實現雙方利益的共贏。博弈論在電力項目管理中的應用不僅可以改善項目管理參與方信息不對稱的問題,還可以降低信息交易成本,實現利益的共贏。
(2)基于博弈論的電力項目管理方法的提出。電力工程項目的建設也需要實現利益的最大化,參與方利益的共贏已經成為各方的共識。電力項目施工人員如果一天的工作結束之后拿到當天的工資,那么施工人員的工作積極性會大大的提升,項目管理人員還需要對項目進行定期的評價,針對項目管理中存在的諸多問題進行及時的調整,選擇合適的解決方法,實現項目動態的管理與參與方信息的共享,進而實現項目參與各方利益的共贏。目前,基于博弈論的電力項目管理方法已經在一些電力工程項目建設中得到應用,項目管理方式也在不斷的創新和進步。
4 基于博弈論的電力項目管理方法創新與實踐
(1)團隊的建設。隨著社會用電量的增大,電力項目的建設已經得到了快速的發展,電力工程建設市場逐漸繁榮。但是,目前無論是電力項目管理人員還是施工人員都存在穩定性差、施工人員素質差以及投入與產出嚴重失衡的問題,這不利于電力項目管理方法的創新和進步。因此,電力工程建設單位要塑造良好的形象,只有提高了電力建設項目的效益,電力項目參與各方才能都獲得收益。電力建設項目管理人員還要深入學習博弈論的內涵和意義,對質量、成本以及工期進行之間的影響與被影響關系進行深入的研究,提高管理的水平,提高管理的能力,減少成本的支出,拓展管理信息與專業技術的共享范圍。
(2)信息傳遞方式的改變。參與方只有加強信息交流,縮短信息交流的時間,電力項目的建設和發展才能得到新的進步?;诓┺恼摰碾娏椖抗芾矸椒ǜ欣谛畔⒌慕涣骱蛡鬟f,避免施工過程中的信息不對稱問題。目前基于博弈論的電力項目管理新方法已經逐漸應用到電力項目的建設和管理中,電子信息技術的應用加快了信息交流的速度,項目參與方可以實現方便和靈活的信息交流,降低信息傳遞成本,有利于參與方針對項目建設中出現的問題進行及時的協商,降低成本支出。
(3)合作機制的構建。基于博弈論的電力項目管理方法需要利益各方的信息交流和合作,合作的水平和程度取決于電力項目合作機制的運行狀況。博弈論在電力項目管理中的應用需要管理人員對質量、成本以及工期進行綜合的考量,對傳統的項目管理方式進行創新和優化,實現更加主動性、組織性、計劃性以及結構性的合作機制的建設,強化項目建設各方的協作和合作,對項目的投入和產出進行更加深入的研究,發揮項目管理人員在資源效用、技能以及經驗方面的能力。此外,參與各方還要進行協商機制的建設,對出現的問題進行及時有效的解決,實現信息一體化、透明化以及討論的實時化,實現電力項目管理人員在職業經驗和技術技能經驗的共享。
(4)激勵機制的構建。項目管理的目的就是實現利益的最大化,施工人員是電力項目管理中的重要因素。電力項目管理的過程中可以引入激勵機制,逐步創建內部激勵和外部激勵機制,可以對施工人員進行物質上和精神上的獎勵,在充分考慮電力項目管理影響因素的基礎上實現各種激勵機制的結合,在各方利益的博弈中實現投資效益的最大化。
5 結語
隨著經濟的發展和人們生活水平的提高,社會的總體用電量呈連年上升趨勢,電力建設項目逐漸增多。質量、工期和成本一直是工程項目管理的三大控制目標之一,電力項目的質量、成本和工期也是各方利益綜合博弈的結果。很多情況下,電力企業為了保障電力項目質量,就要加大成本的投入,或是為了趕工期而忽視質量,這樣不利于電力項目的建設。博弈論在電力項目管理中的應用不僅可以有效的解決這一難題,還會實現電力項目管理方法的創新。
參考文獻:
[1]索跡,祁春清.博弈論在電力市場中的應用[J].科技信息(科學教研),2011(11).
Key words: sports,game,equilibrium solution, teaching method
中圖分類號:G633.95;G633.96
引言
近幾年,隨著我國高等教育向著大眾化方向發展,人們對高職教育開始重視起來,高職教育也得到了迅猛的發展,全國相繼成立了許多公辦或者私立的高職院校,高職學生也就變得越來越多。因此正確分析和了解當前高職學生的特點,選擇適合這些學生的教學方法和內容,努力做好課堂的教學和管理工作就顯得尤為重要。
體育教學有三項任務:一是增強體質;二是掌握體育知識、技術、技能;三是進行思想品德教育[3]。因此,如何更好的開展體育教學,實現這些教學任務顯得很重要。本文通過應用博弈理論來研究高職院校體育課堂中學生的心理活動和行為,教師可以選擇合適的教學方法和內容來實施教學,從而提高體育課程的教學效果,達到教師學生都受益的效果。
一、體育課堂中的博弈理論
博弈論考慮游戲中的個體的預測行為和實際行為,并研究它們的優化策略。博弈中應該包括博弈主體,策略集以及收益函數。而在體育課堂中就存在博弈雙方:教師和學生。教師上課所采用的教學方法和考評方法就是教師的策略集,而學生上課采取的學習興趣和態度就是學生的策略集。教師和學生在課堂結束后都會獲得相應的收益(教師的收益包括課時收入、情感收入,而學生的收益就是課程成績和身體的鍛煉)。在這個教學過程中,教師和學生都追求最大收益:教師希望學生有興趣學習運動技能,在學會技能的同時鍛煉身體,順利完成課堂教學;而學生希望在體育課堂上,玩得好,還學會教師所教的體育技能,取得好的體育成績的同時讓身體得到鍛煉。
二、體育課堂中的博弈模型
由前面的分析可以知道教師和學生都希望自己的收益最大化,下面給出教師和學生的收益矩陣。
首先我們做如下假設:
表示教師上課的工資收入, 表示教師上課的情感收入(教會學生運動技能有成就感), 表示教師認真上課的成本投入(包括備課,體力消耗等), 表示就是不認真上課的成本投入; 表示學生認真上課取得的好成績, 表示學生不認真上課取得的成績, 表示學生認真鍛煉的身體收益, 表示學生不認真鍛煉的身體收益, 表示學生認真鍛煉需要付出的成本(包括體力消耗等), 表示學生不認真鍛煉需要付出的成本(包括體力消耗,課堂懲罰和掛科后補考需要付出的精力消耗和金錢消耗)。
從以上收益矩陣可以看出,要想得到該博弈的均衡,必須確定 和 的大小關系,以及 和 的大小關系。而考慮現實情況我們可以得出 > ,
> 。因此,這個博弈的均衡解為(認真,認真)。此均衡表示,在體育教學過程中教師認真上課,學生有興趣上體育課,并且認真的學習運動技能,這樣教師和學生都能得到最大收益。
三、體育教學方法研究
根據我們上面分析的體育課堂教學中教師學學生的博弈模型結論看以出,要想達到理想的教學效果,
需要教師和學生共同努力,而教師的付出占主要位置。因此,體育教師就需要多研究課堂教學方法,然后根據學生特點采取合適的教學方式。
(一)分組教學法[1]
教學過程中進行合理分組,可以使課堂教學生動活潑,充滿競爭和歡笑,并能充分發揮學生的主體作用,激發學生學習潛能,擺脫過去那種生硬呆板的行政分組,簡單而籠統的分組輪換所帶來的沉悶消極的心理空間和課堂氛圍。而分組教學的目的是追求高效益,優化課堂教學結構。因而,分組教學必須從教材內容、場地器材等客觀條件出發,尤其要切合學生實際進行分組,過多或者過于頻繁的分組輪換反而有害教學。其次,分組教學應該注意靈活性。在明確教師主導地位的前提下,分組教學應該充分發揮學生的主體作用,讓學生有選擇分組形式的較大的自主權,以激發學習興趣,將原來的“要我學”改變成“我要學”。分組方式可以采取以下幾種:性別分組法、行政分組法、體能分組法、興趣分組法、友伴分組法、隨機分組法、補償分組法、健康分組法[2]。
(二)游戲教學法
游戲教學具有很強的趣味性、娛樂性、綜合性、教化性的特點,也具有鍛煉身體的價值,它能夠把我們的教育目標潛移默化地融入到其中。體育課堂教學以游戲開始往往可以激發學生的興趣,而每個學生都希望自己的能力得到表現,讓別人了解自己的長處,從而得到別人的贊同、認可和尊重。在體育游戲愉快的競爭和對抗中,他們能夠很自然地表現出自己的體力、技能與智慧,從而得到快樂的體驗,品味到成功的喜悅。這樣開始的教學,不但有利于培養學生良好的道德品質,而且能夠發展學生智力,培養學生的身體基本活動能力運動技術和技能。但是在教學中必須選擇合適的游戲,讓它發揮正向作用,選擇原則包括:鍛煉性原則、教育性原則、趣味性原則、安全性原則。
(三)聯系實際法
體育課不應該只是教授學生運動技能,還應該滲透各個方面的教育。所以體育教師可以在教學中給學生講解體育與就業的關系。現在許多企業和單位都注重體育活動,經常參加體育競賽,或者舉行內部競賽,這樣企業和單位在招聘員工時便傾向于那些既專業對口又有體育特長的人員。因此,學生如果學好專業課的同時,能在體育課堂上積極認真的學習運動技能,比如籃球、排球、羽毛球、乒乓球等,并在平時多加練習,便可在這些企業招聘中脫穎而出,走向理想的崗位。
(四)激勵教學法
體育教師在課堂常規教學中,可以多鼓勵學生,當學生做練習的時候,多給與評價。做的好就表揚,或者給與物質獎勵。做的不好也不要批評,而是指出錯誤,再親身示范,讓學習更好的學習技能。
四、結論
關鍵詞:博弈論圖書館數字資源資源共享
中圖分類號:G251 文獻標識碼:A 文章編號:1009-3044(2016)29-0017-03
隨著大數據時代的到來,信息的互聯互通成為提高信息服務能力的重要前提,任何一個圖書館都難以同時滿足不同學科專業、不同層次用戶的信息需求,也不可能實現對所有資源的收集和管理,數字信息資源共享就是為了解決個體圖書館信息資源的有限性和信息需求無限性的矛盾而采取的圖書館間合作建設與發展的策略。現階段,我國文獻信息資源共享的理論研究主要集中在文獻資源的布局和配比方面,因此多將信息資源共享效率低下的癥結歸于管理體制的不完善、技術手段的落后和宏觀調控的缺乏。信息資源共享是追求自身效用最大化的過程,是一種分析投入成本和產出收益的博弈過程,通過借鑒博弈論的研究方法,從圖書館個體利益和共享集體利益的關系出發進行研究,可以進一步認識阻礙數字信息資源共享的因素,并找到解決這些問題的方法和措施。
1博弈論概述
1.1博弈論的涵義
博弈論,也稱對策論,英文為Game Theory,是根據信息分析及能力判斷,研究多個決策主體之間行為的相互影響作用,以取得收益或效用最大化的一種對策理論。其中的“博弈”是指個人、隊伍或組織,在一定的環境條件及規則下,同時或先后、一次或多次,根據環境和競爭對手的情況變化,從各自允許的行為或策略中進行選擇、加以實施,并從中取得相應結果的過程。中國早在幾千年以前就已存在博弈思想,田忌賽馬的故事就是較好的博弈論案例。自20世紀80年代,博弈論得到了廣泛的應用,尤其對信息經濟學的發展做出了重要的貢獻。
1.2博弈論“囚徒困境”經典模型分析
博弈論經典模型囚徒困境建立在一個假設之上,即甲、乙兩人被懷疑是合伙的偷盜犯,警方雖逮捕了他們但沒有掌握充分證明兩人犯罪行為的證據,警方將其分開單獨審問,雙方不能進行信息的交流。警方對這兩個嫌疑犯的量刑原則是:如果一方坦白,另一方不坦白,則坦白者從寬處理,判刑1年;不坦白者從重處理,判刑7年。如果兩人都坦白,則每人判5年刑。如果兩人都不坦白,則警方由Tile據不足,只能對每個人各判刑2年。表格1中的框圖體現了這個博弈的分析過程,左方是甲的可選擇策略,上方是乙的可選擇,雙方均可做出坦白和不坦白兩種選擇。其中包含數字的格對應甲乙的一個策略組合,每格第一個數字代表甲的報酬,第二個數代表乙的報酬。比如第二個數字格是指當甲坦白,乙采取不坦白的策略時,甲的報酬為-1,乙的報酬也是-7。圖中的報酬均為負數,以表示判刑的年數。
在警方交待了量刑原則以后,會從自身利益出發進行分析,選擇坦白或不坦白的策略,此時雙方展開了博弈的過程。首先分析甲的思考過程,當甲進行決策選擇的時候一定會先考慮乙的想法。根據圖表1的矩陣圖可見,當囚犯乙選擇了坦白的策略時,囚犯甲坦白則獲刑5年,不坦白獲刑7年。由此,當乙選擇坦白時,甲必然選擇坦白(因為5
如果仔細分析囚徒困境報酬矩陣,甲乙雙方若都作出不坦白的決定,會得到更好地結果,即各判刑2年??墒且驗闆]辦法進行信息溝通,每一方都會擔心對方坦白但自己不坦白時會受到重判(即對方坦白獲刑1年,自己不坦白則被判7年)。因此,每個囚犯都從個人利益出發考,最終的結果都會選擇坦白坦白,(坦白,坦白)便是囚徒困境博弈模型必然的均衡結果。
囚徒困境的結論折射出的道理發人深省,從個體的視角思考做出的占優策略決定(-5,-5),顯然劣于做出合作策略的選擇(-2,-2)。換句話說,從單個個體的角度出發得出的占優策略,從整體而言得出的卻是最不理想的結局。囚徒困境最終達到的策略均衡,體現出了個人理性和集體理性的矛盾沖突。目前,圖書館在數字信息資源共享問題上也存在著類似的矛盾,我們將“囚徒困境”的博弈分析方法運用到資源共享問題上,也可以解釋合作的不穩定性及相關問題。
2圖書館數字信息資源共享的博弈分析
2.1數字信息資源共享的靜態博弈
數字信息資源共享一直是圖書情報界關注的重大課題,每個圖書館都有資源共享的愿望,圖書館信息資源的共享,可以實現整體效用的最大化。假定參與共享合作博弈的圖書館為A、B兩個,分析圖2矩陣可以發現,如果A、B館都選擇合作策略,每個參與者均可獲得收益為10,總報酬最大為20;如果A、B兩者中有一方選擇合作,而另一方選擇不合作,參與者報酬分另4為6、12,總報酬為18;倘若A、B兩館都做出不合作的選擇,那么各館報酬都是8,總報酬16是最小值??梢姡ê献?,合作)策略是團體利益最大的策略選擇(20>16)。
事實上,一些圖書館為了自身的利益,往往從個人理性角度出發,最終與團體利益沖突,陷入“囚徒困境”。類似于囚徒甲、乙的決策過程,A館會根據B館的決策選擇策略,當B選擇合作策略時,A若選擇合作可得10,A若選擇不合作,既省去了共享資源需付出的成本,又無償享受了B館提供的信息資源,報酬是12。因此,A必然不會合作(顯然12>10)。同理可推得,B做出了不合作的選擇時,A仍然會選擇不合作策略(因為8>6)。顯而易見,無論B做出合作或者不合作的選擇,A都會采取不合作策略。同樣的分析結果對B館也是適用的,最后的博弈結果為(不合作,不合作),這時總報酬16,小于最優策略的總報酬20。
這一博弈矩陣可以看出,大家最初都希望達到(合作,合作)總報酬為20的結果,但是通過報酬矩陣分析可見,即便已經簽訂合作協議,各自館也會抱有“搭便車”的心理,就是如果你合作我不合作,我就可以占到便宜(12>10),于是各自違背共享約定,形成了圖書館資源共享博弈的(不合作,不合作)結果。
上述兩種博弈均為一次性博弈,參與博弈者都只能進行一次選擇決定,另外博弈參加者在做出自己決定的時候并不清楚對方的決定,大家都是同時決定自己的一次性策略選擇。處在這樣的前提之下,參與者都做出了自己的策略選擇時便已完成了一個完整的博弈過程,并得出了最終結論,這種博弈稱為靜態博弈。在靜態博弈中,出于個人理性的策略選擇往往導致了從整體而言的最壞結果。一方面,在達成合作協議以后,參與者都會有投機的心理,并從自身利益出發暗地選擇了不合作的做法。另一方面,對于一次性的博弈,只要參與者做出了最終決定便完成了博弈過程,對于違反約定的行為沒有補救和懲罰的有效措施,無法通過后續的博弈進行調整和制約。
2.2數字信息資源共享的動態博弈
實際上,博弈通常為一系列重復進行的運動,即相對靜態博弈而言的動態博弈,在連續進行的動態博弈中,上面結果會有所不同。
2.2.1數字信息資源共享的無限次重復博弈
無限次重復博弈是指相同結構的博弈可以無限次地重復進行下去。如果設定在數字資源共享的無限次重復博弈中,不管哪一方圖書館在其中的一輪合作博弈中采取了不合作的行動,在以后的博弈中便會遭到其他館“不合作”的報復策略,而且這一不合作策略會在未來的所有博弈中重復下去,長此以往,首先違約的一方便永遠失去了與另一方合作的機會。因為在無限次重復博弈中,存在著對欺騙和違約行為報復的機會,因此參與合作的各方會擔心采取不合作策略給自己帶來的長期損失,不會主動選擇不合作的策略,使得數字信息資源共享合作得以維持。
繼續用圖2加以說明,對于圖書館A,各館如果一直處于合作的狀態,便可以長期獲得報酬10,累積起來10+10+10+…,但如果抱有機會主義的想法,打破約定選擇了不合作的策略,他的確獲得了一次性的利益,得到報酬為12,但在以后的無限次重復博弈中,均會受到對方不合作的報復行動,收益只能為8。為了一次性的好處,使得日后的收益從原來合作策略時的10+10+10+…下降為不合作策略時的8+8+8+…。顯然,任何一個圖書館在數字信息資源的無限重復博弈中,為防止被報復而喪失長期的經濟效益,都會遵守協議,采取合作的策略。
2.2.2數字信息資源共享的有限次重復博弈
在有限次重復博弈中,假設事先約定只合作5次,用逆推法進行分析,各方均知道第5輪博弈是最后一輪博弈,因此這一輪博弈便同靜態博弈無異。根據前面的分析,這一輪的違約不可能在以后受到懲罰和損失,那么,每個圖書館出于個人理性出發選擇的占優策略就是不合作的結果。逆推到第4輪,因為大家都可以推算出第5輪不合作的結果,因此第4輪博弈也會采取不合作的策略。由此類推直到第1輪,都可以得到同樣的結果。顯然,在有限次重復博弈中,圖書館數字信息資源的共建合作是不穩定的,博弈的最終均衡策略為(不合作,不合作)。
3用博弈論的思想解決數字信息資源共享問題
在現實生活中,參與博弈的各方合伙的機會必然是有期限的,信息組織間的合作共享是否根本無法實現呢?顯然在現實生活中是存在著長期合作的共同體。事實上,無限次重復博弈的主要界定標準在于參加者均不清楚哪一輪博弈會是最后一輪,合作各方擔心違約會遭到日后的“報復”便會把合作策略堅持下去。在有限次的重復博弈中,如果合作雙方不確定哪一輪是最后一輪,參與者會認為日后還要繼續打交道、博弈狀態會繼續維持,這便同無限次重復博弈無異。所以,在不能確定終止期的有限次重復博弈的圖書館數字信息資源共享博弈中,合作解是可以存在的。當然,為了維護合作模型的穩定性,更好的實現團體利益的最大化,必須配合以必要的措施。
3.1建立信任機制
圖書館信息資源共建共享機制的成功建立,取決于成員間的相互信任和對于聯盟內部規則的遵守程度,能夠取得收益同時實現持續的發展,其中成員館之間的信任是至關重要的。成員間除了應相互理解對方的行為和立場,尊重對方的觀點,還應加強組織內的交流,達成對某些問題的認識。另外,信任評審機制的建立也十分必要,通過建立完備的綜合性、長期性評估測試標準系統,對成員的聯盟策略及行動影響因素進行持續地跟蹤測評,通過完善細致公平的執行制度,形成穩定可靠的運行機制。
3.2建立監督機制
對于合作中的各館,都希望采取最優于自己的策略,以期得到最好的結果,因此為了達到合作團體利益的最大化,應該對各成員進行有效監督,維護合作協議的順利執行。要在建立領導協調組織和健全監督機制上下工夫,在明確各成員權利義務的基礎上,監督各成員的行為。對于損人利己的傾向和行為,及時采取措施,必要時對違反合作協議的成員進行制裁,甚至終止合作。
3.3建立保障機制
因為各圖書館之間的規模與發展水平不均等,建設規模大、信息豐富的圖書館往往很難與信息量相對較少的圖書館實現資源共建共享,另外數字信息資源共建共享經常發生“搭便車”的問題,這些都需要通過建立保障機制加以制約。在內部評估制度規范的基礎上,對貢獻大的圖書館要采用獎勵的辦法進行收益補償,同時針對慵懶的圖書館,通過采取懲罰的方式實現督促作用。
在具體的實施上,以懲罰措施為例,在成員館簽訂共享協議時,規定不合作的一方會受到經濟制裁,報酬減3,在矩陣圖2的基礎上可以得到新的報酬矩陣(見圖3)。按“囚徒困境”的分析思路,如果A館選擇共享,B館選擇了不共享,B得報酬為9而不是原來的12,因為B館不共享受到了事后的經濟制裁(12-3=9),小于(共享,共享)中的報酬10,可見,B怕受到懲罰得不償失必然選擇共享。對于A的分析也是如此,最后的博弈均衡狀態一定是(共享,共享),克服了欺騙或違約行為,達到了信息資源共享的目的。