時間:2023-08-21 16:58:22
序論:在您撰寫博弈論方法時,參考他人的優秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發您的創作熱情,引導您走向新的創作高度。
關鍵詞:博彝論公選課;教學內容與方法改革;措施
中圖分類號:G420 文獻標志碼:A 文章編號:1002-0845(2012)01-0042-03
博弈論是當代西方經濟學體系中最重要的理論課之一,其應用前景非常廣泛。幾乎所有社會科學領域中都活躍著與博弈論交叉的分支學科,為滿足當代大學生對博弈論知識的需求,高校加強博弈論公選課建設迫在眉睫。鑒于此,筆者面向全校開設了“博弈論與諾貝爾經濟學獎”和“博弈問題及其啟示”兩門通識選修課程。
一、博弈論公選課教學中存在的問題
由于博弈論與經濟學、管理學和數學等學科有著十分密切的關系,所以國內本科院校的博弈論課程主要面向經濟、金融、管理或數學專業開設,教學的對象通常是本專業或本學科相關專業的學生,很少面向全校開設公選課,這主要緣于以下兩個方面的原因:第一,博弈理論的建立只有六七十年的歷史。國內高校博弈論課程開設時間最長的也不到十年,上述情況導致了課程建設的經驗不足、水平不一。第二,研究博弈理論往往需要借助數學的方法,所以,博弈論課程的講授與學習離不開數學工具和經濟學知識,課程內容不得不受制于較高的知識門檻。因而,國內博弈論公選課的建設尚處于起步階段。
筆者在連續四個學期開設博弈論公選課后發現,該課程教學中存在的主要問題如下:
1 學生問的差異較大
由于博弈論公選課面對的本科生縱跨二、三、四三個年級。橫跨本校全部學科的所有專業,導致學生的認知平臺和知識面存在較大差異,學習目的和價值取向呈現出多元性,學生在學習態度、學習習慣和學習能力方也存在較大差別。
2 理論學習需要有一定的經濟學基礎和數學基礎
博弈論是從經濟學的角度提煉出個體最優決策問題后,利用數學模型對其進行描述,再運用數學工具對其理論進行研究。2007年的諾貝爾經濟學獎得主羅杰?邁爾森(Roger B.Myerson)認為,“博弈論是對理人或決策者之間相互沖突及合作的數學模型進行的研究”。雖然博弈論具有廣泛的應用范圍和較強的解釋能力。但它的標準表達是函數形式和集合論形式的,研究方法和分析過程依賴于數學工具。所以,學習博弈論既要有相關的經濟學知識,又要有一定的數學基礎。正因如此,學生在公選課中接觸博弈論時會覺得比較抽象。
3 課程的知識容量受限
為了照顧學生差異,筆者在教學過程中會盡可能詳細地為學生進行講解,因而不得不壓縮知識的容量,這導致了一部分經濟學和數學基礎較好的學生“吃不飽”的問題。筆者嘗試通過布置課后練習的辦法來解決這一問題,但效果不是很明顯。或許一個不可回避的重要原因是,有限的課余時間和較快的學習節奏限制了多數學生對公選課知識的進一步學習。
4 缺少合適的教材
缺少合適的教材也是博弈論公選課教學中存在的主要問題之一。筆者認為,博弈理論的應用性和公選課內容的時效性是激發學生學習興趣的、切入點,教材的編寫應將二者有機結合起來,方能發揮最大的功效,然而目前的教材往往只能體現前者卻難以涵蓋后者。
二、課程內容與教學方法改革的措施
1 抓住學生的共性
大學生具有強烈的關注現實問題的意愿,對社會熱點問題表現出極高的興趣,尤其在理解焦點問題時具有很強的可塑性和認知共性。因而應牢牢抓住這一共性,迎合學生在知識需求上的實用化和功利化的特點,從當前豐富的信息資源中尋找承載博弈論知識的現實問題,以期收到事半功倍的教學效果。在教學實踐中,筆者把豐田汽車賠償、西南五省大旱、相親類節目“非誠勿擾”、2008股市大跌等現實熱點都搬上了講臺。下面,筆者就通過教學實例進行說明。
在講授2005年諾貝爾經濟學獎得主托馬斯?謝林(Thomas C.Schelling)的博弈承諾及其可信性概念時,筆者以制定《反國家分裂法》為典型案例進行分析。由于祖國統一問題是所有國人關心的國家大事,大學生也不例外,所以講授過程非常順利,以致學生在課后反饋中把這一案例列為講授最成功的部分。接著,為了講解如何應用可信承諾處理現實問題,筆者選擇了電視連續劇《老大的幸?!返谒募械囊粋€視頻片段,進一步強化了知識點。實踐證明,人物生動的形象在給課堂增添活躍氣氛的同時,也很好地承載了傳遞知識的作用,以縮影的形式把可信承諾的概念和應用可信承諾策略的方法植入了學生的頭腦中。最后,筆者以拆遷補償合同簽訂中的一種可信承諾策略為例,對本節課進行了總結,并請學生加以點評。由于拆遷問題是當前社會的焦點問題,所以學生對點評表現出極大的興趣。這樣,通過抓住學生的認知共性,展示了可信承諾策略在焦點問題上能夠將劣勢變為優勢的強大作用,成功地引導學生了解并掌握了博弈承諾及其可信性概念。
2 增強主題的典型性和知識模塊的簡潔性
以經典博弈問題為主題有利于組織素材、選擇教學內容;簡潔地安排知識模塊、弱化知識的層次性有利于照顧各類學生在知識面、綜合能力和認知水平上的差異;少而精地選擇課程內容有利于突出重點;多角度地反復講解有利于降低知識門檻,提高學習的效果。
例如,在主題選擇上,筆者以多數學生熟知的“囚徒困境”作為第一主題;以試驗性強、易于展開的“理性基礎和有限理性”作為第二主題;以現實性突出的“重復動態博弈”作為第三主題。由于“囚徒困境”與經濟學中的“理性人假設”密不可分,所以第一主題既能讓學生感受到博弈問題的趣味性和深刻性,又能激發他們對該主題的進一步思考,使他們逐漸認識到“理性人假設”所具有的超越現實、過于理想的特性,從而部分地為第二和第三主題做好鋪墊。另外,有大量關于“囚徒困境”和理性問題的課外資料易于獲得,這為學生在課程初期進行興趣驅動的導讀創造了條件。
在知識模塊設置上,筆者采取“自成模塊、減少關聯”的策略。例如,針對非常重要的“信息不對稱”主題,我們選擇了以二手車市場為核心,構建了包含藥品市場、電腦市場和就業市場等典型主題的知識模塊。一方面,這些市場為學生所熟知,易于接受;另一方面,這些市場中包含著非常典型的“信息不對稱”因素,因而通過對市場現象的自然描述完全可以弱化學生對經濟學市場知識的依賴。為了弱化知識的層次性,突出重點內容,筆者舍棄了理論體系中的某些知識模塊,例如“海薩尼轉換”、“斯賓塞信號傳遞模型”和“斯蒂格利茨信息甄別模型”等。
3 重視案例應用,尤其應重視與諾貝爾經濟學獎得主有關的案例
博弈論有一個顯著特點,那就是它“聲名顯赫”,并且與
諾貝爾經濟學獎的關系密切。許多諾貝爾經濟學獎得主都曾涉足博弈論領域,在博弈論的建立和發展中直接或間接做出過貢獻。“名聲在外”為博弈論公選課的開設提供了有利條件,也為課程的講授提供了獨特的視角和豐富的素材。正因如此,筆者才面向全校開設了博弈論與諾貝爾經濟學獎公選課。下面,以1994年諾貝爾經濟學獎得主約翰?福布斯?納什(John Forbes Nash Jr.)為例,詳細說明如何應用與諾貝爾經濟學獎得主有關的案例以及這樣做的優點。
納什是博弈理論發展的劃時代人物,納什均衡是博弈論的核心概念,兩者都是公選課中必須包含的內容。為此,筆者設計了以下三個環節:1)借助“囚徒困境”和“情侶博弈”講授納什均衡及其不唯一性;2)播放電影《美麗心靈》,并進行討論和點評;3)布置以納什為主題的案例設計作業,讓同學在課堂上演講。第一部分是講解的重點,講好納什均衡意味著博弈論課程成功了一半。第二部分可以把人格培養和素質教育有效融合起來?!睹利愋撵`》不僅能讓人體悟到學生心靈中因愛而生的溫暖,還能給出人生原本就是一場博弈的警示,體現出“大人物小故事”的精髓??v然納什這樣的天才也有無法擺脫的困境,何況他人?所以,在人生的博弈中,既要承認能力的差異,又要找尋屬于自己的色彩。同時還應看到,縱然如納什般為頑疾所纏都可以逐漸康復,何況其他挫折?所以,要以積極、樂觀、健康的心態對待人生,要終身學習而不輕言放棄!第三部分是對學生的啟發環節。該環節不僅要培養學生對本課程的興趣,加深學生對知識的理解,還要通過為其提供上臺演講、展示成果的機會,鍛煉他們的邏輯思維能力和表達能力。值得一提的是,很多學生在設計案例時自學了有名的“智豬博弈”和“戀愛博弈”等經典模型,鞏固了納什均衡概念,還有學生甚至對納什曾經設計過的一種“六連棋”博弈游戲(筆者對此也知之甚少)進行了分析。
4 重視學科交叉,尤其應重視學科交叉視闕下的學術前沿成果
博弈論已逐漸成為一門為諸多學科提供思維方法和分析技巧的學問,可以說,所有與生命有關的學科都蘊藏著博弈論的應用空間。在公選課中,應重視從學科交叉的視角供給知識,廣泛培養各專業學生對課程的興趣。例如,筆者選擇生物演化理論和博弈論交叉所產生的演化博弈論作為知識模塊,以人類社會的同性戀演化作為典型主題,挑選最前沿的學術研究案例作為教學的主要內容為學生進行講解,擴展了學生的知識面。
在演化博弈論的開創性著作《演化與博弈論》一書中,作者約翰?梅納德?史密斯(JohnMaynardSmith)用精妙的語言、深入淺出的分析和豐富有趣的案例把博弈論的思想融入到生物演化中,推動了對“動物為什么如此”這一問題的深入研究,揭示了動物群體行為演變的動力學機制。筆者首先以“哺乳動物一雄多雌”案例作為引導,簡單介紹演化博弈論在性選擇和性別比問題上的研究視角以及邏輯結構,然后立刻引出了人類面臨的一個有關性的問題――同性戀演化主題下的性問題:從進化論的角度來看,男男同性戀的存在完全沒有任何意義,這是因為同性戀相比于異性戀而言成功繁殖后代的可能性太小,那么為什么同性戀的基因沒有被淘汰?顯然,這一問題接近現實熱點,對學生極具誘惑力,而且還具有很強的學術延伸性。為了講解同性戀基因延續的演化博弈機制,筆者借助2010年2月24日美國心理科學雜志上發表的關于薩摩亞島上男男同性戀的最新研究成果,利用最前沿的學術案例詳細分析了“親族選擇”假說下的演化博弈機制。教學實踐表明,通過這樣的內容設計,來自不同專業的學生的學習興趣都被調動起來,加深了他們對博弈論的理解,順利實現了教學的目標。
5 重視開放性,尤其應重視教學信息交流反饋的開放性
信息交流有利于幫助學生鞏固所學內容,讓有興趣的學生通過查閱相關資料,獲得知識上的感悟和能力上的提升,并逐步脫穎而出。信息反饋有助于教師突出教學的亮點,發現教學中存在的不足,以便在今后的教學中加以改進。
教學實踐中,筆者讓學生通過電予郵件的形式反饋“課堂心得”,并要求他們回答以下三個問題:
(1)這次課對你影響最深或最成功的是哪部分?
(2)最失敗或可有可無的又是哪部分?
(3)對本次課你有什么意見和建議?
這三個問題一方面可以督促學生對課堂內容加以回顧、梳理,另一方面,又可以從中發現筆者在教學中存在的不足之處。事實上,在交流和反饋中,許多同學都針對課程的內容、進程和教師的教學習慣、技能等提出了中肯的批評和建議,幫助教師提高教學水平。這些批評和建議包括“講課的速度有點偏快”、“思考時間較少”、“有些理論過于深奧”、“希望針對時事展開分析”、“希望多些互動”、“理論是需要加強的”等,當絕大多數學生贊成“少一點數學知識”并希望“講得詳細點”時,筆者采納了這一建議,并列出了幾本偏重數學工具的參考書讓那些“吃不飽”的學生自學。
學生給予的溫馨鼓勵也讓筆者感覺“很給力”。例如,“本節課內容很充實,希望老師保持下去”、“老師的努力我們都看到了,希望老師以后做得更好”等話語激勵著筆者,使筆者能夠維持濃厚的教學熱情使其永不衰減,并且有信心進一步提高自身的專業能力,挑戰自我的職業水平。
教學探索與實踐的過程是循序漸進的過程,學生在這一過程中所起到的作用是巨大的。只要教師能夠及時、充分地了解學生的需求,不斷總結、深化課程教學改革的經驗,就一定能取得更大的成效。
三、下一步的設想
筆者秉承“以人為本,以學生的發展為中心”的教育理念,希望博弈論公選課能為學生打開“半”扇窗,培養他們對博弈理論的興趣,激發學生課后自主學習的潛能,做到既為學生提供基本知識,又幫助學生脫穎而出。
教學實踐表明,的確有不少學生通過自主學習脫穎而出。以下是某學生的反饋:“最近看了一本《博弈三國》,該書用博弈論的方式對三國故事進行解析,感覺博弈論有一種奇妙的功能,就是能把復雜問題簡單化,而且解析后的過程、緣由都一清二楚了。”更有學生覺得自己“在研究中發現了對自己有用的東西,受益匪淺”。也有在深入思考后對教學內容提出反詰者:“從平常感知上來說,同性戀的基因遺傳與博弈基本無關……博弈是一種研究競爭參加者為爭取最大利益應當如何做出決策的數學方法……無法說這樣一種與母系基因聯系較為緊密的基因遺傳行為可以用博弈的方式去解決,只能說同性戀的基因遺傳在某種程度上體現了社會的平衡態?!辈还苓@些反饋的具體情境如何,它們至少說明,應從公選課的現實性、延伸性、前沿性和開放性出發,強化學生的共性。弱化學生的差異性,充分利用教學內容的充實性和教學方法的靈活性,謹慎且大膽地進行教學改革,為滿足高等教育通識選修課的教學需求,進一步提高教學的水平與質量,提供一些思路和經驗。
納什均衡是現代博弈論中的核心內容和重要基礎,許多理論研究和應用都是圍繞這一基本理論展開或與此相關的。隨著博弈論的發展和博弈研究的不斷深入,人們意識到這種理論和日常經濟生活的聯系越來越緊密。博弈論可以揭示眾多經濟問題內在規律和根源,幫助人們分析經濟關系,認識經濟現象,評判經濟效率,指導人們進行科學的經濟決策,無論對企業等實際經濟部門的經營活動,還是對政府的管理和政策制度制定,博弈論都有重要的指導意義。要用博弈論解決現實經濟中的決策問題,就必須解決博弈模型的理論抽象和架設與經濟問題實際情況的差距等問題,而解決這些問題的關鍵在于如何運用數模的思想抽象出問題中的得益矩陣。本文在博弈論的核心內容納什均衡的基礎上,介紹了純戰略納什均衡和混合戰略納什均衡的相關理論,針對日常生活中的污水排放問題進行了分析。
二、納什均衡在經濟生活中的具體運用――污水排放問題
博弈的分類方法是多種多樣的。根據參與人的多少,可將博弈分為二人博弈和多人博弈;根據參與人是否合作,可將博弈分為合作博弈和非合作博弈;根據博弈結果的不同,又可分為零和博弈、常和博弈與變和博弈。一般地,將不允許存在有約束力協議的博弈稱為“非合作博弈”,與此相對,允許存在有約束力協議的博弈稱為“合作博弈”。“納什均衡”是非合作博弈理論中最重要的一個解概念。政府應該怎樣治理污水排放是當今一個熱點,也是本文所探討的問題。政府和企業之間的關系可以運用經濟學上的監督博弈來處理。
這個博弈的參與人包括政府和企業,政府的戰略選擇是檢查或不檢查,企業的戰略選擇是排污或不排污。假設A1是企業治理污水(不排污)所增加的生產成本,如果排污的話,則可以將A1據為所有;A2是政府檢查所需成本;W是政府對企業排污所收取的罰款金額;G是企業排污所造成的污染而對社會利益的損害;假設W>A1,且W>A2+G,即政府對排污企業采取重罰措施。下表即為一個對應不同戰略組合的得益矩陣。
在得益矩陣中,用p代表檢查排污的概率,β代表企業排污的概率。給定p,政府檢查(p=1)和不檢查(p=0)的期望分別為:
E(1,β)=(W-A2-G)γ+(-A2)(1-β)=(W-G)β+A2
E(0,β)=-Bβ+0(1-β)=-Bβ
由E(1,β)=E(0,β),得β*=A2/W。可以采取兩種舉措:
采取重罰措施;即降低檢查成本A2。另外,給定政府檢查的概率θ,企業選擇排污(β=1)和不排污(β=0)的期望收益分別為:
E1(p,1)=(A1-W)p+C1(1-p)=A1-W?p
E1(p,0)=0
由E1(P,1)=E(P,0)得P*=A1/G,即在現實經濟中有許多企業和企業排污所取得的罰款金額W有關,對排污的懲罰越重,企業因排污所獲得的生產成本越少,企業的排污概率就越小。
實際上,政府在治理企業排污的時候,應設法考慮收益權的收益問題。由于國民待遇的要求,不可能因企業性質不同而采取不同的罰款數量。所以解決這個問題只能采用行政手段。
同時也要注意地方政府在治理污水中的角色。首先,地方政府的行為要受制于中央政府既定的制度。其次,地方政府亦可親自組織創新或擔當起制度創新的重任。最后,地方政府是制度的推行維護者,對違法排污者實施重罰。
三、主要結論和后續工作展望
[關鍵詞]博弈論;理性人假定;公共知識;社會科學方法論
[中圖分類號]C3
[文獻標識碼]A
[文章編號]1671-511X(2012)04-0020-03
博弈論是研究理性人的互動的理論,或者說研究交互決策的理論。1928年,馮·諾依曼證明了博弈論的基本原理,宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦合著的《博弈論與經濟行為》將二人博弈推廣到n人博弈結構并將博弈論系統應用于經濟領域,奠定了這一學科的基礎和理論體系。1950-1951年,約翰·納什利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅定的基礎。塞爾頓、哈桑尼、謝林、奧曼等人的研究也大大推動了博弈論的發展。因此,盡管博弈論是一門新生的學科,但是它今天已經發展成為有較完善的理論體系的科學。
今天,博弈論已經成為社會科學的通用方法論。盡管它是演繹科學,對社會現象有強大的解釋力,然而,由于其理想主體的假定使得其演繹出的理論解與實際博弈結果存在差異。許多實驗經濟學家通過博弈實驗研究實際中人們的博弈過程,分析博弈論的演繹解與博弈實驗結果之間的差異。如2002年諾貝爾經濟學獎就頒發給了丹尼爾·卡尼曼和邁農·史密斯,他們是實驗經濟學的先驅。今天在西方學術界通過實驗來驗證博弈的理論結果已經成為一種潮流。本文下面設計并進行了一個博弈實驗,通過分析實驗結果與理論解的差異,分析博弈論作為社會科學方法論的局限性,并提出改進的可能路徑。
一、博弈實驗及結果分析
1 實驗描述
我們設計了如下的一個博弈實驗。該實驗的參與人是南京大學選修文化素質課“邏輯與科學方法基礎”的大學生,他們是二三年級的學生,文理科學生均有。
該實驗是以試題的形式進行的,該試題作為期末試卷中的最后一道題。該題目為:
在0-100之間選擇一個數字,規則是:若你選擇的數字“是或最接近”在座同學所選擇的數字的平均數的2/3(即在座同學所選數的總和除以總人數之后所得數字的2/3,如:若平均數為90,你應當選2/3×90=60),你將獲勝。請給出你選擇的理由。
實驗說明:
(1)實驗參與者即參加考試的學生,事前不知道這是一個實驗;
(2)該課程教師以講座的形式給實驗參與者傳授過博弈論知識,但沒有提到所進行的博弈;
(3)因為(2),他們中的大多數掌握“博弈”、“公共知識”等概念;
(4)試卷是保密的,沒有任何學生預先知道考試內容,考試過程中學生間無任何交流;
(5)該博弈的理論解(即納什均衡)為0或1。
2 實驗結果
對于考試中的每個學生,在這個博弈實驗中他能夠獲勝的關鍵是,他要準確猜測他人是如何選擇的,一旦他猜測正確,他將他猜測的平均數乘以2/3便是獲勝答案。
共有176人參加了考試。排除掉5個不明確的選擇,供分析的實際選擇數為171個(其中3個選擇非整數)。實驗結果為(按照數字大小排序):
“0”:46人;“1”:14人;“5”:1人;“9”:1人;“10”:4人;“12”:1人;“15”:3人;“20”:3人;“22”:18人;“22.44”:1人;“24”:1人;“25”:3人;“28”:2人;“29”:1人;“30”:4人;“32”:2人;“33”:24人;“100/3”:1人;“34”:4人;“35”:1人;“36”:2人;“38”:3人;“39”:1人;“40”:6人;“43”:1人;“44”:5人,“45”:3人;“47”:1人;“50”:3人;“58”:1人;“59”:1人;“60”:2人;“66”:1人;“67”:3人;“”:1人;“72”:1人;“75”:1人。
3 結果分析
在這些所選擇的數字中,最大的數字為75,最小的數字為0。171個數字相加后的平均數為21.91,本博弈勝出解:21.84×2/3=14.61。
這個博弈中,0和1是均衡解(下一部分將分析),它們是“理論解”。在該實驗中,0是所選最多的數字,共有46人選擇,比例為26.9%;選1的為14人,比例為8.2%。兩者相加共有60人,比例為35.1%。
從上述數據可以看出,在這場博弈中,“實驗解”為14.61,最接近該數的是14或15,這和“理論解”的“0”或“1”不同。在本實驗中,沒有人選擇14,而選擇15的有3人,這3人是該實驗的勝出者。
若按照區間來統計,實驗結果的分布情況見表1。本博弈實驗的“實驗解”14.61落在11-20之間。若我們把11-20看成是勝出區間,則有7人勝出。
對于這些選擇,有以下值得注意的幾點:
第一,67以上的選擇都是不理性的,因為參加考試的學生數為150-200之間,這是公共知識,即使所有的學生都選擇100,勝出的數字都不會超過67。但是還有3位學生選擇了大于67的數字,其中選擇的最大數為75。他們在給出這些選擇時沒有給出理由。
第二,分析學生所給出這些選擇的理由,可以看出,絕大部分選擇者在進行他們的選擇時考慮到了他人的選擇以及他人的推理。不同的人對他人的假定不同,所進行推理的步驟也不同。如選擇67的學生假定了他人都選擇100,因而選擇67是最優選擇;再比如選擇30-40之間的數字的同學,其理由大體上有兩個:或者認為平均數集中在50-60之間,其2/3就集中在35-40之間;或者認為都選100的話,66.7是最優選擇,都選擇66.7的話,44是最優選擇,而都選44的話,33是最優選擇。
第三,有三個區間處的選擇比例較高:0-10間為38.6%,21-30間為17.6%,31-40間為25.7%。從所給理由可看出,不同區間的選擇者考慮群體的互動推理的步驟存在差別,如0-10區間的選擇者考慮他人的推理步驟比31-40區間的選擇者多些。
第四,值得注意的是,11-20區間里的選擇較少(事實上是,在這個博弈中所選擇的數字落在這個區間是最有可能勝出的)。原因可能是,一旦選擇者進行了多步的互動推理,他們便能夠將這樣的推理進行下去,從而將選擇向理論解0或1靠近。
第五,有一些“智慧的”選擇者,他們知道理論解,但他們知道存在不完全理性的選擇,因而他們沒有選擇理論解。盡管他們的選擇沒有勝出,他們的推理是有智慧的。這里,本文選擇了其中2個。一位選擇22的學生是這樣給出他所選擇的理由的:“作為理性人,我不會選擇大于2/3×100的數,因為即使所有人都選擇最大數,平均數的2/3也不會超過2/3×100。如果大家和我一樣理智,那么大家都不會選擇大于2/3×100,那么我不會選擇大于100×2/3×2/3。因為他們選擇最大的他們可能會選的數,平均數的2/3也不會超過2/3×2/3×100。依此類推,如果全班都充分理智,那么全班最終都會選擇1,然而我不認為班里的人都是足夠理智,故平均數的2/3會大于1。根據兩次游戲,平均數的2/3在20~30。如果是我,我會選擇靠近20的數,那我就22吧?!币粋€選擇10的學生的理由是:“如果其他人都是隨機選擇,那么平均數最后可能接近于50,50×2/3≈33。但是,如果所有人都選擇接近33的數,那么33為平均數,33×2/3≈22……如此推理應該為1。但是并非所有人均是理性、均會如此計算。我對南大有信心,所以,我將數字選得接近1一點,選10?!?/p>
第六,有一些選擇是沒有考慮到他人的選擇。如有這樣一些理由:“大家都認為60是及格分,所以我選擇59”,“58是我的幸運數字”,等等。
二、博弈的理論解分析
本實驗是一個多人完全信息靜態博弈:參與者同時選擇行動,然后根據所有參與者的選擇,每個參與者得到各自的結果,每一參與者的收益函數在所有參與者之間是公共知識。
在這個實驗中,參加考試的176位學生是參與者,每個考生同時對0-100之間的數字進行選擇行動,即每個參與者的策略空間Si∈(0,100),即有101種可能的策略。根據所有考生的選擇,每個考生最后得出自己的結果,對每個考生來說,結果無非就是,自己的選擇是“大家所選數字的平均數的2/3”,勝出;要么與“大家所選數字的平均數的2/3”不一致,失敗。
我們假定該博弈的參與人都是絕對理性人(事實上,這個要求在實際中難以達到,這也是本文要得到的一個結論)。
我們來分析絕對理性人的推理過程。
在這個博弈中策略組合有176×101種,每種策略組合下,每個人的收益是公共知識。如:如所有人都選100,平均數為100,此時每人都失敗,勝出結果是100×2/3=67;如175人都選100,有一個人選擇了67,那么選100的人失敗,而選擇67的人勝出……所以這些是理性參與人的公共知識。
我們看到,任何人都不應該選67或以上,或者選擇67或以上是非理性的,因為所選擇的數字的最大平均數為100,此時勝出的數字為67,因此選擇67以上而獲勝的可能性是沒有。因此,作為理性人他們都不會選擇67或以上。
每個人都不會選擇67或以上,這本身也是公共知識。在這樣的公共知識的前提下,45以上的選擇都是不合理的,因為對每個人而言,只有在他人都選擇67以上,我選擇45或以上才是合理的(67的2/3約為45)。
每個人都不會選擇45或以上,這本身也是公共知識。于是,每個人都認為不應該選擇30或以上。
……
結論是:每個人選擇0或1是合理的,它們是該博弈的理論解。
事實上,每個人選擇0或都選擇1是納什均衡:對每個人而言,在其他人不改變選擇的情況下,當下的選擇是最優的。
在所有人均選擇0的情況下,因為對于每個人而言,若所有人都選擇0的話,0便成為平均數,該數的2/3還是0。這樣,他選擇0是最優選擇:在他人不改變選擇的情況下,他改變選擇將失敗。因此這點構成納什均衡。
在所有人均選擇1的情況下,同樣,對于每個人而言,在其他人選擇1的情況下,平均數1的2/3為0.67,此時1最接近該數。因此,他選擇1是最優選擇,并且若他改變了他的選擇他將失敗。因此,這點也構成納什均衡。
當然,面對多個納什均衡,作為理性的參與人作何選擇才能勝出呢?具體到這個博弈中,每個人要考慮的是,他選擇0還是選擇1才能勝出呢?
他會這樣思考:沒有理由認為其中一個比另外一個更有可能勝出,這樣,選擇0或1勝出的概率為50%,但是,他人能夠與我有同樣的想法。既然如此,期望平均數應該為0.5×1+0.5×0=0.5。于是,0.5的2/3接近0。因此,選擇0是最優選擇。
從上面的分析可見,盡管0和1是納什均衡點,但選擇。是最優選擇。
三、改進博弈論的可能路徑
本文已經表明,上述博弈是一個完全信息靜態博弈,然而,本實驗的實驗解(14.61)與理論解(0或1)之間發生偏離。本文認為,有兩個主要原因:
第一,博弈論中所假定的理想主體與實際中的決策主體不相符合。理想的博弈參與人是絕對理性人;他們能夠進行任何有窮步驟的推理,能夠分析所有有窮可能的情況,并且他們的推理、分析是在瞬時完成的,而實際博弈中人們是有界理性的。在我們的博弈實驗中若參與者是理想主體,他們能夠做本文上一部分那樣的分析,他們應當知道0和1是均衡解,也能夠預測O是最有可能實現的結果。本實驗表明,并不是所有人都能夠做出這樣分析的。并且,在實際中存在完全非理性的選擇,如本實驗中選擇大于67的3人,這不是完全偶然現象。
一、抓住學生的共性
大學生具有強烈的關注現實問題的意愿,對社會熱點問題表現出極高的興趣,尤其在理解焦點問題時具有很強的可塑性和認知共性。因而應牢牢抓住這一共性,迎合學生在知識需求上的實用化和功利化的特點,從當前豐富的信息資源中尋找承載博弈論知識的現實問題,以期收到事半功倍的教學效果。在教學實踐中,筆者把豐田汽車賠償、西南五省大旱、相親類節目《非誠勿擾》、2008股市大跌等現實熱點都搬上了講臺。下面,筆者就通過教學實例進行說明。
在講授2005年諾貝爾經濟學獎得主托馬斯?謝林(Thomas C. Schelling)的博弈承諾及其可信性概念時,筆者以制定《反國家分裂法》為典型案例進行分析。由于祖國統一問題是所有國人關心的國家大事,大學生也不例外,所以講授過程非常順利,以致學生在課后反饋中把這一案例列為講授最成功的部分。接著,為了講解如何應用可信承諾處理現實問題,筆者選擇了電視連續劇《老大的幸福》第四集中的一個視頻片段,進一步強化了知識點。實踐證明,人物生動的形象在給課堂增添活躍氣氛的同時,也很好地承載了傳遞知識的作用,以縮影的形式把可信承諾的概念和應用可信承諾策略的方法植入了學生的頭腦中。最后,筆者以拆遷補償合同簽訂中的一種可信承諾策略為例,對本節課進行了總結,并請學生加以點評。由于拆遷問題是當前社會的焦點問題,所以學生對點評表現出極大的興趣。這樣,通過抓住學生的認知共性,展示了可信承諾策略在焦點問題上能夠將劣勢變為優勢的強大作用,成功地引導學生了解并掌握了博弈承諾及其可信性概念。
二、增強主題的典型性和知識模塊的簡潔性
以經典博弈問題為主題有利于組織素材、選擇教學內容,簡潔地安排知識模塊、弱化知識的層次性有利于照顧各類學生在知識面、綜合能力和認知水平上的差異,少而精地選擇課程內容有利于突出重點,多角度地反復講解有利于降低知識門檻,提高學習的效率。
例如:在主題選擇上,筆者以多數學生熟知的“囚徒困境”作為第一主題,以試驗性強、易于展開的“理性基礎和有限理性”作為第二主題,以現實性突出的“重復動態博弈”作為第三主題。由于“囚徒困境”與經濟學中的“理性人假設”密不可分,所以第一主題既能讓學生感受到博弈問題的趣味性和深刻性,又能激發他們對該主題的進一步思考,使他們逐漸認識到“理性人假設”所具有的超越現實、過于理想的特性,從而部分地為第二和第三主題做好鋪墊。另外,有大量關于“囚徒困境”和理性問題的課外資料易于獲得,這為學生在課程初期進行興趣驅動的導讀創造了條件。
在知識模塊設置上,筆者采取“自成模塊、減少關聯”的策略。例如:針對非常重要的“信息不對稱”主題,我們選擇以二手車市場為核心,構建包含藥品市場、電腦市場和就業市場等典型主題的知識模塊。一方面,這些市場為學生所熟知,易于接受,另一方面,這些市場中包含著非常典型的“信息不對稱”因素,因而通過對市場現象的自然描述完全可以弱化學生對經濟學市場知識的依賴。為了弱化知識的層次性,突出重點內容,筆者舍棄了理論體系中的某些知識模塊,如“海薩尼轉換”“斯賓塞信號傳遞模型”和“斯蒂格利茨信息甄別模型”。
三、重視案例應用,尤其應重視與諾貝爾經濟學獎得主有關的案例
博弈論有一個顯著特點,那就是它“聲名顯赫”,并且與諾貝爾經濟學獎的關系密切。許多諾貝爾經濟學獎得主都曾涉足博弈論領域,在博弈論的建立和發展中直接或間接作出過貢獻?!懊曉谕狻睘椴┺恼摰脑幱嫻x課的開設提供了有利條件,也為課程的講授提供了獨特的視角和豐富的素材。
納什是博弈理論發展的劃時代人物,納什均衡是博弈論的核心概念,兩者都是公選課中必須包含的內容。為此,筆者設計以下三個環節:(1)借助“囚徒困境”和“情侶博弈”講授納什均衡及其不唯一性;(2)播放電影《美麗心靈》,并進行討論和點評;(3)布置以納什為主題的案例設計作業,讓學生在課堂上演講。
第一部分是講解的重點,講好納什均衡意味養博弈論課程成功了一半。第二部分可以把人格培養和素質教育有效融合起來,《美麗心靈》不僅能讓人體會到學生心靈中因愛而生的溫暖,還能給出人生原本就是一場博弈的警示,體現出“大人物小故事”的精髓。縱然納什這樣的天才也有無法擺脫的困境,何況他人?所以,在人生的博弈中,既要承認能力的差異,又要找尋屬于自己的色彩。同時還應看到,縱然如納什般為頑疾所纏都可以逐漸康復,何況其他挫折?所以,要以積極、樂觀、健康的心態對待人生,終身學習而不輕言放棄。第三部分是對學生的啟發環節。該環節不僅要培養學生對本課程的興趣,加深學生對知識的理解,還要通過為其提供上臺演講、展示成果的機會,鍛煉他們的邏輯思維能力和表達能力。值得一提的是,很多學生在設計案例時自學了有名的“智豬博弈”和“戀愛博弈”等經典模型,鞏固了納什均衡概念,還有學生甚至對納什曾經設計過的一種“六連棋”博弈游戲進行了分析。
四、重視學科交叉,尤其應重視學科交叉視閾下的學術前沿成果
博弈論己逐漸成為一門為諸多學科提供思維方法和分析技巧的學問,可以說,所有與生命有關的學科都蘊藏著博弈論的應用空間。在公選課中,應重視從學科交叉的視角供給知識,廣泛培養各專業學生對課程的興趣。例如:筆者選擇生物演化理論和博弈論交叉所產生的演化博弈論作為知識模塊,以人類社會的同性戀演化作為典型主題,挑選最前沿的學術研究案例作為教學的主要內容,為學生進行講解,擴展了學生的知識面。
在演化博弈論的開創性著作《演化與博弈論》一書中,作者約翰?梅納德?史密斯(John Mavnard Smith)用精妙的語言、深入淺出的分析和豐富有趣的案例把博弈論的思想融入到生物演化中,推動了對“動物為什么如此”這一問題的深入研究,揭示了動物群體行為演變的動力學機制。筆者首先以“哺乳動物一雄多雌”案例作為引導,簡單介紹演化博弈論在性選擇和性別比問題上的研究視角以及邏輯結構,然后立刻引出了人類面臨的一個有關性的問題――同性戀演化主題下的性問題:從進化論的角度來看,男男同性戀的存在完全沒有任何意義,這是因為同性戀相比于異性戀而言成功繁殖后代的可能性太小,那么為什么同性戀的基因沒有被淘汰?顯然,這一問題接近現實熱點,對學生極具誘惑力,而且還具有很強的學術延伸性。為了講解同性戀基因延續的演化博弈機制,筆者借助2010年2月24日美國心理科學雜志上發表的關于薩摩亞島上男男同性戀的最新研究成果,利用最前沿的學術案例詳細分析了“親族選擇”假說下的演化博弈機制。教學實踐表明,通過這樣的內容設計,來自不同專業學生的學習興趣都被調動起來,加深了他們對博弈論的理解,順利實現了教學的目標。
五、重視開放性,尤其應重視教學信息交流反饋的開放性
信息交流有利于幫助學生鞏固所學內容,讓有興趣的學生通過查閱相關資料,獲得知識上的感悟和能力上的提升,并逐步脫穎而出。信息反饋有助于教師突出教學的亮點,發現教學中存在的不足,以便在今后的教學中加以改進。
教學實踐中,筆者讓學生通過電子郵件的形式反饋“課堂心得”,并要求他們同答以下三個問題:(1)這次課對你影響最深或最成功的是哪部分?(2)最失敗或可有可無的又是哪部分?(3)對本次課你有什么意見和建議?
這三個問題一方而可以督促學生對課堂內容加以回顧、梳理,另一方而又可以從中發現自己在教學中存在的不足之處。事實上,在交流和反饋中,許多學生都針對課程的內容、進程和教師的教學習慣、技能等提出中肯的批評和建議,幫助教師提高教學水平。這些批評和建議包括講課的速度有點偏快、思考時間較少、有些理論過于深奧、希望針對時事展開分析、希望多些互動、理論是需要加強的等,當絕大多數學生贊成“少一點數學知識”并希望“講得詳細點”時,筆者采納了這一建議,并列出了幾本偏重數學工具的參考書,讓那些“吃不飽”的學生自學。
教學探索與實踐的過程是循序漸進的過程,學生在這一過程中所起到的作用是巨大的。只要教師能夠及時、充分地了解學生的需求,不斷總結、深化課程教學改革的經驗,就一定能取得更大的成效。
在缺少合適的教材這一問題上,筆者設想,可以采取靈活性較強的活頁方式(如當前許多大學英語教材中都有活頁內容)改變這一現狀?;铐摲绞郊瓤梢酝怀鲋黝}的典型性,又可以涵蓋即時事件,滿足學生的需要。同時,教材活頁的積累還能為課程建設尤其是優質博弈論公選課教材的編著奠定基礎。
只要教師能夠了解學生的需求,選擇恰當的教學方式、方法,不斷加以分析、總結,進一步完善教學環節,激發學生的學習興趣,就一定能順應高等教育教學改革的趨勢,在確保教學質量的基礎上,逐漸把博弈論的詭計公選課建設好。
參考文獻:
[1]顧建民.高等教育學[M].杭州:浙江人學出版社,2008.
[2]裘松良.轉型期高校教育研究與實踐[M].北京:高等教育出版社,2010.
[3]胡劍鋒.高校經管類教育研究與實踐[M].杭州:浙江人學出版社,2011.
[4]潘月明,郭秀芝.人學英語口語公選課教學模式設計與實踐[J].高等教育學刊,2009(2).
[5]川浦徐進.本科博弈論教學過程中的案例運用[J].江南人學學報:教育科學版,2009(12).
[6]葉國榮,等.高校本科生教育中研究型教學模式探討[J].中國高教研究,2009 (3).
所謂“博弈”(Game),是指某些個人或組織作出相互有影響的決策,它不僅包括撲克、橋牌等游戲,也包含現實生活中大量的合作和沖突現象。博弈論又稱“對策論”,研究的核心是決策主體的行為發生直接相互作用時的決策以及這種決策的均衡問題。
博弈論的原始思想萌芽于2000多年前,中國春秋戰國時代的典籍如《孫子兵法》、《孫臏兵法》中都充滿了博弈的案例?!疤锛膳c齊王賽馬”就是我國耳熟能詳的博弈實例之一,但這不過是博弈思想的雛形,現代意義上的博弈論則是20世紀的貢獻了。一般認為,1944年同馮·諾伊曼(Von Neumann)和摩根斯坦恩(Morgenstern)合作發表的《博弈論與經濟行為》(The Theory of Games and Economic Behavior)提出合作博弈的基本模型,標志著現代博弈論的開始。50年代,博弈論巨匠輩出,納什(Nash)提出了非合作博弈論,塔科爾(Tucker)定義了“囚徒困境”,從而奠定了現代非合作博弈的理論基石。60后代,澤爾騰(Selten)將納什均衡引入動態分析,創立了“精煉納什均衡”的概念;海薩尼(Harsanyi)則把不完全信息引入博弈論研究,隨后出現了不完全信息博弈論。至此,博弈論的理論構架基本完成。
博弈論可以劃分為合作博弈(cooperative game)和非合作博弈(non-cooperative game)。二者的區別主要在于參與人能否在行為時達成有約束力的協議,達成則是合作博弈;反之,不能強制他方遵守協議,各參與人只能選擇自己的最優戰略,則是非合作博弈。合作博弈強調團體理性、效率、公平和公正;非合作博弈則強調個人理性、個人最優決策。我們談到的博弈多指非合作博弈。
博弈有兩種劃分:從參與人出場的先后順序來看,博弈分為靜態博弈(static game)和動態博弈(dynamic game)。靜態博弈指博弈參與人同時選擇行動或非同時行動但對前者行動一無所知;動態博弈指參與人行動有先后順序,且后行動者能夠觀察到先行動者的選擇。從參與人對其他參與人的知識來分析,博弈分為完全信息博弈和不完全信息博弈,前者指每一個參與人對其他參與人的特征、戰略和支付函數有確切的了解;后者則恰好相反。將兩種分析結合起來,我們就有四種類型的博弈:完全信息靜態博弈,完全信息動態博弈,不完全信息靜態博弈,不完全信息動態博弈。
1.完全信息靜態博弈:納什均衡
完全信息靜態博弈講的是,假設博弈中所有參與人事先達成一項協議,規定每個人的行為規則,那么,在沒有外在強制性約束時,參與人是否會自覺遵守協議。如果參與人自覺遵守該協議,則構成一個納什均衡:給定其他參與人遵守協議的情況下,沒有人積極偏離協議規則。換言之,如果一個協議不構成納什均衡,它就不可能自動實施,因為至少有一個參與人會違背這個協議,不滿足納什均衡要求的協議是沒有意義的?!扒敉嚼Ь场?Prisoner's Dilemma)和“性別戰”(Battle of theSexes)是任何一本博弈論著作都會提到的納什均衡特例。
2.完全信息動態博弈:子博弈精煉納什均衡
動態是世間萬物的基本特征。完全信息靜態博弈只是一種獨特的理想狀態。在現實中,當后一個參與人行動時,自然會根據前者的選擇而調整自己的選擇,而前者也會理性地預期到這一點,所以不可能不考慮自己的選擇對他人的影響。1965年,澤爾騰通過對動態博弈的分析,提出了“子博弈精煉納什均衡”的概念,它要求任何參與人在任何時間、地點的決策都是最優的,決策者應該隨機應變,而不是固守前謀。這就推導出子博弈的概念。當參與人的戰略在每一個子博弈中都構成納什均衡時,則形成“子博弈精煉納什均衡”。也就是說,組成“子博弈精煉納什均衡”的戰略必須在每一個子博弈中都是最優的。
3.不完全信息靜態博弈:貝葉斯納什均衡
不完全信息靜態博弈指的是,參與人共同行動,沒有機會觀察他人的選擇。每個參與人的最優戰略只能是在給定自己的類型和他人類型依從戰略的情況下,最大化自己的期望效用。在項目投標中各承包者的標價高低之爭就是一個應用例證。
4.不完全信息動態博弈:精煉貝葉斯納什均衡
在不完全信息動態博弈中,后行動者觀察前者的選擇并獲得其偏好、戰略空間等信息,修正自己的判斷;而先行為者也知道自己行為的效用,會有意識地選擇某種行動掩蓋或揭示自己的真實目的?!扒H技窮”就是一個不完全信息動態博弈的例證。
國際機制理論的理性主義流派概述
當前,國際機制的研究在理論與實踐層面都對國際關系理論學者形成沖擊,引起他們持續的濃厚興趣,并表現出非凡的整合能力,對國際機制研究的不同思路和方法加以整理和批評已經成為學者們重視的工作。德國著名國際機制理論家沃科爾·利特伯格認為,國際機制理論有兩種理性主義流派:新現實主義國際機制理論和新自由主義國際機制理論。(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theories of International
Regimes(London:Cambridge UniversityPress,1997),pp.1-2.)
新現實主義國際機制理論的基本出發點是行為體之間的權力資源分配極大地影響著機制的出現、某問題領域機制的存在及其性質,特別是合作中的利益分配;國家會考慮無政府狀態下的相對權力,對國際機制的效率形成制約。這些觀點都體現在霸權穩定理論中。利特伯格認為,霸權穩定理論是“基于權力的國際機制理論的經典理論模式”,(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theoriesof International
Regimes(London:Cambridge University Press,1997),pp.86.)而克勞福德認為,霸權穩定理論是新現實主義對機制產生最權威、最普遍認同的解釋。(注:Robert Crawford,Regime Theory inthe Post-Cold War World:Rethingking Neoliberal Approaches toInternational Relations(Dartmouth:Darmouth Publishing Company,1996),p.57.)霸權穩定理論的基本機制理論主張是:霸權國家建立了自己的霸權體系,并制定該體系的基本原則、規則、規范和決策程序,霸權國的實力與威望是其他國家接受這些國際機制的重要前提;霸權國利用這些機制維持霸權體系,最大限度地獲得自己的利益;同時,為了維持該體系,它愿意向體系內的其他國家提供“公共商品”(Public Goods),容忍“搭便車行為”(Free-rider);霸權國的衰落或急劇變化,則該體系的國際機制發生相應變化。
新自由主義機制理論在過去10多年影響巨大,成為分析國際機制的主流理論。其基本機制理論主張是:國家是追求絕對收益的理性自我主義者,只關心自己的得失;承認權力在國際機制中的作用,但認為國際機制是國際關系中的獨立變量(independent variable),強調國際機制在幫助國家實現共同利益中的重大作用;活躍在特定問題領域的國家擁有只能通過合作才能實現的共同利益;不確定性是國際機制形成理論的核心,世界政治存在廣泛的不確定性。國際機制幫助達成政府之間意愿的契合。行為體相信這種安排會幫助達成互利的安排。換言之,沒有國際機制,則協議無法達成。國際機制正是通過降低不確定性來促進國際合作的。新自由主義機制理論是國際機制理論的主流學派,其影響也最大。該派理論用相互依賴的概念將現實主義和自由主義結合起來,具有重要的理論整合意義。
博弈論與國際機制理論
在過去十多年里,國際機制理論在國際合作的分析中獨占翹楚,而博弈論在分析社會、經濟和政治現象中應用最為廣泛。兩種理論都以探討無政府狀態下的競爭與合作問題為核心命題。這種平行并非巧合,因為機制理論從博弈論中借取了許多知識能量。理解促進合作的戰略邏輯是解釋無政府狀態下國際機制起作用的關鍵。在討論霸權、問題聯系、相對收益和相互依賴時,博弈論的解釋力有目共睹。這些恰恰是國際機制理論討論的重心問題。(注:Andrew Kydd and Duncan Snidal,"Progress in Game-Theoritical Analysis of International Regimes",in Regime Theory and International
Relations,ed.Volker Rittberger(Oxford:Clarendon Press,1993),pp.112.)
早期的博弈論分析國際合作的總體問題,其目標在于探究國際合作在無政府狀態下如何發生,但對國際機制的特殊作用關注不夠,國際機制在合作中的作用沒有得到突出和明確的分析??死辜{、基歐漢等使用博弈論分析國際機制的作用,促使現實主義和自由制度主義的國際機制理論逐步成熟。
關鍵詞:群體決策;信息集結;博弈論;信息獲??;審議;透明性
一、引言
群體決策的研究涉及多個學科,不同學科對群體決策的研究所采取的方法和著重點不一樣。在經濟學、政治學、管理學領域對群體決策的研究側重于偏好的集結,較少考慮影響偏好形成的潛在背景信息。其中社會選擇理論與公共選擇理論利用數學分析的方法和福利經濟學的一些基本原理,研究如何“公平合理地”將群體成員的偏好集結為群體的偏好并據以作出群體的選擇,這方面的研究源于Condorcet投票悖論的提出,從20世紀50年代開始經過Arrow、Sen、Gibbard和Satterthwaite等人的進一步發展,已形成完整的理論體系,通過對理性社會選擇本質的剖析,促進了人們對選舉、立法以及政治機構運作等問題的理解。
在管理科學領域,對群體決策的研究主要強調如何通過對群體成員以不同形式表達的偏好的集結,使得群體成員就最終決策達成某種程度上的一致,而一致性則意味著“正確性”,這方面最具代表性的是社會決策圖式理論。
在社會心理學領域對群體決策的研究主要采用實驗性方法,通過對群體成員之間交互過程的分析研究群體決策的信息集結有效性,一般假定群體成員具有共同的目標,很少考慮決策過程中的策略,心理學研究的主要成果是對群體思維和群體極化現象的分析。
近年來國外出現了不少用博弈論作為理論工具研究群體決策信息集結問題的文獻,這些文獻主要發表于經濟學、政治學與政治經濟學期刊,通過對群體決策過程中群體成員的動機和理的分析,給出了一些與人們的直覺完全相反的結論。筆者將對此領域的研究進展從決策信息的獲取、審議過程中信息的披 露、透明性的影響與最優決策規則四個方面進行評述。需要說明的是,這四個方面緊密關聯,特別是決策群體成員的信息披露動機直接受到決策過程對公眾是否透明以及最終的投票表決規則的影響,而群體成員的信息獲取動機則部分地取決于信息披露動機,但由于利用博弈論分析群體決策問題的復雜性,現有的文獻主要還是相對集中于其中的一兩個方面。
文[1]是注意到此領域較早的綜述性文章,該文發表于1999年,討論了當時出現不久的研究政治機構信息集結作用的文獻,其中對最先考慮策略性投票表決行為的文[2-5]等進行了簡要介紹。同年9月份,《美國國家科學院院刊》發文評述了研究選舉的信息集結作用及因投票者私有信息的不準確而導致的策略性投票表決行為的成果[6],其中提及的部分研究工作尚處于未發表狀態。文[7]對研究貨幣政策委員會決策過程中的動機問題的文獻進行了系統討論。文[8]總結了貨幣政策委員會決策機制設計應該考慮的各種因素,對與群體決策相關的經濟學與社會心理學理論與實驗分析文獻進行了評述,其中討論了信息集結問題。應該說文[9]是目前評述基于博弈論的群體決策信息集結研究文獻較為全面和細致的文章,該文從策略性投票、信息獲取、利益沖突和交流四個方面進行了詳細評述,并討論了此領域的研究成果對貨幣政策委員會決策機制設計的參考價值。
本研究與文[9]的差別在于:第一,文[9]的討論基本上局限于基于博弈論的群體決策信息集結研究本身,而筆者從研究方法、研究對象與研究成果等方面將基于博弈論的群體決策信息集結研究與經濟學、政治學、管理學以及社會心理學領域對群體決策的傳統主流研究進行了對比,分析了博弈論作為理論工具研究群體決策信息集結問題的優缺點,并深入探討了現有研究工作存在的不足之處,也即指出了此領域可能的研究方向,因此,筆者的深度與廣度有所超越。第二,文[9]對此領域研究成果的評述思路稍顯混亂,文獻分類較不合理。第三,筆者特別關注了研究決策過程的透明性對群體成員信息獲取與信息披露動機以及投票表決行為的影響的文獻,而文[9]對此幾乎沒有涉及。第四,文[9]發表后此領域出現了不少具有重要參考價值的文獻,筆者對這些最新的文獻給予了較為詳細的評述。
二、決策信息的獲取
(一) Condorcet陪審團定理與搭便車問題
與決策問題相關的各類信息一般以分散的、局部的形式存在于社會系統,群體決策的意義之一,是可能更充分地利用這些信息,因而更有可能作出正確的決策。不考慮其他因素,僅從信息集結的角度看,讓更多擁有信息的個體參與決策可以改善決策質量,這種觀點符合人們的直覺,其形式化證明出自18世紀Condorcet給出的陪審團定理。該定理認為:群體決策可以有效集結信息,在多數決定規則下,增加群體成員數量可以增加作出正確決策的概率,并且隨著成員數量趨于無窮,作出正確決策的概率趨于1。
Condorcet陪審團定理及其后來的很多拓展往往都有個潛在的假設:群體決策者所掌握的與決策問題相關的信息是事前外部給定的,或是以零成本獲得的[9]。但對于許多現實決策情形,信息并不是不需要投入成本和努力就能輕易得到的,如審稿專家需要付出一定的時間和精力才能決定稿件是否符合錄用標準,因此決策者必須決定是否付出以及付出多少代價以獲取信息。而在群體決策中,與決策問題相關的信息是公共物品,因而存在典型的所謂社會惰化(social loafing)現象或搭便車問題(freerider problem)。
文[10]對陪審團決策中的信息獲取問題進行了研究,認為陪審員的信息準確程度取決于陪審團的大小,更大的陪審團的陪審員具有更少的動機認真聽取審判過程,所以更大的陪審團作出正確判決的概率可能更小,從而導致陪審團定理不再成立。文[11-17]進一步研究了群體決策中的理性無知(rational ignorance)問題,對仍能有效集結信息時信息獲取成本或成本函數需要滿足的條件進行了分析,這些文獻針對多數決定規則,假定所有群體成員具有完全相同的決策偏好。其中文[11,13-15]證明,當全體或部分群體成員的信息獲取成本函數在獲取零信息處的二階導數為零,則Condorcet陪審團定理仍然有效。
另外,文[18]通過一個僅有兩個成員的群體決策模型,指出群體成員間的交流可能會惡化信息獲取中的搭便車問題。在該文中,決策成員首先收集關于一項工程實施后果的信息,然后相互交流,再投票表決是否實施該項工程。文章指出,如果交流的作用僅限于信息集結,則交流可能會減少作出正確決策的概率,特別是當高質量的信息很容易獲得時,交流會減少決策成員收集信息的動機,加劇信息收集中的搭便車問題,但當信息收集需要付出高昂的代價時,更多的交流通常會增加作出正確決策的概率。
(二)搭便車問題避免措施
因為信息獲取活動一般是不可觀測的,搭便車者可以通過提供一個虛假的信息假裝已經給予了足夠的投入,所以無法通過有效的懲罰措施以阻止搭便車問題,只能夠從決策群體的成員組成和決策規則等方面考慮避免該問題的發生。
文[19-20]的研究結論從決策群體人員組成方面為避免信息獲取中的搭便車問題提供了理論參考,指出具有極端偏好的成員相對來說更具有收集高成本信息的動機,但這兩篇文獻的研究內容不屬于嚴格意義上的群體決策,因為其中的委員會成員僅負責收集與報告信息,自身并沒有決策權。在文[19]中,委員會成員在信息收集之前相互間沒有偏好差異,在投入不可觀測的努力收集信息后形成各自不同的政策偏好,該文證明最優的委員會規模和總的社會剩余有時會隨委員會成員偏好差異期望值的增大而增大,因為預期的偏好差異為成員提供了收集信息的動機。文[20]指出,如果信息收集的成本較低,委員會成員的偏好應該與決策者的偏好類似,這是因為一方面與決策者偏好類似的成員會收集決策者想要的信息,另一方面由于偏好類似所以在報告時不會產生信息的扭曲問題;如果信息收集的成本較高,則委員會應該由具有極端偏好的成員組成,只有這些成員才具有足夠強烈的動機付出代價收集信息,但因為信任問題,他們往往只會收集硬信息,即客觀上可驗證的信息。對于在投票表決前需要對決策選項進行審議的群體決策來說,文[20]的研究結論尤其具有參考價值。
從群體決策機制設計的角度看,如果存在信息獲取問題,則機制設計者必須既要考慮如何提供充分的激勵促使群體成員獲取信息,又要考慮如何有效集結成員所獲得的信息,以最大化群體決策的期望效用。
文[21]證明,采用適當保守的決策規則可以促進群體成員收集證據,從而改善決策質量。文[22-23]對存在信息獲取時的群體決策最優規則與最優群體成員數量進行了研究。文[22]指出,盡管一致性規則使每個群體成員的投票選擇對最終結果都具有決定性影響力,但一致性規則并不能為獲取信息提供適當的激勵,而且一致性規則特別不適合于信息較不準確的情形,也即更需要群體決策的情形,在只考慮單調純策略均衡的條件下,除非群體成員的信息足夠準確,否則一致性規則或接近于一致性規則的規則不可能最優。文[23]認為,為了提供足夠的信息獲取激勵,對于相當普遍的決策情形,事前最優的決策機制事后可能是非最優的,即不必然利用了所有群體成員獲取的信息導致從統計學角度有最優的信息集結,該事前最優的決策機制是在激勵成員獲取信息與最大程度提取成員信息之間折中的產物。需要指出的是,文[21-23]均假定決策群體成員具有相同的偏好。
三、審議過程中信息的披露
決策群體,尤其是規模較小的群體,一般會在投票表決前對決策選項進行審議,交流各自的私有信息。信息的共享能引起成員信念的收斂。但群體成員通常代表著不同的利益集體,具有不同的利益追求或偏好,因而具有操縱或隱藏私有信息的動機,從而限制了信息共享的可能性,成員間策略性的信息操縱與反操縱甚至導致比純粹偏好沖突更大程度上的意見不一致。
絕大多數群體決策文獻對審議(deliberation)、交流(communication)、辯論(debate)、廉價磋商(cheap talk)等類似表述用語沒有進行明確的區分,雖然這些用語在不同場合有一些微妙甚至較大的差異,如文[24]認為審議是辯論的子集。
研究審議對群體決策的影響的文獻一般將決策過程建模為兩階段博弈:先審議后正式投票表決,通過對貝葉斯Nash均衡策略和均衡存在條件的分析,研究審議是否以及如何對群體決策發生作用。這類文獻一般假定無論是以公共利益還是以私人利益作為評判標準,好的決策選擇總是部分取決于世界的真實狀態,而世界的真實狀態對決策群體成員來說無法確切知道,他們僅不對稱地掌握了有關世界真實狀態的部分信息。在正式投票表決之前的審議過程可以使群體成員有機會告訴其他成員他們所掌握的私有信息,然后,根據各自已掌握的關于世界真實狀態的部分信息,群體成員形成自己對世界真實狀態的判斷,進而根據自己的評判標準形成各自的決策選擇偏好,如果他們的決策選擇偏好不一致,就有可能在審議的過程中不披露自己的真實信息,或提供虛假的信息以誘導其他成員作出對自己有利的決策選擇。因此,此類文獻注重從信息集結角度對完全信息披露均衡和完全信息集結均衡的分析。
Coughlan在文[25]中認為,當所有群體成員的決策偏好完全相同或足夠接近,在審議過程中每個成員都具有真實披露私有信息的動機。文[26]則進一步證明,只要群體成員主觀上認為多數成員與他擁有共同偏好具有較大的可能性,客觀上的偏好差異不會影響信息的真實共享。然而,該文同時指出,審議并不總是能有效集結信息,特別是當群體成員沒有較強的先驗信念認為自己的價值取向就是群體主流的價值取向時,可能出現有意的相互欺騙。需要說明的是,在文[26]給出的模型中,所有群體成員的偏好或者完全相同,或者完全相反,與此相符的現實群體決策情形很少,甚至幾乎沒有。文[24,27-28]證明一致性規則在很多情況下為群體成員在審議過程中策略性地隱藏信息提供了動機,多數決定規則比一致性規則能引導出更多的信息共享。文[28]還證明,在相當一般的條件下,審議使得除一致性規則以外的所有其他規則具有相同的序貫均衡集合,也即審議使得所有的無否決權規則在序貫均衡方面等價,從而說明如果群體成員在投票表決前有向所有成員公開宣布各自私有信息的機會,那么采用除一致性規則以外的其他任何決策規則,都會產生相同的決策結果。文[29]對陪審團在審議階段信息的披露進行了實驗研究,以無約束力的意向性投票形式實現信息的交流,實驗結果與理論分析基本近似。
另外,文[30]給出了一個兩成員的交流與決策模型,兩個成員投票表決是否組成具有不確定回報的合伙關系,他們的偏好不一致且為私有信息。文章分析了均衡的特征,發現在均衡時僅有部分信息被傳遞,交流對于雙方的福利是有益的。
對于很多現實決策問題,決策者可能擁有客觀上可驗證的信息,即所謂硬信息(hard information)。文[31]對硬信息在具有偏好沖突的委員會中的交流進行了研究,證明完全信息集結均衡在偏好為私有信息的情況下比在偏好為常識情況下更有可能存在,即允許更大程度上的偏好差異;另外該文證明,如果信息可驗證,完全信息集結均衡的存在條件等同于完全信息披露均衡的存在條件。文[32]指出,在審議階段群體成員共享私有信息的動機一定程度上取決于其私有信息的可驗證性,如果決策成員能夠為自己的信息提供驗證材料,則一致性規則比其他規則提供了更強的信息共享激勵,更有可能實現完全信息共享。文章給出了在一致性規則下審議階段存在完全信息披露均衡的充分必要條件。
文[33]指出,盡管偏好與信息的差異可能使得部分成員在審議過程中具有錯誤表達私有信息的動機,但給予群體成員適當的外部激勵能消除此類動機,促進信息與偏好的完全集結,而且隨著群體規模的擴大,外部激勵的強度可以很小,外部激勵的具體措施包括對成員決策能力的肯定等。
四、透明性的影響
隨著社會的進步,公眾對涉及自身利益的重要決策過程的透明性提出了越來越高的要求。透明的決策過程意味著公眾可以評價決策群體成員的偏好、能力與貢獻,從而引起決策者對自身聲譽的關注,而對聲譽的關注既可能促進信息的獲取和真實信息的披露,但也有可能導致信息傳遞與投票表決行為的扭曲。
在文[34]中,委員會成員在前一時期表現出的決策能力影響了他在后一時期能否獲得連任,而作為委員會成員可為其帶來一定的效用。該文證明公開個人投票記錄可以促進委員會成員努力獲取信息。文[35]認為,僅公布最終決策結果,不公開個人投票記錄,會誘導委員會成員按照現有偏見作出投票選擇,因此,委員會的決策傾向于保守化,向公眾公開成員的投票記錄則能夠減少現有偏見對決策的影響。該文同時認為,群體決策機制的設計應該不僅考慮決策過程的透明性,也要考慮決策規則的適當性,如果決策規則選擇合適,則不透明的決策過程可能比透明的決策過程得到更好的決策結果。在文[34-35]所給出的模型中,都沒有考慮委員會成員在投票表決前可能會相互交流各自的私有信息。
在文[36]中,委員會代表公眾對一項新工程的實施與否進行表決,委員會成員既關心工程的實際價值,又關心委員會在公眾中的聲譽,如果維持現狀,不實施新工程,則暴露出委員會成員意見的不一致,從而給委員會的聲譽帶來負面影響,而公眾僅能注意到委員會的決策結果,事后不能觀測到工程的實際價值。該文證明,在審議階段,部分成員對聲譽的過分關注可能使他們不愿真實披露私有信息,而是夸大工程的價值,導致更容易采取實施新工程的決策。文[37]認為,公開委員會的具體審議記錄可能會降低決策質量。由于委員會成員關心公眾對其決策能力的判斷,使得他們在正式會議交流過程中可能隱藏內部存在的意見分歧,公眾對于決策過程透明性的要求,可能導致委員會在正式會議之前組織秘密的非正式預備會議,將真正實質性的討論從公開的正式會議階段轉移到秘密的預備會議階段,從而對公眾消除委員會內部意見的不一致,而非正式的會議更具有不穩定性,因此,透明性要求并不一定能增加社會福利。
在文[38-40]中,外部利益關聯者可以觀察到公開委員會每個成員的具體投票記錄和決策結果,但對于秘密委員會則只能看到最終決策結果,而委員會成員既關心決策結果又關心外部利益關聯者所給予的回報。文[38]和[39]認為,不公布委員會成員的個人投票記錄可以減少外部利益關聯者對決策的影響,在某些情況下秘密委員會優于公開委員會。文[39]還特別指出,由于隨著群體成員數量的增加,單個成員的投票對最終決策具有決定性影響的概率減小,對單個成員而言不誠實投票的代價隨之減小,所以對于公開委員會來說,其成員更容易因外部利益關聯者承諾給予的回報而不誠實投票,因此Condorcet陪審團定理可能不再成立。在文[40]中,對于秘密委員會,外部利益關聯者可以根據投票表決規則的閾值和最終決策結果對委員會成員的投票作出推斷。文章分析了秘密委員會的最優決策規則,指出決策規則中增加選擇某一選項需要的投票比例可能會導致該選項更容易成為最終決策結果,傳統看法認為降低決策規則的閾值可以防止委員會過于保守的看法未必正確,但對于公開委員會則不存在此問題。文[41]雖然不是直接研究透明性,但其研究結論與此處內容相關,該文通過一個博弈模型,說明在特定情況下,外部利益集團可以不用付出任何代價就能操縱委員會的決策。
另外,不少文獻從理論與實證兩方面研究了決策過程的透明性對貨幣政策委員會決策的影響。文[7,42]對這方面的文獻進行了綜述。文[42]區分了三種類型的透明性:決策目標透明性;知識透明性,這里的知識指決策所依據的經濟數據或經濟模型等;操作透明性,包括委員會會議記錄與投票記錄的透明性以及決策結果的透明性等。該文評述的文獻有部分運用了博弈理論作為分析工具。文[7]專門討論了貨幣政策委員會決策過程中的動機問題,指出貨幣政策委員會的最優規模與透明性等仍有待進一步研究。
類似于文[34],研究透明性對貨幣政策委員會決策信息集結有效性的影響的文獻,一般認為委員會成員希望得到社會公眾對其決策能力或決策偏好的正面評價,從而獲得連任的機會,如文[43]假設委員會成員希望公眾認為他是通貨膨脹的強硬抵制者,而最近的文獻如文[44-46]等,則假設委員會成員希望公眾認為他是具有較強決策能力者。文[44]認為,公開審議過程的詳細記錄會使得貨幣政策委員會成員不愿意表達不同的意見,該文通過對美聯儲聯邦公開市場委員會在被要求公開會議記錄之前和之后的會議記錄的分析說明了理論結果的有效性。文[45-46]分析了投票記錄的公開對委員會成員投票表決行為的影響,認為投票記錄對公眾的透明帶來的負面效應占主導地位,透明性不能增加社會福利。
五、最優決策規則
顯而易見,不同的決策規則極大地影響了群體決策的信息集結效率,尤其是決策群體成員的偏好或能力不完全一致時,決策規則更是直接影響了群體成員的投票選擇行為,進而影響了決策結果的正確性。前述文獻大多不同程度地討論了決策規則的比較和選擇,除此以外,另有部分文獻對各種情況下的最優決策規則進行了研究。
文[47-48]從最大化期望效用的角度對固定規模的委員會形式集體決策的最優決策規則進行了分析,文[49-50]研究了在特定約束條件下的最優決策規則。然而,這些早期的文獻都有個潛在的假設:決策成員僅按照自身獲得的信息作出投票選擇。文[2,51]等指出,即使決策群體成員的偏好完全一致,也不能保證一定能夠如Condorcet陪審團定理所預測的那樣有效集結各成員的信息,因為群體成員僅根據自身信息作出非策略性的選擇不符合理性要求,當且僅當所使用的決策規則為集結群體成員私有信息的最優規則時,所有群體成員僅按自身信息投票才是Nash均衡,而最優決策規則則取決于特定的決策情形。
文[52]證明,當采用文[48]所定義的最優決策規則時,所有成員僅按照自身獲得的信息投票表決形成Nash均衡,但僅按自身信息投票可能不是有效的,因為部分成員聯合決定策略性投票可以增加期望效用。文[53]討論了投票者對不同決策選項具有可用基數表示的效用時的誠實投票問題,試圖給出當決策機制允許多種消息類型時誠實投票的準確定義。為使投票者具有誠實投票的動機,文[54]提出了一種在隨機選擇的投票表決集合上運用多數決定規則得到最終決策的方法,在對所有投票者的表決結果運用多數決定規則和僅對投票表決結果的隨機抽樣子集運用多數決定規則之間進行隨機選擇,可以激勵投票者誠實投票,從而得到Condorcet陪審團定理的有效性收斂結果。
文[55]基于陪審員的私有信息和策略性表決行為構建了一個陪審團決策模型,證明一致同意規則可能會導致無辜被告得到有罪判決和有罪被告得到無罪判決這兩種錯誤的概率都增加。文[56]分析了決策群體所投票表決的決策選項不獨立于投票表決規則的情形:給定決策群體的投票表決規則,提案者向決策群體提出一個要么完全接受要么完全拒絕的議案,群體投票表決是接受還是拒絕該議案。該文證明由于一致同意規則能促使提案者提出更有吸引力的議案,所以增加了決策群體的期望效用,在某些情況下,一致同意規則甚至是Pareto最優的表決規則,因為它也增加了提案者的期望效用,即使提案者與決策群體的利益追求可能完全相反??偨Y考慮一致性規則的文獻[22,24,27,28,32,55,56],可見博弈分析得到的結論往往與人們直觀上的認識截然相反,一致性規則是不是合適的決策規則完全取決于特定的決策情形。
既然投票表決規則直接影響了投票者的投票選擇行為,那么,對于群體決策機制的設計者來說,他在選擇投票表決規則時是否需要考慮投票者在各種表決規則下的投票行為,換言之,機制設計者關于投票者在各種規則下的博弈行為的信念是否會影響到最優決策規則的選擇。文[57-58]對此問題進行了研究,其中假設群體成員的決策偏好完全一致。文[57]分析了決策成員的能力存在差異且這種差異是常識的情況下的投票表決規則,指出最優的匿名單調投票規則并不取決于成員是否按照自身信息投票或策略性投票。類似于文[57]的結論,文[58]認為,決策機制設計者對最優投票表決規則的選擇與機制設計者關于投票者在不同表決規則下的投票行為的信念無關,在該文中,機制設計者為決策群體選擇投票表決規則,其目的是為了最大化決策群體的期望福利,文章證明,僅從信息集結的角度看,關于投票者在各種表決規則下的投票行為的不同假設對于最優決策規則的選擇來說,結論是一樣的,不同的行為假設導致相同的結論。對于具有相同偏好的決策群體來說,文[57-58]的研究結論大大簡化了決策規則的選擇。
現實中的決策群體往往存在具有極端偏好的成員,這些成員的存在為信息的有效集結帶來較大的困難。文[59]對存在極端偏好者和中立者的群體面對二分決策問題時的最優決策規則進行了研究,考慮了決策成員之間存在轉移支付的情況,指出最優投票表決規則相對于轉移支付可能性的大小來說是非單調的。文[60]對由兩類具有完全相反的偏好的成員所組成的委員會決策進行了分析,對比了一致性規則與非一致性規則的信息集結效率。文[61]給出了一個現實中較難接受的非單調性決策規則――超多數懲罰(supermajority penalty)規則,當選擇某一選項的投票過多時,將該選項作為群體決策最終結果的概率反而會下降,該文證明,當對于每個選項都存在極端偏好者時,超多數懲罰規則是最優匿名激勵相容規則。
前述文獻都假定群體成員的偏好相互獨立,而文[62]對群體成員具有相互關聯但不完全相同的偏好的情況進行了分析,其中的決策選擇空間是連續的,該文分別討論了采用平均規則與中值規則時所對應博弈的對稱貝葉斯Nash均衡的存在性問題,并比較了這兩種規則在不同偏好關聯程度下的性能。
由于從眾心理,群體成員經常會根據對其他成員行為的觀察相應調整自己的行為。文[63-64]對從眾心理對群體決策的影響進行了研究,其中假定群體成員一方面希望選出好的決策選項,另一方面又希望自己成為勝出的一方。文[63]分析了群體規模較大時同時投票機制與順序投票機制的均衡特征和信息集結質量,文[64]指出這種從眾心理導致同時存在多個均衡,而且對于這些均衡中的多數,信息不能被有效集結。文[64]從某種程度上說明了最優決策規則設計的困難。
六、現有研究工作的不足之處
其一,社會選擇理論與公共選擇理論以及管理學領域對群體決策的研究,主要考慮偏好集結的有效性,而其中的偏好則是指對決策選項的偏好,這種偏好取決于決策者對最終結果的更根本意義上的偏好和對世界真實狀態的信念。在現實社會中,純粹以偏好的有效集結為終極目標的重要群體決策問題幾乎不存在,例如社會選擇理論與公共選擇理論最重要的應用領域――選舉,既是偏好集結(這里指更根本意義上的偏好),更是信息集結。僅考慮偏好的集結問題,不考慮偏好的形成過程以及信息在偏好形成過程中的潛在作用,無法分析群體內外部交流與互動等對決策的影響,無法解釋現實中的很多現象,因而對相關決策機制設計的指導作用較為有限。
其二,社會心理學從認知的角度研究群體決策,其結論出自于對實驗和經驗數據的統計學分析,易于為人們接受。但由于從實驗或經驗數據中利用統計學方法推導出群體的偏好分布參數極為困難,所以無法深入研究群體決策過程中因偏好不一致而導致的隱藏與扭曲私有信息等策略。
其三,與社會選擇理論和公共選擇理論一樣,用博弈論研究群體決策信息集結問題的文獻也是以理性選擇假設作為判斷與決策的微觀基礎。盡管所有群體成員嚴格按照貝葉斯規則更新自己的信念等完全理性假設對于心理學家和普通人來說都是難以接受的,但博弈論文獻還是以其數學分析的簡潔與嚴謹顛覆了很多直覺上的認識,通過對群體決策者動機的分析,有助于我們理解決策機制的哪些方面可能會引起不利于決策目標實現的策略,進而有助于決策機制的改進。隨著群體成員偏好差異程度和決策問題重要程度的增加,審議方式和決策規則趨向于書面化和正規化,群體思維與群體極化現象將很少出現,決策結果也將更接近于博弈分析的預測。
目前對群體決策信息集結問題的研究尚處于起步階段,還有很多不完善之處,在某些方面甚至存在根本性的缺陷。
第一,可能是受到信息經濟學研究的誤導,本領域的很多理論與實驗分析文獻,包括一些奠基性的文獻,混淆了信息與在信息基礎上形成的判斷。真實信息的披露不會引起其他群體成員以及公眾對自己決策能力的負面評價,更不會如判斷的披露那樣引起認知上的從眾,如果決策者掌握了確鑿可靠的信息,則其不會因為其他人基于其他信息產生的不同看法而輕易改變自己的信念。
除個別文獻外,現有研究群體決策信息集結問題的文獻幾乎都是將審議完全等同于信息經濟學領域的廉價磋商,將交流限制為每個群體成員同時向所有其他成員發送一輪公開的消息。在現實群體決策過程中,審議至少包括對各方面提供的信息的真實性的審議,以及對信息與世界真實狀態之間的邏輯關聯(即潛在的決策模型)的審議。因此,將審議建模為完全的廉價磋商的現實意義極為有限,對于偏好差異較大的群體更是如此。
第二,客觀上難以驗證的信息的可接受性,取決于接收者對于信息發送者的偏好的信念,例如,人們有充分的理由懷疑壟斷企業單方面提供的企業運營成本數據的真實性。另一方面,在很多情況下,信息的軟硬程度(可驗證程度)與信息獲取者和信息接收者的成本投入相關。因此,群體成員獲取可驗證信息與不可驗證信息的動機,以及群體成員對信息軟硬程度的投入,既取決于是否有審議階段以及審議方式和決策規則,也取決于群體成員的偏好和群體成員關于群體偏好差異程度的先驗信念。諸如此類問題現有文獻幾乎沒有涉及。
群體決策在現代社會無處不在,如政府部門對重大戰略性問題的決策、公司董事會對重要項目投資與實施問題的決策、審判委員會對犯罪嫌疑人的判決、專家對科學基金項目申請書的評審等。從組織或社會的目標出發,針對特定的決策問題,為了盡可能作出正確的決策,應該如何組成決策群體,選擇何種決策規則?此類群體決策的科學化與民主化問題很久以來一直是管理、政治、法律和經濟等領域討論的中心,其研究結果對于各類政治、社會、經濟組織的運行機制設計具有重要的意義。
中國學者對群體決策的理論與方法進行了大量的研究,提出了不少新的概念和方法,作出了很多重要貢獻,國家自然科學基金委員會對群體決策理論與方法研究也較為重視,曾將其列為優先資助領域。但根據現有的各類文獻和歷年的基金項目研究摘要,總體感覺國內對決策群體成員的動機和理考慮較少,到目前為止還沒有發現國內其他學者利用博弈論研究群體決策信息集結問題。
筆者試圖利用不完全信息博弈論和機制設計理論,研究決策群體成員的策略性信息獲取、信息傳遞和投票表決行為,揭示決策群體人員組成、審議方式、決策規則、透明性等決策機制的各個方面對群體決策的信息集結有效性的具體影響。并試圖從信息集結角度,為一些典型公共決策情形優化決策機制。
參考文獻:
[1] PIKETTY T. The informationaggregation approach to political institutions[J]. European Economic Review, 1999, 43(4-6):791-800.
[2] AUSTENSMITH D, BANKS J. Information aggregation, rationality, and the Condorcet jury theorem[J]. American Political Science Review, 1996, 90(1):34-45.
[3] FEDDERSEN T, PESENDORFER W. The swing voter’s curse[J]. American Economic Review, 1996, 86(3):408-424.
[4] FEDDERSEN T, PESENDORFER W. Voting behavior and information aggregation in elections with private information[J]. Econometrica, 1997, 65(9):1029-1058.
[5] MYERSON R. Extended Poisson games and the Condorcet jury theorem[J]. Games and Economic Behavior, 1998, 25(1):111-131.
[6] FEDDERSEN T, PESENDORFER W. Elections, information aggregation, and strategic voting[J]. Proceedings of the National Academy of Sciences of the United States of America, 1999, 96:10572-10574.
[7] FUJIKI H. The monetary policy committee and the incentive problem: A selective survey[J]. Monetary and Economic Studies, 2005, 23(S1):37-82.
[8] VANDENBUSSCHE J. Elements of optimal monetary policy committee design[EB/OL]. IMF Working Paper No. 06/277, 2006. (2006-06-30) 省略/external/pubs/ft/wp/2006/wp06277.pdf.
[9] GERLING K, GRNER H, KIEL A, SCHULTE E. Information acquisition and decision making in committees: A survey[J]. European Journal of Political Economy, 2005, 21(3):563-597.
[10] Mukhopadhaya K. Jury Size and the Free Rider Problem[J]. The Journal of Law, Economics, and Organization, 2003, 19:24-44.
[11] MARTINELLI C. Would rational voters acquire costly information?[J]. Journal of Economic Theory, 2006, 129(1):225-251.
[12] MARTINELLI C. Rational ignorance and voting behavior[J]. International Journal of Game Theory, 2007, 35(3):315-335.
[13] KITAHARA M, SEKIGUCHI Y. Condorcet’s jury theorem under costly information acquisition[EB/OL]. Working Paper, University of Tokyo, 2004. (2004-04-25).e.utokyo.ac.jp/cemano/research/DP/documents/coef54.pdf.
[14] KITAHARA M, SEKIGUCHI Y. Aggregate accuracy under majority rule with heterogeneous cost functions[J]. Economics Bulletin, 2006, 4(25):1-8.
[15] KITAHARA M, SEKIGUCHI Y. Condorcet jury theorem or rational ignorance[J]. Journal of Public Economic Theory, 2008, 10(2):281-300.
[16] BAG P, LEVINE P, SPENCER C. A note on: Jury size and the free rider problem[J]. Economics Bulletin, 2006, 4(3):1-12.
[17] TRIOSSI M. Costly information acquisition. Better to toss a coin?[EB/OL]. Working Paper, Collegio Carlo Alberto, 2010.(2010-03-15).webmanager.cl/prontus_cea/cea_2010/site/asocfile/ASOCFILE120100127120554.pdf.
[18] SWANK O, WRASAI P. Deliberation, information aggregation, and collective decision making[EB/OL]. Working Paper, Tinbergen Institute, 2003.(2003-06-20) .tinbergen.nl/discussionpapers/02006.pdf.
[19] CAI H. Costly participation and heterogeneous preferences in informational committees[J]. The RAND Journal of Economics. 2009, 40(1):173-189.
[20] BENIERS K, SWANK O. On the composition of committees[J]. Journal of Law, Economics, and Organization, 2004, 20(2): 353-378.
[21] LI H. A theory of conservatism[J]. Journal of Political Economy, 2001, 109(3):617-636.
[22] NICOLA P. Committee design with endogenous information[J]. Review of Economic Studies, 2004, 71(1):165-191.
[23] GERARDI D, YARIV L. Information acquisition in committees[J]. Games and Economic Behavior, 2008, 62(2):436-459.
[24] AUSTENSMITH D, FEDDERSEN T. Deliberation and voting rules[M]//AUSTENSMITH D, DUGGAN J. Social choice and strategic decisions. Berlin: Springer Berlin Heidelberg, 2005:269-316.
[25] COUGHLAN P. In defense of unanimous jury verdicts: Mistrials, communication, and strategic voting[J]. American Political Science Review, 2000, 94(2): 375-393.
[26] MEIROWITZ A. In defense of exclusionary deliberation: Communication and voting with private beliefs and values[J]. Journal of Theoretical Politics, 2007, 19(3): 301-327.
[27] AUSTENSMITH D, FEDDERSEN T. Deliberation, preference uncertainty, and voting rules[J]. American Political Science Review, 2006, 100: 209-217.
[28] GERARDI D, YARIV L. Deliberative voting[J]. Journal of Economic Theory, 2007, 134(1): 317-338.
[29] GUARNASCHELLI S, MCKELVEY R, PALFREY T. An experimental study of jury decision rules[J]. American Political Science Review, 2000, 94: 407-423.
[30] DORASZELSKI U, GERARDI D, SQUINTANI F. Communication and voting with doublesided information[J]. Contributions to Theoretical Economics, 2003, 3(1), Article 6.
[31] SCHULTE E. Information aggregation and preference heterogeneity in committees[J]. Theory and Decision, 2010, 69(1):97118.
[32] MATHIS J. Deliberation with partially verifiable information[EB/OL]. THEMA Working Papers No. 2006-03, (2006-08-20). ucergy.fr/IMG/2006-03.pdf.
[33] MEIROWITZ A. Designing institutions to aggregate preferences and information[J]. Quarterly Journal of Political Science, 2006, 1(4): 373-392.
[34] GERSBACH H, HAHN V. Information acquisition and transparency in committees[EB/OL]. CEPR Discussion Paper no. 6677, London, Centre for Economic Policy Research, (2009-06-20). papers.省略/sol3/papers.cfm?abstract_id=1084060.
[35] LEVY G. Decision making in committees: Transparency, reputation and voting rules[J]. American Economic Review, 2007, 97(1):150-168.
[36] VISSER B, SWANK O. On committees of experts[J]. The Quarterly Journal of Economics. 2007, 122(1):337-372.
[37] SWANK O, VISSER B. Is transparency to no avail? Committee decisionmaking, premeetings, and credible deals[EB/OL]. Working Paper, Tinbergen Institute, (2009-06-18). people.few.eur.nl/bvisser/articles/Transparency%20Dec%202009.pdf.
[38] SEIDMANN D. A Theory of voting patterns and performance in private and public committees[EB/OL]. CeDEx Discussion Paper 2009-06, (2009-10-15). nottingham.ac.uk/economics/cedex/papers/2009-06.pdf.
[39] FELGENHAUER M, GRUNER H. Committees and special interests[J]. Journal of Public Economic Theory, 2008, 10(2): 219-243.
[40] SEIDMANN D. Optimal quotas in private committees[J]. The Economic Journal, 2008, 118(525):16-36.
[41] DAL B E. Bribing voters[J]. American Journal of Political Science, 2007, 51(4):789-803.
[42] HAHN V. Transparency in monetary policy: A survey[J]. IFO Studien, 2002, 48(3):429-455.
[43] SIBERT A. Monetary policy committees: Individual and collective reputations[J]. The Review of Economic Studies, 2003, 70(3):649-665.
[44] MEADE E, STASAVAGE D. Publicity of debate and the incentive to dissent: Evidence from the US Federal Reserve[J]. The Economic Journal, 2008, 118(528):695-717.
[45] HAHN V. Committees, sequential voting and transparency[J]. Mathematical Social Sciences, 2008, 56(3):366-385.
[46] HANS G, HAHN V. Should the individual voting records of central bankers be published?[J]. Social Choice and Welfare, 2008, 30(4):655-683.
[47] NITZAN S, PAROUSH J. Optimal decision rules in uncertain dichotomous choice situation[J]. International Economic Review, 1982, 23:289-297.
[48] BENYASHAR R, NITZAN S. The optimal decision rule for fixedsize committees in dichotomous choice situations: The general result[J]. International Economic Review, 1997, 38:175-186.
[49] BENYASHAR R, KHULLER S, KRAUS S. Optimal collective dichotomous choice under partial order constraints[J]. Mathematical Social Science, 2001, 41:349-364.
[50] KRAUS S. Optimal collective dichotomous choice under quota constraints[J]. Economic Theory, 2002, 19:839-852.
[51] MCLENNAN A. Consequences of the Condorcet jury theorem for beneficial information aggregation by rational agents[J]. American Political Science Review, 1998, 92:413-418.
[52] BENYASHAR R. Information is important to Condorcet jurors[J]. Public Choice, 2006, 127(3):305-319.
[53] BALLESTER M, REYBIEL P. Does uncertainty lead to sincerity? Simple and complex voting mechanisms[J]. Social Choice and Welfare, 2009, 33(3):477-494.
[54] LASLIER J, WEIBULL J. Providing incentives for informative voting[EB/OL]. Working Paper, Ecole Polytechnique, (2006-10-10). hal.inria.fr/docs/00/24/30/42/PDF/2007-01-04-1531.pdf.
[55] FEDDERSEN T, PESENDORFER W. Convicting the innocent: The inferiority of unanimous jury verdicts under strategic voting[J]. The American Political Science Review, 1998, 92(1):23-35.
[56] BOND P, ERASLAN H. Strategic voting over strategic proposals[J]. Review of Economic Studies, 2009, 77(2):459-490.
[57] BENYASHAR R, MILCHTAICH I. First and second best voting rules in committees[J]. Social Choice and Welfare, 2007, 29(3):453486.
[58] COSTINOT A, KARTIK N. On optimal voting rules with homogeneous preferences[EB/OL]. Working Paper, Massachusetts Institute of Technology,(2009-05-25). econmit.edu/files/3732.
[59] MEHMET B, PARIMAL K B. Committee decisions with partisans and sidetransfers[J]. Theory and Decision, 2002, 52(3):267286.
[60] JAEHOON K. A model of adversarial committees[EB/OL]. Working Paper, University of Rochester, (2005-09-12).省略.rochester.edu/~jaek/Adversarial.pdf.
[61] CHWE M. Anonymous procedures for Condorcet’s model: Robustness, nonmonotonicity, and optimality[J]. Quarterly Journal of Political Science, 2010, 5(1):4570.
[62] GRNER H, KIEL A. Collective decisions with interdependent valuations[J]. European Economic Review, 2004, 48(5):1147-1168.
關鍵詞:認知無線電;功率控制;非合作博弈;納什均衡;效用函數
中圖分類號:TN014文獻標識碼:A文章編號:1672-3198(2009)16-0265-02
0 前言
認知無線電(cognitive radio,CR)是以軟件無線電(software radio)技術為基礎的能夠提高無線通信頻譜利用率的新技術。在很多國家,傳輸效率較高的頻段是以授權分配的方式分配給無線通信業務部門和運營企業的,但這些頻段的授權用戶并不是在任何時刻都使用分配給他的頻段,因此不少傳輸效率很高的授權頻段會經常處于空閑狀態,這就浪費了寶貴的頻譜資源。根據美國聯邦通信委員會(FCC)所進行的大量研究表明,在大部分地區,授權頻段的平均利用率在15%―85%之間,而一些傳輸效率較高的非授權頻段則過于擁擠。于是Joseph Mitola博士在1999年首先提出了認知無線電概念,目的就是解決頻譜資源的有效利用問題。
博弈論(Game Theory)又被稱為對策論,是現代數學的一個分支,也是運籌學的一個重要組成部分,是研究互動決策的理論。John Nash博士在1950年提出了納什均衡(Nash equilibrium,NE)即非合作博弈均衡的概念。該理論指出,在一策略組合中,所有的參與者都面臨這樣一種情況,當其他人不改變策略時,他此時的策略是最好的,此時便達到了納什均衡。在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的沖動。這種參與者為了各自利益的最大化不斷改變策略的做法,與CR中各認知用戶為爭得傳輸效率的最大化對頻譜和功率不斷進行調整的自適應算法策略相符。因此,可以引入非合作博弈論模型對CR的頻譜分配和功率控制算法進行檢測和優化。
本文以認知用戶的滿意度為設計目標,引入代價函數得到一種新的基于非合作認知無線電功率控制的博弈模型,并結合對該模型的分析介紹了非合作博弈論在CR中的一般分析方法。
1 認知無線電體系結構
認知無線電是對軟件無線的擴展,因此具備軟件無線可重新配置的特點,并且能夠實現基于環境認知的自動配置。S•Haykin根據CR所必需的頻譜掃描、信號分析、參數測量、頻譜決策、協議分析等功能,給出了CR系統構成的基本功能結構,該結構將CR系統分為三個功能模塊。
(1)無線頻譜分析模塊。
該模塊通過接收環境中的射頻激勵,并利用自身算法對激勵信號進行動態分析,實時提供對環境中頻譜空穴的檢測情況,搜集可使用的頻譜空穴的信息。
(2)無線信道估計模塊。
該模塊根據無線頻譜分析模塊的分析結果,對無線信道狀態和容量進行估計,為系統通信信道的選擇提供依據。
(3)傳輸功率控制和動態頻譜管理模塊。
該模塊根據頻譜分析模塊和信道估計模塊的分析結果,選擇最優的頻譜空穴進行通信。在通信過程中對傳輸功率進行實時控制,使得首要用戶和次要用戶均能達到最優的通信水平。
S•Haykin給出的三個功能模塊共同構成了CR系統的物理層,從各個模塊所具備的功能可以看出認知無線電是應用了多種現代信號處理技術的綜合性通信平臺。
2 非合作博弈論在認知無線電中的分析方法
認知無線電中的策略選擇問題及相關算法的設計是該技術的研究核心。利用非合作博弈論,可以按以下方法及步驟對自適應算法進行分析:
(1)該算法是否能達到納什均衡。即驗證算法是否能達到納什均衡,具體步驟為:先將所研究的問題抽象為相應的非合作博弈算法模型,然后證明該模型中NE的存在性和唯一性。
(2)該算法達到納什均衡(NE)后的穩定狀態是否符合帕累托最優(Pareto Optimality)。即根據系統的目標函數衡量這一穩定狀態是否是實際應用環境中的最優情況。
(3)該算法達到納什均衡和帕累托最優的約束條件。
3 基于非合作博弈論的認知無線電功率控制模型
在認知無線電中,非授權用戶接入處于空閑狀態的授權用戶頻段,可以提高系統的頻譜利用率,但是該接入過程必然會導致授權用戶和非授權用戶之間的干擾。這是由于在CR系統中通常采用動態功率控制以擴大通信系統的工作范圍,而每個用戶的發射功率都會對其他用戶造成干擾。2003年,為了規范移動頻段的非授權操作,美國聯邦通信委員會(FCC)提出了新的量化和管理干擾的指標――干擾溫度。在給定干擾溫度和頻譜空穴的限制下控制發射功率,可以看做為一組策略問題,而且在實際環境中很好的符合了非合作博弈的模型。在CR中,每個用戶都從自身的利益出發,追求功率的最大化,而任何用戶發射功率的增大都會對其他用戶利益造成影響。因此需要提供一種有效的算法對各個用戶的發射功率進行動態控制,以達到所有用戶的總利益最大化。
在CR中可以用信道利用率、系統吞吐量、系統信干比等指標來衡量用戶的利益。假設以系統信干比來衡量,設計算法時就應當以系統的總干擾水平最小化為設計目標。
通常把授權用戶稱為主要用戶(Primary User),非授權用戶稱為次要用戶(Secondary User)。假設通信環境中多個主要用戶和次要用戶同時工作,次要用戶具有認知能力,即把次要用戶看做認知用戶。假設認知用戶i的發射功率為pi,傳輸增益為gi,且認知用戶與基站存在通信鏈路,基站接收到的該用戶的功率為pigi,第j個主要用戶對第i個次要用戶的干擾為Qij并有M個主要用戶,則相應的次要用戶在基站處的信干比(SNIR)為:
ri=WRi•pigi∑Nj=1,j≠ipigi+σ2+∑Mj=0Qij(1)
其中σ2為基站處背景噪聲,Ri為傳輸速率,W為第i個用戶在的擴頻帶寬。
文獻提出的非合作的認知無線電網絡的功率控制純策略的博弈模型(NPCG)定義了:參與者I={1,2,…,N}為認知網絡中非授權用戶的集合;策略空間pi,認知用戶在一次博弈中選擇的策略構成功率矢量P={p1,p2,…,pN};用 表示用戶i的效用,即用戶i對所選策略的滿意程度,其中p-i是除i外其他N-1個用戶的功率。
在該模型中,每個認知用戶的策略都是盡量增大功率,以獲得更高的效用。但當功率超過干擾溫度后,整個系統的性能會迅速惡化,進而造成每個用戶的效用都會降低。因此,必須選定合適的代價函數,使用戶獲得更高效用時付出相應的代價??紤]到在低于干擾溫度時,用戶只需付出較小的代價,而當超過干擾溫度時,每增加一定的效用必須讓用戶付出更高昂的代價,筆者選擇SINR的正切函數做為代價函數:
Ci=tg(kri)(2)
其中k為干擾系數,在認知用戶發射功率接近干擾溫度時,kri的取值接近π2 。
在非合作的認知無線電網絡的功率控制純策略的博弈模型的基礎上,結合式(2)筆者提出基于非合作的功率控制算法的數學模型:
ui(pi,p-i)=Ripif(ri)-λpiritgri(3)
其中piri表示增加單位信干比所要增加的功率,λ為懲罰因子,代表代價函數有效性的量度。該模型通過引入代價函數增加了懲罰機制,以此來控制認知用戶為追求信干比一味增大發射功率的行為。當功率超過干擾溫度后的嚴厲懲罰,會使所有認知用戶意識到,犧牲一定的信干比可以帶來效用的最優,從而將發射功率控制在干擾溫度以下,避免了超過干擾溫度后系統性能迅速下降的惡性情況出現。
按照上節介紹的分析步驟對式(3)給出的模型進行分析,討論該模型是否存在納什均衡(NE)以及是否符合帕累托最優。對式(3)求一階導數后可求得微分方程的駐點,進而再求出二階導數,易證式(3)的二階導數小于零。因此可得出該非合作博弈過程中NE的存在性和唯一性,所求得的駐點為唯一的納什均衡點,同時該駐點即為所應滿足的約束條件。
4 結論
認知無線電概念提出的20年以來,隨著相關技術的研究不斷深入、相關傳輸標準的確立以及計算機處理能力的提高,CR的應用越來越廣泛。本文首先介紹了CR物理層的基本結構,然后結合一種新的基于NPCG的非合作非合作功率控制模型的構建,介紹了非合作博弈論在認知無線電中的分析方法。綜上所述,我們有理由相信,隨著相關理論和技術的不斷進步,非合作博弈論必將在認知無線電的功率分配、頻譜分配以及其他核心研究方向發揮更大的作用。
參考文獻
[1]S.Haykin,Cognitive radio:Brain - Empowered Wireless Communications Selected Areas in Communications, IEEE Journal, 2005,23(2):201-220.
[2]FOSCHINI G J, MILJANIC Z, A Simple Distributed Autonomous Power Control Algorithm and Its Convergence[J]. IEEE Transactions on Vehicular Technology, 1993,(42):641-646.