上財ITCS主任陸品燕教授：探索算法博弈論的重點與三條主線

本文作者：陳伊莉

編輯：溫曉樺

2017-11-11 22:13

導語：計算經濟學，或稱算法博弈論。陸品燕教授首先作了一個關于算法博弈論的簡單介紹，并重點分享了算法博弈論研究中的三條主線。

2017 年10月19——21日，中國計算機學會學科前沿講習班（CCF —— ADL）在上海財經大學舉辦。本期主題是《計算經濟學的理論與應用》，邀請了七位來自清華、上海財經大學、上海交通大學、香港大學的計算經濟學領域專家以及螞蟻金服、萬向集團的負責人，從計算機經濟學（算法博弈論）的基本原理、到拍賣、采購機制設計、區塊鏈及分布式商業，并結合理論在實際中的應用場景進行了詳盡的分享和解讀。

陸品燕是上海財經大學信息學院教授，理論計算機科學研究中心（ITCS）主任。在獲得清華大學計算機系博士學位后，他加入微軟亞洲研究院，2015年離開微軟研究院加盟上海財經大學領銜組建了ITCS。有50余篇科研論文在STOC、FOCS、SODA、EC等頂級計算機理論及博弈論的國際會議和雜志發表，榮獲ICALP2007、FAW2010、ISAAC2010等重要國際會議最佳論文獎。2017年擔任計算經濟學方向重要國際會議WINE 2017的程序委員會主席。他的主要研究方向是理論計算機，并注重與其它學科的交叉，例如與經濟學、博弈論交叉后誕生的算法博弈論（algorithmic game theory)，主要關注拍賣理論及機制設計。

計算經濟學，或稱算法博弈論。作為本次課程的首位講師，他首先作了一個關于算法博弈論的簡單介紹，并重點分享了算法博弈論研究中的三條主線。

算法博弈論在現實中的應用有如，搜索引擎網址排序、淘寶賣家排序等?？偟膩碚f，在市場行為、交通道路設計、導航問題、在線廣告拍賣、選舉等方面，算法博弈論都能發揮作用。他告訴雷鋒網，他認為業界從業者也有必要了解算法博弈論，尤其是上述搜索引擎、電商平臺等產品負責人，減少可能的作弊行為，為用戶帶來更良好的體驗。除了主動學習，業界主動引進相關理論人才也是一種選擇。此外，陸品燕教授還重點講解了設施選址問題的機制設計和最佳拍賣機制（optimal competitive auctions）。

沒有參與 CCF 線下課程的朋友不要著急，雷鋒網人工智能培訓平臺AI慕課學院獲 CCF 獨家線上視頻版權，觀看本次講習班完整視頻+PPT可戳：http://www.mooc.ai/course/193。完整再現各路專家現場授課、交流的場景。

以下是陸品燕教授演講原文，雷鋒網作了不改變原意的編輯：

博弈論的基本要素

博弈論的一大基本假設就是，游戲中的玩家或者參與的人是理性的。當然，游戲不一定是字面意義上的游戲，現實中任何涉及到多方不同利益的情況都可以認為是博弈。但事實上人并不理性，例如行為經濟學就已經指出這一點。那么什么叫理性的人？這里討論的不是哲學的理性而是數學的理性。數學的理性是指，當一個人他有很多行為選擇的時候，他會有非常強的欲望實現效用函數即收益最大化，或者說成本最小化，并依據此來做出選擇。當然，不同的人可能有不同的效用函數或者成本函數，每個人對同一件事情的衡量標準不同，但是決策標準是相同的。這個假設有兩個層面，第一層是模擬出個人的效用函數，第二是他總是去最優化函數。

第二個重要因素是競爭的環境。這是指同一時間有多個玩家參與博弈，多個玩家都想最優化他們各自的利益，而且他們不同的行為會影響到彼此的利益。

所以，博弈論試圖分析的就是在一個競爭的環境里面，理性的玩家是怎么選擇，行為又會產生什么后果。最簡單的例子就是石頭剪刀布，收益的關系可以利用類似的矩陣來展示。

這里還引入了均衡的概念，博弈均衡是指使博弈各方實現各自認為的最大效用，在博弈均衡中，所有參與者都不想改變自己的策略的這樣一種相對穩定、靜止的狀態。

與以前一般的優化問題不同，一般的優化問題總是在尋找最優解或者近似最優解，但在博弈論中很難找到全局最優，每個玩家希望最大化自己的收益，但是處在有很多玩家的競爭環境，所以它的解一般是用均衡或者穩態來描述。穩態的意思是，大家卡在一種狀態，誰也不想離開這個狀態，因為單獨離開對他沒有好處。但實際上，這樣的穩態也有一些問題，比如說囚徒困境。

還有一個問題是，在一個定義了每個人的效能函數，或者成本函數的博弈中，穩態是不是總是存在。

馮諾依曼在1928年的時候就證明，如果是在兩個玩家參與，并且是類似石頭剪刀布的零和博弈（兩個玩家完全對抗，效能函數之和是定值或0）的情況下，穩態總是存在的，而且用比較簡單的線性規劃方法來找到。而在其他更復雜的，如多個玩家、不是零和博弈的情況下，納什證明穩態也總是存在，就是所謂的納什均衡。

算法博弈論簡介

在傳統博弈論中，涉及的玩家很少，只有兩三個，但當競爭環境變得非常復雜，比如資本市場，傳統博弈論就不太適配。而算法有一個重要特性就是復雜性，在加入復雜性這個維度后的博弈論，玩家行為會更加多元化，這也是算法博弈論研究的重點。

剛剛提及，博弈論認為，模擬出來后的最終狀態應該是穩態，如果這是很簡單的游戲，基本有預測能力。但當系統非常大時，還能不能做這樣的預測？

從純粹博弈論的角度來說，肯定可以，比如能夠證明納什均衡的存在。但在實際中，研究者能否有效地計算出均衡呢？如果計算不出，那么就不能進行有效的預測。

還有一個更深刻的問題，理論上的預測能否出現在現實中。當計算機都不能算出均衡的時候，市場為什么就能達到這個均衡？如果不能達到，預測有何意義？這些都是系統變得越來越復雜時，我們需要去研究和回答的。

算法博弈論在現實中應用包括公共基礎設施規劃、電商平臺、車牌拍賣。實際上，我們可以通過算法和策略設計博弈。比如車牌拍賣，各地根據不同的需求設計不同的規則，需求可能是控制數量，減少污染；或者保持公平性。博弈的規則會影響玩家的效能函數。

歸納來說，算法博弈論或者計算經濟學是從計算機科學的維度來研究博弈論，包括可計算性、復雜性、算法設計的角度。

算法博弈論三個主線

1、研究的是博弈論、經濟學中的計算問題，包括復雜性等，博弈論為計算機科學提供了一些新問題。

第一個問題，經濟學告訴我們，納什均衡和市場均衡總是存在，那么如何計算平衡？這一類計算平衡問題不同于以往研究方向：判定問題或者優化，對應不動點計算，給計算機科學創造了新的計算問題和計算復雜類。

第二個問題更像優化問題。但是傳統的優化問題約束、目標函數可知。但是在博弈的最優策略的時候，不止是一個方案，除了自己的想法，還要預測對方的行為，是一個交互式的過程。

現實中的問題有，如何給商品定價以達到利益最大化。比如蘋果怎樣給新發布的產品定價。市場調查可以得到預期反饋，包括價格和購買人數。如果只有一個產品，我們只要研究需求曲線基本就可以了。但是在產品配置不同，定價也不同的時候，如何能讓高價產品有足夠多的消費者，如何讓低價產品不至于出現太高性價比吸引走原高價產品的客群等。傳統的優化問題就是，定完價格、分配方式，收益是確定的。但是博弈情況下，需要預測潛在買家對于不同的價格策略有什么反饋。

第三個問題，如何計算合作博弈中的“核”(Core)及沙普利值(Shapley value)。合作博弈是指一些參與者以同盟、合作的方式進行的博弈，博弈活動就是不同集團之間的對抗。

2、本質上是算法設計、優化問題，但是考慮到眾多理性人和競爭環境，傳統的算法設計就變成了機制設計問題。機制設計被稱作“經濟學中的工程學”，因為大多數的經濟學研究是去解釋世界，而機制設計是設計。

在競爭環境下，設計的算法運行實際效果可能并沒有那么好。例如搜索引擎和淘寶商家排名。比如搜索引擎的PageRank網頁排名，是由Google發明的一種由根據網頁之間相互的超鏈接計算的技術，Google用它來體現網頁的相關性和重要性。算法會根據用戶的搜索關鍵字匹配網頁，而一些公司就開始利用這種規則，衍生了一種專門的職業——SEO，搜索引擎優化。工程師通過一些技術手段，彼此增加鏈接或者在頁面上使用隱形的關鍵詞，使得搜索引擎的算法認為該網頁與關鍵字的匹配度很高，這樣就破壞了PageRank和頁面排名的初衷。

類似的也體現在淘寶賣家。他們會通過刷信譽刷銷量等方式提高自己的排名。而這些，是背后公司和用戶都希望杜絕的。

這些都有一個共同點：設計者并不能掌握網頁或者賣家的信息，即無法掌握所有的輸入信息真實性。第二，輸出的結果能否真實實現也是不能確定的。

在與這些理性或者說自私的玩家進行交互的時候，簡單的算法設計就變成了機制設計問題。不僅需要滿足計算機科學方面的有效性要求等，還需要滿足從博弈論的角度，考慮用戶的反饋。這是在網絡時代，特別網絡經濟時代非常重要的。

3、引入計算機視角，研究對象還是博弈系統。

舉一個例子，比如研究經濟學中的納什均衡。從社會福利方面來看，經濟學其實很早就知道不一定最優，比如囚徒困境。但之前經濟學只能確定，哪一類博弈是最優或者不是最優的，計算機科學有近似比的概念，當它不是最優的時候，可以研究是否是近似最優，于是引入了最差均衡效率(PoA)等。

這也體現在宏觀看市場調節是否有效方面。在某些領域，市場充分競爭的最后，整體的社會利益是一個非常好狀態。但是在另外一些領域，彼此的惡性競爭可能就會失效，整個社會在非常不好的狀態，于是會研究是否需要政府干預走出這個博弈。

所以，我們引入了近似比的概念來衡量它多不好，因為有些不是最優的情況能夠接受，有些不是最優的情況可能相差太大，需要改變。

第二從時間的角度來研究有效性。納什均衡是玩家不斷改變自己的策略，以至于最終慢慢收斂到一個動態平衡的結果。也就是說這是一個動態的過程，這個動態過程是不是趨向于穩態或者很快的趨向于穩態。如果純粹從數學方面來說，一般得出的結論是最終會收斂，

那么在不同動態的假設中，收斂究竟會多快呢，比如它是不是在一個多項式時間里收斂到納什均衡，這也是計算機科技引入的新概念。以前經濟學只研究收斂或不收斂，但是在現實中這個區別非常重要。如果能夠很快收斂，他們的行為可能與現實比較相符。如果動態非常慢，你可能可以假設，系統還處在動態變化的過程，另一個方向就是，可否去干預該系統，使它能夠比較快的收斂。

附提問：

提問：當用戶面臨信息過載的情況，面對傳統經濟學的理性人假設可能就不是很適用，這是否超出了計算經濟學的研究上限？

回答：這是一個很好的問題。我們假設每個用戶最優化自己的效能函數或者成本，當用戶在一個復雜的系統中，可能出現信息過載，以至于用戶沒有收集到足夠的信息，或者是沒有足夠的可能計算能力。這樣他無法算清什么是最優。實際上，在傳統的博弈論中也有有限理性的假設，比如計算能力有限等，這也是計算經濟學一個重要的研究方向。

7位大咖齊聚CCF ADL計算經濟學課程，探索算法博弈論，區塊鏈、人工智能與經濟學的交叉

雷峰網原創文章，未經授權禁止轉載。詳情見轉載須知。

0人收藏

陳伊莉

編輯

數據漫游天地間。聯系可通過上方郵箱或WeChat（請注明身份、姓名、來意，thx）

掃描關注作者微信

發私信

當月熱門文章