從賽局理論看全球淨零困境
2023-3-22前言
2050 淨零碳排(Net-Zero)的目標在國際間引起了巨大的迴響,然而,所以人心中都有的問題是「 27年後要做到全球零碳排放,真的可能嗎?」。
畢竟,實現淨零並不僅僅只是科技創新就了事,還需要的是全球所有國家在政治、經濟與生活文化上都做出調整。
這是一場弔詭的挑戰:人類史上所有科技的演進都在追求「方便」,但淨零挑戰卻是要我們「不方便」。自從人類懂得使用工具以來,我們思考的問題從來都是「我們怎樣更快更大更多?」,但今天的問題卻是「我怎樣更『乾淨』」?
這是人類史上前所未見的問題,代價卻是整個種族的生存與否。
究竟我們能否達成 2050 淨零? IEA 國際能源署說「有可能」。但是「可能」不見得「可行」,也許從賽局的角度來思考「淨零與否」這個問題,可以給我們一些啟發。
多人囚徒困境
「公共財之悲劇」、「草原悲歌」是指當一群牧人達成協議,限制自己牲口數量不過度放牧,草原就會永續復原生長;但若有少數牧人貪圖一時之利益,在半夜偷偷放牧更多羊群,結果會導致草原浩劫,所有人的牲口都會餓死。
這樣的困境在賽局理論中,也被稱為「多人囚徒困境」。對每一位參與者而言,選擇進行社會欺騙—在半夜偷偷放牧,是對自己有利益的策略。但是當所有人都選擇對自己有利的策略時,最終局就是所有人都將喪失利益。
也許你已經看出來了,全球 2050 淨零目標,就是一個多人囚徒困境。若所有國家皆積極投入永續轉型,那我們有機會在氣候變遷的不可逆點之前達成淨零,成功避免全球性的氣候變遷災難;但當過多國家、企業選擇「搭順風車」這個自私策略(賽局中的優勢策略),那麼結局則會是全球一同走向極端氣候的未來,全球都要面對更高的自然災害重建成本、企業營運要面對各類氣候風險。
多人囚徒困境有一個非常經典的實驗:德州 A&M 大學經濟學教授 Raymond Battalio 曾針對班上 27 名學生進行一個實驗:學生可以選擇寫 1 或 2,當 27 位學生所有人都寫 1 的時候,所有人獲得 1.08 美元;當所有人都寫 2 的時候,所有人獲得 0.50 美元;但是當一部分人寫 1,一部分人寫 2,寫 2 的人會比寫 1 的人多獲得 0.50 美元。
也就是說,選擇 1 是利他策略,選擇 2 是自私策略,可以比其他人多賺一些錢。但如果所有人都選擇 2 的話,最後所有人會一起虧錢。
那麼, 27 位學生裡,有幾位學生選擇了 1 ?
在不開放集體討論的情況下,這些學生重複玩了幾次賽局,結果選擇 1 的學生最多有達到 14 位,大約是學生總人數的一半。
而後來,教授允許學生在選擇前進行集體討論,那麼,現在會變成幾位選擇 1 呢?
答案是 4 位!竟然比不進行討論的情況下更少。
在學生團體中帶頭公開倡議所有人選擇 1 的學生表示,他從此再也不相信任何人了。
可是你問他選擇了哪個?「喔,我選了 2。」
這個實驗深刻地反映了人性的矛盾:即便所有人都知道只有利他才能達到集體共榮,仍然有多數人會選擇自利。而更甚地,集體討論、開放協議等作法,竟然毫無任何幫助。這紮實地可以被稱為「困境」。
作為地球生物圈、龐大的全球產業供應鏈的一員,我們都處在這個被稱為「淨零」的多人囚徒困境之中,我們每天都必須選擇 1 或 2,只是這賽局規模之大,讓我們每天忘記了自己正在賽局裡頭,如同魚不知水的存在一樣。
社會懲罰是一種生物性行為
然而,這個實驗可以給我們一些啟發。
Battalio 教授後來又開放了一個選項,學生們可以針對社會欺騙者(選 2 的人)進行懲罰,讓他們把多拿的錢吐出來,但是代價是,選擇進行懲罰的人自己也必須付出部分收益。
結果呢?超過半數的人都針對欺騙者進行了懲罰,而在接下來的幾輪內就沒有什麼人選二了。
但是,從賽局來看,這是難以想像的!選擇進行懲罰的人,等於是在用自己的利益,換取集體的利益,這在賽局裡是一種利他(劣勢)策略!
自認為理性的賽局參與者,怎麼會做出這種事情?
後續有科學家用正子斷層掃描去看這些正在進行懲罰的大腦,他們在感受到快樂的腦區是活化的。這意味著,給社會欺騙者進行懲罰會帶來大腦自我獎賞,因此懲罰很可能是人類生物演化的一種機制。
這個發現,給了我們思考淨零賽局一些很有意思的啟發。
如何避免公共財悲劇
印第安納大學政治科學教授 Elinor Ostrom (governing the commons, coping with tragedies of commons)研究總結出,公共財悲劇是多人囚徒困境的結果,但我們並不是完全束手無策,有許多設定遊戲規則的原則,可以避免這個悲劇。
1. 清晰界定誰是賽局參與者
不論是地域、種族、國籍...只要是擁有資源使用權的人就是潛在參與者,必須被清晰的界定。若以全球政治版圖來看,最主要的參與者就是聯合國 COP 大會的 192 成員國;但若以經濟體系來看,任何一間企業,只要是使用地球生產的資源(電力即是),皆是這場賽局的參與者。
2. 清楚界定允許和禁止的行為
例如休耕年份、捕撈界線、技術(漁網大小)、資源配額(如伐木木材量)等。在淨零賽局目標是建構一個永續的社會,問題並不只是「減少二氧化碳」這樣簡單,還包括了生物多樣性、社會正義、基本人權等眾多問題。一大挑戰即是監管機關是否能夠清晰界定哪些行為應該被鼓勵,哪些則應該被禁止。
聯合國 17 項永續發展目標(SDGs)可以說是在這一個原則上踏出了第一步。而後續如何重新設計市場制度,例如碳權市場、循環經濟以實質誘因鼓勵永續轉型,是我們必須努力面對的。
3. 懲罰必須清楚明確且充分告知
多人囚徒困境的經典實驗告訴我們,懲罰是一個有效遏止社會欺騙的方法,即便執行懲罰需要付出成本。懲罰類型可以是警告、社會排擠、罰款、剝奪權利甚至監禁等。第一次疑似欺騙行為應該先面談,並處以輕判,後續累犯才加重。
目前永續進程成熟的地區如歐盟、美國已經對於無法服膺減碳進展、在溫室氣體盤查報告造假的企業立法訂定相關罰金。然而其他地區,例如台灣,仍未有相關罰則出現。2023 年初氣候法已經通過,環保署預計在今年年中會頒布執行細項。
4. 有效偵查機制
要有效執行懲罰的前提,是必須能讓社會欺騙者的行為透明可見。原則上,最好的方法是自動偵查機制,例如「買貴退差價」的銷售策略,即是讓精明消費者去偵查其他削價競爭的店家並且自動降價競爭,藉此懲罰削價的競業。
在這點上,科技就扮演極為重要的角色。目前衛星影像偵查地區碳排放的技術已經出現,且已有一些碳抵銷評估公司採用無人機搭載雷達分析儀,用以評估森林實際固碳量。
5. 「由下而上」的分散式管理
Elinor Ostrom 的研究顯示,集中式的、由上而下的管理模式效率極低,且通常最後仍然導致公共財悲劇。而在淨零賽局中,聯合國 COP 氣候變遷大會最為人詬病的就是缺乏強制力,許多國家無法兌現自己設下的承諾,甚至被環團說成是「北半球漂綠派對」。
要達成永續社會的目標,我們需要的是由下而上達成監督與分散式管理的遊戲規則,一個清晰明確、可信、可以即時辨認社會欺騙者的共信機制。
但我們也必須接受這樣的現實:囚徒困境永遠不會消失,公共財悲劇不能完全被克服,即便在最佳情境裡。監督和制裁再嚴格,也一定會有偷跑仔。我們只能盡量設計一個有效的管理機制。這也是目前在台灣最需要的共信機制。
當然實際上,要達成永續社會的目標,是多重努力同時匯集而成的,政府需要建立完善監管機制,嘗試建立新的經濟模型例如碳權交易、甚至碳紅利政策等;企業也需要檢視自身碳排並且減量,精實撰寫永續報告書的能力,同時也精進人類科技創新與部屬的能力。我們需要所有可以獲得的方案,才有機會完成這項艱鉅任務。
櫛構科技致力於使用資料科學建造永續企業,協助企業以「數據治理」達成「數據永續」的目標。藉由 AI 演算法結合 GIS 地理圖層資訊系統,我們得以分析企業車隊駕駛行為,提供數據驅動的減碳策略。
除了隨手關燈,我們可以做更多。
參考資料
COPING WITH TRAGEDIES OF THE COMMONS
The Art of Strategy: A Game Theorist's Guide to Success in Business and Life