“人類面臨的許多問題并不僅僅是技術(shù)問題,還需要我們?yōu)榱烁蟮睦嬖谏鐣?huì)和經(jīng)濟(jì)中進(jìn)行協(xié)調(diào)。”“要想人工智能技術(shù)能夠提供幫助,它需要直接學(xué)習(xí)人類的價(jià)值觀。”
(相關(guān)資料圖)
——DeepMind 研究科學(xué)家 Raphael Koster
人工智能(AI),能否推動(dòng)人類社會(huì)進(jìn)入真正的智能化時(shí)代?
盡管經(jīng)過 60 多年的發(fā)展,人工智能行業(yè)已經(jīng)取得了突破性的進(jìn)展,且被廣泛應(yīng)用在經(jīng)濟(jì)社會(huì)的方方面面,但構(gòu)建與人類價(jià)值觀一致的人工智能系統(tǒng),仍然是一個(gè)尚未解決的問題。
如今,一項(xiàng)來自英國(guó)人工智能公司 DeepMind 的最新研究,或許能為人工智能行業(yè)從業(yè)者解決這一問題提供一個(gè)全新的思路。
據(jù)介紹,DeepMind 的人工智能系統(tǒng)在一個(gè) 4 人在線經(jīng)濟(jì)游戲中,通過向 4000 多人學(xué)習(xí)以及在計(jì)算機(jī)模擬中學(xué)習(xí),不僅學(xué)會(huì)了制定如何重新分配公共資金的政策,而且表現(xiàn)十分優(yōu)異,戰(zhàn)勝了其他人類玩家。
該游戲涉及玩家決定是保留一筆貨幣捐贈(zèng),還是與其他人分享,以實(shí)現(xiàn)集體利益。
相關(guān)研究論文以“Human-centred mechanism design with Democratic AI”為題,于 7 月 5 日在線發(fā)表在權(quán)威科學(xué)期刊 Nature Human Behaviour 上。
(來源:Nature Human Behaviour)
英國(guó)約克大學(xué)助理教授安妮特·齊默爾曼(Annette Zimmermann)警告說,“不要把民主狹隘地等同為尋找最受歡迎政策的“偏好滿足”(preference satisfaction)系統(tǒng)?!?/p>
她還表示,民主不僅僅是讓你最喜歡的政策得到最好的執(zhí)行——它是創(chuàng)造一個(gè)過程,公民可以在這個(gè)過程中平等地相互接觸和商議(事情)。
由 AI 設(shè)計(jì)經(jīng)濟(jì)機(jī)制
人工智能研究的最終目標(biāo)是構(gòu)建有益于人類的技術(shù)——從幫助我們完成日常任務(wù)到解決社會(huì)面臨的重大生存挑戰(zhàn)。
如今,機(jī)器學(xué)習(xí)系統(tǒng)已經(jīng)解決了生物醫(yī)學(xué)的主要問題,并幫助人類應(yīng)對(duì)環(huán)境挑戰(zhàn)。然而,人工智能在幫助人類設(shè)計(jì)公平和繁榮社會(huì)方面的應(yīng)用還有待開發(fā)。
在經(jīng)濟(jì)學(xué)和博弈論中,被稱為機(jī)制設(shè)計(jì)的領(lǐng)域研究如何最優(yōu)地控制財(cái)富、信息或權(quán)力在受到激勵(lì)的行為者之間的流動(dòng),以實(shí)現(xiàn)預(yù)期目標(biāo)。
在此工作中,研究團(tuán)隊(duì)試圖證明:深度強(qiáng)化學(xué)習(xí)(RL)代理可以用來設(shè)計(jì)一種經(jīng)濟(jì)機(jī)制,這種經(jīng)濟(jì)機(jī)制能夠得到被激勵(lì)人群的偏好。
在這個(gè)游戲中,玩家一開始擁有不同數(shù)量的錢,必須決定貢獻(xiàn)多少來幫助更好地發(fā)展一個(gè)公共基金池,并最終獲得一部分作為回報(bào),且會(huì)涉及反復(fù)決定是保留一筆貨幣捐贈(zèng),還是與其他玩家分享,以獲得潛在的集體利益。
研究團(tuán)隊(duì)訓(xùn)練了一個(gè)深度強(qiáng)化學(xué)習(xí)代理,來設(shè)計(jì)一個(gè)重新分配機(jī)制,即在財(cái)富平等和不平等的情況下將資金分享給玩家。
共享收益通過兩種不同的再分配機(jī)制返還給玩家,一種是由該人工智能系統(tǒng)設(shè)計(jì)的,另一種是由人類設(shè)計(jì)的。
圖|游戲設(shè)計(jì)(來源:Nature Human Behaviour)
在由人工智能制定的政策中,系統(tǒng)會(huì)根據(jù)每個(gè)玩家貢獻(xiàn)的啟動(dòng)資金數(shù)量重新分配公共資金,以此來減少玩家之間的財(cái)富差距。
相比于“平等主義”方法(不管每個(gè)玩家貢獻(xiàn)多少都平均分配資金)和“自由主義”方法(根據(jù)每個(gè)玩家的貢獻(xiàn)占公共資金的比例分配資金),該政策從人類玩家手上贏得了更多的選票。
同時(shí),該政策也糾正了最初的財(cái)富失衡,制止了玩家的“搭便車”行為,除非玩家貢獻(xiàn)出大約一半的啟動(dòng)資金,否則他們幾乎不會(huì)得到任何回報(bào)。
但是,研究團(tuán)隊(duì)也警告道,他們的研究成果并不代表“人工智能治理”(AI government)的配方(recipe),他們也不打算為政策制定專門構(gòu)建一些由人工智能驅(qū)動(dòng)的工具。
值得信任嗎?
研究結(jié)果表明,通過在激勵(lì)相容的經(jīng)濟(jì)游戲中設(shè)計(jì)一種人類明顯更喜歡的機(jī)制,人工智能系統(tǒng)可以被訓(xùn)練來滿足民主目標(biāo)。
在此次工作中,研究團(tuán)隊(duì)使用人工智能技術(shù)來從頭學(xué)習(xí)重新分配方案,這種方法減輕了人工智能研究人員——他們自己可能有偏見或不代表更廣泛的人群——選擇一個(gè)領(lǐng)域特定目標(biāo)進(jìn)行優(yōu)化的負(fù)擔(dān)。
這一研究工作也提出了幾個(gè)問題,其中一些在理論上具有挑戰(zhàn)性。例如,有人可能會(huì)問,把強(qiáng)調(diào)民主目標(biāo)作為一種價(jià)值校準(zhǔn)的方法是否是個(gè)好主意。該人工智能系統(tǒng)可能繼承了其他民主方法的一種傾向,即“以犧牲少數(shù)人為代價(jià)賦予多數(shù)人權(quán)利”。考慮到人們迫切擔(dān)心人工智能的部署方式可能會(huì)加劇社會(huì)中現(xiàn)有的偏見、歧視或不公平,這一點(diǎn)尤為重要。
(來源:Pixabay)
另一個(gè)懸而未決的問題是,人們是否會(huì)信任人工智能系統(tǒng)設(shè)計(jì)的機(jī)制。如果事先知道裁判的身份,玩家可能會(huì)更喜歡人類裁判而不是人工智能代理裁判。然而,當(dāng)人們認(rèn)為任務(wù)對(duì)人類來說過于復(fù)雜時(shí),他們頁(yè)往往會(huì)選擇信任人工智能系統(tǒng)。
此外,如果是口頭向玩家解釋這些機(jī)制,而不是通過經(jīng)驗(yàn)學(xué)習(xí),他們的反應(yīng)是否會(huì)有所不同。大量文獻(xiàn)表明,當(dāng)機(jī)制是“根據(jù)描述”而不是“根據(jù)經(jīng)驗(yàn)”時(shí),人們的行為有時(shí)會(huì)有所不同,特別是對(duì)于冒險(xiǎn)的選擇。然而,人工智能設(shè)計(jì)的機(jī)制可能并不總是可以用語言表達(dá)的,在這種情況下觀察到的行為似乎可能完全取決于研究團(tuán)隊(duì)所采用的描述的選擇。
在論文的最后,研究團(tuán)隊(duì)還強(qiáng)調(diào),這一研究結(jié)果并表示他們支持某種形式的“人工智能治理”,即自主代理在沒有人工干預(yù)的情況下做出政策決定。
他們希望,該方法的進(jìn)一步開發(fā)將提供有助于以真正符合人類的方式解決現(xiàn)實(shí)世界問題的工具。
參考鏈接:
https://www.nature.com/articles/s41562-022-01383-x
https://www.deepmind.com/publications/human-centred-mechanism-design-with-democratic-ai
https://www.newscientist.com/article/2327107-deepminds-ai-develops-popular-policy-for-distributing-public-money/
標(biāo)簽: 人工智能 人工智能系統(tǒng) 重新分配
凡本網(wǎng)注明“XXX(非現(xiàn)代青年網(wǎng))提供”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和其真實(shí)性負(fù)責(zé)。
將于7月8日全國(guó)上映的電影《神探大戰(zhàn)》日前發(fā)布制作特輯導(dǎo)演篇,將韋家輝打磨演員的大招一一展現(xiàn)。同時(shí)發(fā)布的還有暗藏玄機(jī)版海報(bào),致敬了這
2022-07-04 08:20
近日,電影《侏羅紀(jì)世界3》的導(dǎo)演科林·特萊沃若為感謝全球觀眾的鼎力支持,特別發(fā)布了片中的超級(jí)恐龍,南方巨獸龍的面部特寫照片。在電影
2022-07-04 08:20
近日,《海底小縱隊(duì):洞穴大冒險(xiǎn)》發(fā)布終極預(yù)告,海底小縱隊(duì)全員集結(jié),小朋友們熟悉的巴克隊(duì)長(zhǎng)、皮醫(yī)生、呱唧等角色紛紛搶鏡登場(chǎng),氛圍十分
2022-07-04 08:20
電影《一周的朋友》正在熱映,日前發(fā)布閨蜜相處特別視頻,展現(xiàn)林湘之(趙今麥 飾)和許潔(范詩(shī)然 飾)閨蜜間的親密互動(dòng)。從在琴房的初相遇,
2022-07-04 08:20
由陳思誠(chéng)導(dǎo)演、編劇,黃渤、榮梓杉領(lǐng)銜主演的奇幻合家歡電影《外太空的莫扎特》于近日發(fā)布快樂預(yù)警版預(yù)告,天馬行空,歡笑滿滿。預(yù)告中,望
2022-07-04 08:20
日前,《奇跡·笨小孩》、《四?!贰ⅰ豆哦种芯帧?、《喜羊羊與灰太狼之筐出未來》等四部城市票房過億影片登陸農(nóng)村電影市場(chǎng)。其中《奇跡·
2022-06-28 09:55
疫情再次襲來,許多定檔五一的影片紛紛撤檔,《出拳吧,媽媽》卻逆流而上,定檔4月30日,沒想到遭遇北京全市影院關(guān)停,上海、北京兩大票倉(cāng)
2022-06-28 09:55
青春校園電影《一周的朋友》6月18日全國(guó)上映,影片由林孝謙執(zhí)導(dǎo)、呂安弦編劇,趙今麥、林一領(lǐng)銜主演,沈月特別出演,汪佳輝領(lǐng)銜主演,青春
2022-06-28 09:55
近日,動(dòng)畫電影《新神榜:楊戩》發(fā)布一組逍遙神仙圖,多角度展現(xiàn)楊戩的神顏,和影片古風(fēng)奇幻的氣質(zhì)展現(xiàn)得淋漓盡致,也令人十分好奇這位不問
2022-06-28 09:55
古裝宮廷愛情輕喜劇《我叫劉金鳳》發(fā)布定檔預(yù)告和海報(bào),正式宣布將于6月24日在優(yōu)酷寵愛劇場(chǎng)獨(dú)家播出。該劇改編自戈鞅小說《皇后劉黑胖》,
2022-06-28 09:55
從湯姆·克魯斯(Tom Cruise)到邁克爾·基頓(Michael Keaton),一線明星們都無法抗拒重新塑造他們角色的沖動(dòng)。但懷舊是否足以吸引人們重返
2022-06-20 08:06
上周末,到了北美暑期檔電影的放映高峰期,繼1986年熱門影片《壯志凌云》的續(xù)集連續(xù)兩周蟬聯(lián)第一之后,上周末的北美多廳影院被1993年熱門影
2022-06-20 08:06
上周末,環(huán)球影業(yè)的《侏羅紀(jì)世界3》在57個(gè)國(guó)際市場(chǎng)中上映——在其中52個(gè)市場(chǎng)中排名第一——收獲國(guó)際周末票房1 77億美元,其國(guó)際累計(jì)票房已
2022-06-20 08:06
網(wǎng)絡(luò)電影《目中無人》熱播的勢(shì)頭還在繼續(xù),這部6月3日上線愛奇藝云影院的武俠片,獲得了包括劉偉強(qiáng)、雷軍在內(nèi)眾多網(wǎng)友自發(fā)推薦,已經(jīng)創(chuàng)下了
2022-06-17 09:51
以公安英模張欣為原型,由賀泉執(zhí)導(dǎo),葉碩、周楚濋領(lǐng)銜主演,聶礎(chǔ)一、楊駿、謝宇朦、董浩然主演的懸疑電影《遠(yuǎn)山淡影》將于近期上映。日前,
2022-06-17 09:51
近日, 2022年金雞電影創(chuàng)投大會(huì)未制作項(xiàng)目單元 & WIP制作中項(xiàng)目單元啟動(dòng),有意參與者可以進(jìn)入中國(guó)金雞百花電影節(jié)官網(wǎng)報(bào)名。三年來,金雞
2022-06-17 09:51
自古以來,人類對(duì)外星生命體的探索從未止步。從來都是人類研究外星生物,屏幕前的你可曾想過,人類也會(huì)被外星人反偵察?6月12日,據(jù)今日俄羅
2022-06-15 08:13
塑料的普遍使用,給生態(tài)環(huán)境造成了很大的負(fù)擔(dān)。近日,澳大利亞昆士蘭大學(xué)的科學(xué)家發(fā)表論文稱,他們發(fā)現(xiàn)了一種超級(jí)蠕蟲,專門吃塑料。蠕蟲腸
2022-06-15 08:13
當(dāng)油漆稀釋劑、油墨和粘合劑干燥冷卻,它們就會(huì)釋放揮發(fā)性有機(jī)化合物 (VOC),從而對(duì)人體健康構(gòu)成極大威脅。二甲苯就是揮發(fā)性有機(jī)化合物的
2022-06-15 08:13
即使在睡眠深處,你的大腦也不會(huì)完全將你與周圍的人隔絕開。鼾聲、被子的拉扯聲和肢體的碰撞聲都會(huì)在某種程度上被大腦記錄下來。然而新的研
2022-06-15 08:13
近日,由英國(guó)最出色的化石獵人在懷特島發(fā)現(xiàn)了一只巨大的鱷魚臉恐龍,這可能是有史以來在歐洲活動(dòng)的最大的食肉動(dòng)物。南安普頓大學(xué)的研究人員
2022-06-15 08:13
由袁杰執(zhí)導(dǎo),蘇小妹、羅翔、曾漪蓮、高晨琳等演員傾情聯(lián)袂出演的電影《鏡世界》將于6月10日在全國(guó)公映,新版預(yù)告片首次曝光。此次曝光的預(yù)
2022-06-14 09:40
6月6日,合家歡動(dòng)畫電影《阿里巴巴與神燈》正在全國(guó)熱映中,片方發(fā)布了熱映版海報(bào),為電影助陣。海報(bào)的主角是呆萌可愛的小芝麻和神燈精靈。
2022-06-14 09:40
近日,2022第六屆平遙國(guó)際電影展產(chǎn)業(yè)版塊的平遙創(chuàng)投及發(fā)展中電影計(jì)劃兩大單元項(xiàng)目征集正式開啟。其中,針對(duì)電影劇本項(xiàng)目的平遙創(chuàng)投單元征集
2022-06-14 09:40
近日,2022年春節(jié)檔動(dòng)畫電影《熊出沒·重返地球》在英國(guó)進(jìn)行全球首映,在包括ODEON、CINEWORLD、VUE、SHOWCASE、EMPIRE、REEL CINEMA、THE
2022-06-14 09:40