AI已經(jīng)學(xué)會(huì)和人類談判了你能說服人類聽它嗎
字寫得太好了,人類根本看不出來是AI。
這是Meta AI—AI模型西塞羅的最新成果,已經(jīng)發(fā)表在《科學(xué)》雜志上。
嗯,和古羅馬著名政治家,演說家西塞羅同名。
研究人員讓這個(gè)AI西塞羅隱藏身份,加入一場(chǎng)外交游戲在40場(chǎng)比賽中,82名人類玩家從未懷疑過它其實(shí)是一個(gè)AI
而且戰(zhàn)績(jī)可圈可點(diǎn),全程平均分25.8%,是人類選手平均分的兩倍,最終排名前10%。
結(jié)果一經(jīng)發(fā)布,便在網(wǎng)上引起熱議。
有人評(píng)論:這意味著AI在最像人類的游戲中打敗了人類,超乎想象…
樂存稱之為:里程碑式的研究!
目前模型代碼已經(jīng)在GitHub上開源。
我真的覺得自己是個(gè)AI戰(zhàn)略家。
其實(shí)AI chatter一直都是被詬病的,更何況外交這種對(duì)語言能力要求超高的場(chǎng)景。
它需要理解對(duì)方的語言,動(dòng)機(jī),制定自己的修辭策略,調(diào)整措辭。
有時(shí)候甚至需要玩心眼,故意說一些謊話,給對(duì)方設(shè)個(gè)圈套。
如何挑戰(zhàn)這種超高難度的任務(wù)。
俗話說,一口吃不胖。
Meta AI想到了從游戲場(chǎng)景入手。
但外交博弈不同于以往的棋局或競(jìng)技游戲,沒有那么規(guī)律,有很多運(yùn)籌帷幄,隨機(jī)應(yīng)變的環(huán)節(jié)。
實(shí)驗(yàn)中使用的游戲是網(wǎng)絡(luò)外交。
這個(gè)游戲的背景是1901年的歐洲七個(gè)玩家各自控制一個(gè)大國,通過相互合作協(xié)商,盡可能多的占領(lǐng)領(lǐng)土
西塞羅的核心是由對(duì)話引擎和戰(zhàn)略推理引擎驅(qū)動(dòng)的。
簡(jiǎn)單,這里的對(duì)話引擎類似于GPT—3和LaMDA,策略推理引擎類似于AlphaGo。
所使用的對(duì)話模型是從具有2.7億個(gè)參數(shù)的BART模型中訓(xùn)練出來的。
巴特吸收了GPT和伯特各自的特點(diǎn)比BERT更適合文本生成的場(chǎng)景,可以雙向理解上下文信息
具體來說,研究人員先從網(wǎng)上獲取文本訓(xùn)練對(duì)話模型,然后在實(shí)際的外交游戲場(chǎng)景中進(jìn)行微調(diào)。
戰(zhàn)略推理引擎使用計(jì)劃算法。
該算法可以根據(jù)當(dāng)前情況計(jì)算出最佳選擇然后通過加強(qiáng)學(xué)習(xí)訓(xùn)練,懲罰模型做出的不像人的策略,讓模型給出的策略更加合理
畢竟在外交游戲中與人打交道是讓AI更加人性化的最基本要求之一。
而且強(qiáng)化學(xué)習(xí)的迭代訓(xùn)練可以不斷提高AI做出的戰(zhàn)略預(yù)測(cè)監(jiān)督學(xué)習(xí)的效果優(yōu)于傳統(tǒng)方法
在實(shí)際操作中,西塞羅會(huì)先根據(jù)目前為止的游戲狀態(tài)和對(duì)話,對(duì)每個(gè)人的行動(dòng)進(jìn)行初步預(yù)測(cè)。
接下來,在不斷協(xié)商的過程中,它會(huì)不斷完善自己的預(yù)測(cè),然后利用這些預(yù)測(cè)為自己和合作伙伴設(shè)定一個(gè)共同的目標(biāo)。
其次,它會(huì)根據(jù)情境狀態(tài),對(duì)話及其目標(biāo),從對(duì)話模型中生成若干候選消息,利用分類器等過濾機(jī)制過濾掉無意義的消息,生成最終的高質(zhì)量輸出文本。
當(dāng)球員意大利問它是否應(yīng)該進(jìn)攻土耳其時(shí),西塞羅會(huì)根據(jù)場(chǎng)上的情況判斷這是從兩面夾擊俄羅斯的好機(jī)會(huì),然后說服意大利跟進(jìn)進(jìn)攻土耳其。
這一步不僅與意大利建立了合作伙伴關(guān)系,還消除了一個(gè)潛在的競(jìng)爭(zhēng)對(duì)手。
而且,談判是西塞羅的專長。
西塞羅這次扮演的是德國,之前和玩家法國交戰(zhàn)過此時(shí)法國南部同時(shí)遭到意大利的攻擊,于是他找西塞羅和談
西塞羅利用獅子的大嘴,要求法國歸還侵占的領(lǐng)土,并承諾不再進(jìn)攻荷蘭雙方在討價(jià)還價(jià)中成功地達(dá)成了協(xié)議
就像上面的例子,西塞羅在兩個(gè)月的時(shí)間里參加了40場(chǎng)外交比賽,與82名人類選手進(jìn)行了對(duì)抗。
西塞羅在每場(chǎng)比賽中平均收發(fā)130條信息。
它的游戲水平甚至優(yōu)于人類:平均分是人類玩家的兩倍以上,甚至玩過一局以上的參與者都能排進(jìn)前10%。
網(wǎng)友:雖然表現(xiàn)不錯(cuò),但是我很害怕。
看了西塞羅在外交上的精彩表現(xiàn),有網(wǎng)友感受到了AI的發(fā)展速度:
Deep打敗了卡斯帕羅夫,Watson在競(jìng)猜中打敗了兩個(gè)人類冠軍,現(xiàn)在輪到Meta AI敲馬基雅維利的門了。
還有人說,這是邁向通用語言大模型的第一步嗎。
樂村給出了肯定的答復(fù):
至少語言是有事實(shí)依據(jù)的。
可是,由于這場(chǎng)外交游戲以作弊聞名,許多人也對(duì)此感到擔(dān)憂:
這是直接鼓勵(lì)科研人員開發(fā)更多善于作弊的模型。
有網(wǎng)友表示,玩這個(gè)游戲甚至?xí)ヅ笥选?/p>
從AI西塞羅的戰(zhàn)績(jī)來看,它可以迷惑人類玩家,說服人類跟隨它的策略。
所以有人說這不是AI在控制人類的選擇甚至生命嗎。
不過Meta AI說AI西塞羅也不是沒有錯(cuò)誤。
而且游戲中還有很多環(huán)節(jié)需要人類配合西塞羅的表現(xiàn)也很好
目前只在游戲場(chǎng)景中測(cè)試過,還沒有嘗試過在開放的背景下與人類談判。
參考鏈接:
。聲明:本網(wǎng)轉(zhuǎn)發(fā)此文章,旨在為讀者提供更多信息資訊,所涉內(nèi)容不構(gòu)成投資、消費(fèi)建議。文章事實(shí)如有疑問,請(qǐng)與有關(guān)方核實(shí),文章觀點(diǎn)非本網(wǎng)觀點(diǎn),僅供讀者參考。
相關(guān)新聞
- 浙商證券給予中國中免買入評(píng)級(jí)關(guān)注利潤率改善22H
- 國星光電與華為聯(lián)合創(chuàng)新中心掛牌成立
- 榮耀Earbuds3i耳機(jī)發(fā)布:10mm動(dòng)圈、3
- RTX4080真實(shí)銷量低迷:囤貨黃牛相當(dāng)絕望
- 首批7款個(gè)人養(yǎng)老金保險(xiǎn)產(chǎn)品名單出爐
- 消息稱三星顯示為蘋果iPhone14/Pro系列
- 比亞迪新能源動(dòng)力電池生產(chǎn)基地項(xiàng)目落戶溫州,預(yù)計(jì)2
- 藍(lán)寶石預(yù)熱新款A(yù)MDRX7900顯卡:造型簡(jiǎn)約,
- 隕石撞擊到火星表面,研究火星內(nèi)部的科學(xué)家卻忙起來
- 債券基金止跌回穩(wěn)基金認(rèn)為債券配置價(jià)值已經(jīng)開始凸顯
- 大號(hào)GalaxyZFold4,三星獲批一項(xiàng)可折
- 餐飲觀察:牛蛙市場(chǎng)發(fā)展前景廣闊,蛙來噠將發(fā)揮更
- 庫迪咖啡同日成立2家新公司陸正耀庫迪咖啡接連成
- 《命運(yùn)2》社區(qū)任務(wù)出現(xiàn)BUG,玩家可不斷刷任務(wù)
- 紅杉資本DougLeone:當(dāng)前衰退將比200
- 東方空間發(fā)布引力-1號(hào)發(fā)射服務(wù)計(jì)劃:2024-
- 三大指數(shù)震蕩整理,資金搶籌永太科技
- 鐵路等部門多措并舉保障暑運(yùn)出行
- 致力推動(dòng)低碳綠色消費(fèi)“歐萊雅健康低碳專項(xiàng)基金”
- 放下組件,發(fā)力逆變器,正泰電器能否在光伏板塊站
- 開啟“氫”時(shí)代!冬奧遺產(chǎn)助推北京公交綠色出行
- 我國首次獲得太陽硬X射線圖像!“夸父一號(hào)”衛(wèi)星
- 尤崢:以挪威為起點(diǎn) 東風(fēng)公司計(jì)劃2025年網(wǎng)點(diǎn)
- 東方空間發(fā)布引力-1號(hào)發(fā)射服務(wù)計(jì)劃:2024-
- 微軟宣布合并AzureVirtualDeskt
- 美國最新數(shù)據(jù)顯示:73%的雇主承認(rèn)正在利用軟件
- 你有能力,我有平臺(tái)——境外投資專場(chǎng)來了!
- 專業(yè)論壇齊齊來襲,大咖云集,只等你來!
- 高通第三財(cái)季營收109億美元:凈利潤同比增長8
- 戶外+金融,打開全新觀展模式