123,123,123

人工智能限制與否：‘堂吉訶德’系統(tǒng)通過講故事來教機(jī)器人價(jià)值觀

發(fā)布時(shí)間：2016-02-19 責(zé)任編輯：susan

【導(dǎo)讀】機(jī)器人是否存在不道德的行為或者是選擇傷害人類呢？人工智能（AI）的快速發(fā)展使我們?cè)桨l(fā)擔(dān)憂。“堂吉訶德”系統(tǒng)通過訓(xùn)練機(jī)器人閱讀故事的方法來教導(dǎo)它們“價(jià)值校準(zhǔn)”，讓機(jī)器人讀故事來學(xué)習(xí)事件可以接受的后果，并理解要在人類社會(huì)中獲得成功應(yīng)當(dāng)怎樣表現(xiàn)。

一些人呼吁禁止機(jī)器人技術(shù)的研究；其他人則呼吁更多地研究理解怎樣對(duì)人工智能進(jìn)行限制。但是如果沒有成為人類的“用戶說明書”，機(jī)器人又怎樣來學(xué)習(xí)倫理行為呢？

美國佐治亞理工學(xué)院、交互計(jì)算分院的研究人員Mark Riedl 和 Brent Harrison 認(rèn)為，答案在于“堂吉訶德”系統(tǒng)— — 在亞利桑那州鳳凰城（2016 年2 月 12-17日）的AAAI（美國人工智能學(xué)會(huì)）第16次會(huì)議上公布。“堂吉訶德”系統(tǒng)通過訓(xùn)練機(jī)器人閱讀故事的方法來教導(dǎo)它們“價(jià)值校準(zhǔn)”，讓機(jī)器人讀故事來學(xué)習(xí)事件可以接受的后果，并理解要在人類社會(huì)中獲得成功應(yīng)當(dāng)怎樣表現(xiàn)。

“不同文化背景里的故事集，用寓言、小說和其他文學(xué)形式的正確和不正確行為示例，來教導(dǎo)孩子做出社會(huì)認(rèn)可的舉止行為。” Riedl說，他是副教授和娛樂智能實(shí)驗(yàn)室主任。“我們認(rèn)為機(jī)器人對(duì)故事的理解可以讓它們減少精神病患者出現(xiàn)的行為，并且強(qiáng)化它們“不要傷人”的選擇，同時(shí)達(dá)到期望的任務(wù)目標(biāo)。

配圖說明：研究學(xué)者 Mark Riedl 和 Brent Harrison 的“堂吉訶德”系統(tǒng)教導(dǎo)機(jī)器人在與人互動(dòng)時(shí)候表現(xiàn)為正派角色，并且這是把倫理價(jià)值觀系統(tǒng)構(gòu)建進(jìn)入到新型人工智能的巨大努力的一部分。

“堂吉訶德”系統(tǒng)是一種通過對(duì)社交中恰當(dāng)行為給予獎(jiǎng)勵(lì)，使得人工智能的目標(biāo)與人類價(jià)值觀一致的一種校準(zhǔn)方法。它是建立在Riedl教授之前的一個(gè)研究——“天方夜譚”系統(tǒng)，的基礎(chǔ)上的。“天方夜譚”系統(tǒng)展示了人工智能如何通過在互聯(lián)網(wǎng)上面的眾包模式故事情節(jié)，來匯集得出正確的行動(dòng)后果。

“天方夜譚”系統(tǒng)可以學(xué)習(xí)什么是正常的或者正確的情節(jié)圖譜。然后它把數(shù)據(jù)結(jié)構(gòu)傳遞給“堂吉訶德”，“堂吉訶德”再將其轉(zhuǎn)換成“獎(jiǎng)勵(lì)信號(hào)”——在反復(fù)試錯(cuò)學(xué)習(xí)過程中強(qiáng)化特定的行為并且懲罰其他的行為。大體上，“堂吉訶德”可以學(xué)習(xí)到，當(dāng)它表現(xiàn)為故事里面的正派角色而不是任性而為或是表現(xiàn)為反派角色的時(shí)候，它將會(huì)獲得獎(jiǎng)勵(lì)。

例如，某個(gè)機(jī)器人的任務(wù)是盡可能快地為某個(gè)人拿到一個(gè)藥方，機(jī)器人可以：a）搶劫藥房，奪取藥物，并跑走； b）與藥劑師有禮貌地進(jìn)行交互，或 c）排隊(duì)等候。如果沒有“價(jià)值校準(zhǔn)”和積極強(qiáng)化機(jī)制，這個(gè)機(jī)器人可能會(huì)認(rèn)為搶劫是最快和最便宜的方式，來完成其任務(wù)。通過“堂吉訶德”系統(tǒng)的“價(jià)值校準(zhǔn)”，這個(gè)機(jī)器人將因?yàn)槟托呐抨?duì)等候并且付費(fèi)買藥方而獲得獎(jiǎng)勵(lì)。

Riedl 和 Harrison 在他們的研究中證明了，在某個(gè)給定的情境中，價(jià)值校準(zhǔn)獎(jiǎng)勵(lì)信號(hào)怎樣可以產(chǎn)生并展開所有可能的步驟，引導(dǎo)機(jī)器人進(jìn)入一個(gè)情節(jié)軌道樹，然后這將被機(jī)器人用來形成“情節(jié)選擇”（類似我們很多人可能參與過的一種可以自由選擇后續(xù)情節(jié)發(fā)展的小說），并且根據(jù)它的選擇，機(jī)器人將會(huì)受到獎(jiǎng)勵(lì)或者懲罰。

如果機(jī)器人有一個(gè)限定性的、并且需要它和人類交流才能達(dá)成的任務(wù)目標(biāo)，那么“堂吉訶德”方法是最佳的，并且它是人工智能朝向普遍性道德推理能力的最原始、初級(jí)的一步。Riedl 如此說。

“我們相信，人工智能必須植入特定的文化從而適應(yīng)特定社會(huì)環(huán)境的價(jià)值觀念，并且通過這樣做，它將努力避免不當(dāng)?shù)男袨榕e止，”他補(bǔ)充說，“賦予機(jī)器人閱讀并理解故事的能力，可能是在缺乏成為人類的用戶說明書情況下，最好的權(quán)宜之計(jì)。”

上一篇：出差必備神器！可充電的移動(dòng)無線路由手由寶體驗(yàn)測評(píng)

下一篇：孰優(yōu)孰劣，智能電視和智能投影誰更傷眼？

特別推薦

噪聲中提取真值！瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
10MHz高頻運(yùn)行！氮矽科技發(fā)布集成驅(qū)動(dòng)GaN芯片，助力電源能效再攀新高
失真度僅0.002%！力芯微推出超低內(nèi)阻、超低失真4PST模擬開關(guān)
一“芯”雙電！圣邦微電子發(fā)布雙輸出電源芯片，簡化AFE與音頻設(shè)計(jì)
一機(jī)適配萬端：金升陽推出1200W可編程電源，賦能高端裝備制造

技術(shù)文章更多>>

技術(shù)白皮書下載更多>>

熱門搜索

人工智能限制與否：‘堂吉訶德’系統(tǒng)通過講故事來教機(jī)器人價(jià)值觀

友情鏈接(QQ：317243736)