您的位置: 首頁(yè) > 新聞 > 單機(jī)資訊 > 新聞詳情

AI有了好奇心會(huì)怎樣?一整天對(duì)著電視打《超級(jí)瑪麗》

時(shí)間:2018-08-24 10:13:44
  • 來(lái)源:3DM編譯
  • 作者:Sophie周
  • 編輯:Sophie

大多數(shù)人工智能都被用來(lái)翻譯,標(biāo)記照片以及優(yōu)化導(dǎo)航路線,依賴(lài)人類(lèi)自己向AI提供一些信息。但是一些人工智能研究人員正在探索如何給算法賦予好奇心,可以在沒(méi)有人為指導(dǎo)的情況下學(xué)習(xí)。

來(lái)自加州大學(xué)伯克利分校和愛(ài)丁堡大學(xué)的研究人員,由Elon Musk,Sam Altman和其他硅谷大佬創(chuàng)建的非營(yíng)利性AI實(shí)驗(yàn)室OpenAI的新研究發(fā)現(xiàn),當(dāng)AI算法被賦予一個(gè)對(duì)好奇心的簡(jiǎn)單定義時(shí),它可以在沒(méi)有任何人為信息輸入的情況下自動(dòng)探索50多個(gè)視頻游戲 - 甚至可以破關(guān)。

但好奇心隨之伴隨著成本。研究人員還發(fā)現(xiàn),由于人工智能會(huì)因看到新事物而獲得獎(jiǎng)勵(lì),有時(shí)它會(huì)故意作死,就為了看到“游戲結(jié)束”的屏幕,或者被遙控器分心胡亂換臺(tái)。

OpenAI團(tuán)隊(duì)用于人工好奇心的定義相對(duì)簡(jiǎn)單:該算法將嘗試預(yù)測(cè)其環(huán)境在未來(lái)一瞬看起來(lái)會(huì)是什么樣子。當(dāng)下一幀發(fā)生時(shí),算法會(huì)因預(yù)測(cè)錯(cuò)誤而得到獎(jiǎng)勵(lì)。這一想法是基于如果算法可以預(yù)測(cè)環(huán)境中會(huì)發(fā)生什么,那么這代表它之前就已經(jīng)看過(guò)這些內(nèi)容了。

這就是為什么AI如此擅長(zhǎng)《超級(jí)馬里奧》這樣的游戲 - 游戲的基礎(chǔ)是探索并進(jìn)入下一關(guān)。

這項(xiàng)研究的重點(diǎn)不僅僅是用AI破關(guān)視頻游戲,還要了解算法如何更好地解釋周?chē)氖澜?,這也代表未來(lái)可以用AI來(lái)簡(jiǎn)化調(diào)試代碼,或試玩視頻游戲發(fā)現(xiàn)bug。

0

玩家點(diǎn)評(píng) 0人參與,0條評(píng)論)

收藏
違法和不良信息舉報(bào)
分享:

熱門(mén)評(píng)論

全部評(píng)論

他們都在說(shuō) 再看看
3DM自運(yùn)營(yíng)游戲推薦 更多+