最新AI:無需被告知規(guī)則就能自己玩轉(zhuǎn)游戲?
2016年,Alphabet的DeepMind與AlphaGo一起問世,該AI一直領(lǐng)先于人類最好的棋手。一年后,工作繼續(xù)完善,AlphaGo Zero創(chuàng)建。AlphaGo通過觀察業(yè)余比賽和專業(yè)比賽學(xué)會了圍棋,而AlphaGo Zero能通過簡單地與自己對戰(zhàn)來掌握游戲。然后,DeepMind創(chuàng)建了AlphaZero,該AlphaZero可以使用單一算法玩圍棋、國際象棋和將棋。這些AI的共同特點是,它
原創(chuàng)
2020-12-25 08:00:24
來源:釘科技??

2016年,Alphabet的DeepMind與AlphaGo一起問世,該AI一直領(lǐng)先于人類最好的棋手。一年后,工作繼續(xù)完善,AlphaGo Zero創(chuàng)建。AlphaGo通過觀察業(yè)余比賽和專業(yè)比賽學(xué)會了圍棋,而AlphaGo Zero能通過簡單地與自己對戰(zhàn)來掌握游戲。然后,DeepMind創(chuàng)建了AlphaZero,該AlphaZero可以使用單一算法玩圍棋、國際象棋和將棋。

image.png

這些AI的共同特點是,它們必須掌握游戲規(guī)則然后再進行培訓(xùn)。DeepMind的最新AI MuZero不需要游戲的規(guī)則即可掌握游戲。與DeepMind之前的AI算法一樣,MuZero具有相同甚至更好的能力。  

MuZero沒有嘗試對所有模型進行建模,而只是嘗試考慮那些對決策至關(guān)重要的因素。正如DeepMind所指出的,這是作為人類所做的事情。當(dāng)大多數(shù)人看著窗外,看到地平線上形成烏云時,他們通常不會陷入烏云是如何形成之類的問題。相反,它們思考的是如果出門應(yīng)該穿什么以防止被淋濕。MuZero就是做類似這樣的事情。

MuZero在做決定時會考慮三件事。首先,它會考慮上一次行動的結(jié)果、當(dāng)前所處的位置以及下一次行動的最佳方案。這種看似簡單的方法使MuZero成為迄今為止DeepMind最有效的算法。在測試中DeepMind發(fā)現(xiàn),MuZero與之前的AI算法表現(xiàn)都一樣好。而且,給它的時間越多,它提供的解決方案就越好。即使加入了時間限制,比如在行動前限制吃豆人女士的模擬次數(shù),MuZero也取得了不錯的效果。

該公司表示,MuZero的學(xué)習(xí)能力有一天可以幫助解決沒有簡單規(guī)則領(lǐng)域的復(fù)雜問題。(釘科技根據(jù)《engadget》消息編譯)

最新文章
1
Vidda三色激光投影618開門紅戰(zhàn)報:C3 Ultra/Pro包攬高端投影銷冠
2
云米發(fā)布昆侖4礦泉凈水器,讓家庭飲水進入礦泉時代
3
女廚神開啟涅槃路,快手星芒短劇《廚神小福星》詮釋美食真諦
4
磁力聚星釋放達人營銷勢能,激活大促生意新增量
5
雙女主攜手復(fù)仇,快手星芒短劇《少女的審判》見證璀璨新生
6
快手磁力引擎“出游裝備節(jié)”引爆五一出行消費,超2.4億曝光助力商家生意增長
7
百商聚首·萬品齊放:第36屆慧聰家電交易會電商新渠道選品會邀您鏈通全渠道
8
移動愛家推出“515移動愛家日”活動,詮釋千萬家的愛家智慧
9
蘋果正在開發(fā)新的“HomePad”,具備以下五個功能
10
雷軍最新發(fā)聲:小米自研手機系統(tǒng)級芯片即將發(fā)布
11
壁掛爐市場降幅收窄,存量爭奪戰(zhàn)將去向何方?
12
電視行業(yè)大尺寸化的趨勢下,智能投影將迎來發(fā)展機遇
13
“以舊換新”首次深度綁定618,家電行業(yè)熱增長與冷思考
14
創(chuàng)維A6F Pro解決了影音發(fā)燒友哪些痛點?
15
小米Civi 5 Pro內(nèi)部代號小15 盧偉冰:全面對標(biāo)iPhone
16
雷軍最新內(nèi)部演講全文曝光:小米要成為同檔最安全的車 要做行業(yè)的領(lǐng)導(dǎo)者
17
榮耀400系列代言人官宣:就是肖戰(zhàn)
18
出貨量從“國內(nèi)第一”到“跌出前五”,榮耀手機亟待“重生”
19
中國移動“三大回饋計劃”暨515移動愛家日重磅發(fā)布
20
磁力方舟推出618全周期投放指南,智算精投,高效撬動大促新增量
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512