導(dǎo) 近日,來自O(shè)penAI開發(fā)的人工智能bot擊敗《DOTA2》頂級選手Dendi,引起電競?cè)幦淮蟛ā? Dota2 是一款由玩家操作單一游戲角色,進(jìn)行多人對戰(zhàn)的競技游戲。Open AI 嘗試把游戲...

近日,來自O(shè)penAI開發(fā)的人工智能bot擊敗《DOTA2》頂級選手Dendi,引起電競圈軒然大波。

為了擊敗DOTA2職業(yè)選手,這個AI“自我學(xué)習(xí)”了兩周

Dota2 是一款由玩家操作單一游戲角色,進(jìn)行多人對戰(zhàn)的競技游戲。Open AI 嘗試把游戲規(guī)則教會給人工智能,之后開始讓它不斷和自己對戰(zhàn)來提高水平。

Open AI 的開發(fā)工程師 Jakub Pachocki 介紹說:” Dota 2 的人工智能最開始只會在地圖上亂跑,莫名地死于敵人攻擊后,它開始學(xué)會哪些行為是錯誤的,逐漸地它開始學(xué)會補兵,攻擊對面英雄,訓(xùn)練過程中其實沒有突然的大突破,就是一點點地升級?;镜膶W(xué)會以后就也逐漸學(xué)會比較復(fù)雜的操作了?!?/p>

Open AI 的網(wǎng)站介紹了人工智能如何通過自我訓(xùn)練來掌握敵人出現(xiàn)后可能會做出的操作數(shù)據(jù),并作出最正確的應(yīng)對。OpenAI 的 CTO Greg Brockman 解釋說,Dota2 的人工智能從零開始,訓(xùn)練了一個小時以后就已經(jīng)可以打過內(nèi)置的 AI 了,連續(xù)訓(xùn)練了 2 個星期的時間后就達(dá)到戰(zhàn)勝職業(yè)玩家的水平。

為了擊敗DOTA2職業(yè)選手,這個AI“自我學(xué)習(xí)”了兩周

令人驚訝地是,在 Open AI 的內(nèi)部測試中,人工智能已經(jīng)完全戰(zhàn)勝了世界知名Dota2 選手 SumaiL 和 Arteezy 等人。

鑰匙體育館內(nèi)的比賽也和之前內(nèi)部測試的結(jié)果一樣,Dendi 在第一局比賽中以 2:0 告負(fù),而第二局比賽開始僅短短十分鐘之后,Dendi 就選擇了直接認(rèn)輸,此時AI的實力相比第一局已經(jīng)更上一個層次,而在此期間并沒有程序員為AI添加代碼,這就是自我學(xué)習(xí)。

比賽中AI正在卡兵:

為了擊敗DOTA2職業(yè)選手,這個AI“自我學(xué)習(xí)”了兩周

在此之前的游戲 AI 大多建立在由策劃設(shè)計的游戲腳本上,AI 的行為完全由腳本觸發(fā)執(zhí)行,它的智能程度取決于游戲策劃考慮的細(xì)致程度,所以和游戲 AI 會在比賽中出現(xiàn)固定的行動模式和大量模仿玩家策略的戰(zhàn)術(shù)表現(xiàn)。

但 Open AI 的人工智能帶來了新的體驗。它并不是通過腳本行動,也沒有使用模仿學(xué)習(xí)或者數(shù)據(jù)搜索,而是從頭記錄 Dota2 的規(guī)則,通過和自我對戰(zhàn)來了解每一種行動會產(chǎn)生什么后果,從而預(yù)測其他玩家下一步可能的操作,做到了在復(fù)雜環(huán)境下的隨機應(yīng)變。而僅僅訓(xùn)練 2 個星期就打敗 Dendi的 Dota2 人工智能,也計劃用長達(dá) 1 年的時間來實現(xiàn)可以和人類進(jìn)行團體對戰(zhàn)的功能。