Za 4 hodiny umelá inteligencia Google zvládla všetky šachové znalosti v histórii

(Originálny Zeferli/Shutterstock)

Šach nie je podľa ľudských štandardov jednoduchá hra. Ale pre umela inteligencia poháňaný impozantným, takmer mimozemským myslením, triviálne rozptýlenie sa dá zvládnuť za pár voľných hodín.

V novom dokumente výskumníci spoločnosti Google podrobne opisujú, ako sa vyvinul ich najnovší vývoj AI, AlphaZero 'nadľudský výkon' v šachu, pričom mu zaberie len štyri hodiny, kým sa naučí pravidlá, kým zničí program majstrov sveta v šachu Stockfish.

Inými slovami, všetky šachové znalosti ľudstva – a ešte viac – boli absorbované a prekonané AI za približne tak dlho, ako trvá cesta z New Yorku do Washingtonu, DC.



Po naprogramovaní iba podľa pravidiel šachu (bez stratégií) AlphaZero za štyri hodiny ovládol hru do tej miery, do akej bol schopný najlepšie. najvyššie hodnotené program na hranie šachu Stockfish .

V sérii 100 hier proti Stockfish, AlphaZero vyhral 25 hier, zatiaľ čo hral ako biely (s výhodou prvého ťahúňa) a zdvihol tri hry, keď hral ako čierny. Zvyšok súťaží boli remízy, pričom Stockfish nezaznamenal žiadne výhry a AlphaZero žiadne prehry.

'Teraz vieme, kto je náš nový vládca,' povedal šachový výskumník David Kramaley, generálny riaditeľ webovej stránky šachovej vedy Chessable.

„Bezpochyby to spôsobí revolúciu v hre, ale zamyslite sa nad tým, ako by sa to dalo uplatniť mimo šachu. Tento algoritmus by mohol riadiť mestá, kontinenty, vesmíry.“

AlphaZero, vyvinutý laboratóriom DeepMind AI spoločnosti Google, je vylepšená, všeobecnejšia verziaAlphaGo Zero, ktorá sa špecializuje na hranie čínskej stolovej hry Go.

DeepMind bolzdokonaľovanie tejto AI roky, v procese besting aséria ľudských šampiónovktorí padli ako domino pred neodbytným,„Božská“ neurónová sieť.

Táto víťazná séria vyvrcholila aprekvapivý úspechv októbri, v ktorom nová plne autonómna verzia AI – ktorá sa učí iba hraním samej seba, nikdy nečelí ľuďom – porazila všetky svoje predchádzajúce inkarnácie.

Naproti tomu predchodcovia AlphaGo Zero sa čiastočne naučili hrať hru sledovaním pohybov ľudských hráčov.

Cieľom tohto úsilia bolo pomôcť začínajúcej AI pri stratégii učenia, ale zdá sa, že to môže byť v skutočnosti hendikep, pretože sa ukázalo, že učenie AlphaGo Zero je plne sebestačné.zničujúco účinnejšiev súťaži jeden na jedného.

'Je to ako mimozemská civilizácia, ktorá vynájde svoju vlastnú matematiku,' povedal počítačový vedec Nick Hynes z MIT. Gizmodo v októbri.

„To, čo tu vidíme, je model bez ľudskej zaujatosti a predpokladov. Môže sa naučiť čokoľvek, čo uzná za optimálne, čo môže byť skutočne jemnejšie ako naše vlastné predstavy o tom istom.“

Ale veci sa v tejto oblasti pohybujú tak rýchlo, že už októbrový úspech môže byť zastaraný.

V ich novom papier , tím načrtáva, ako najnovšia AI AlphaZero využíva samohranie – nazývané posilňovacie učenie – a aplikuje ho v oveľa všeobecnejšom slede, ktorý mu dáva širšie zameranie na riešenie problémov.

Toto širšie zameranie znamená, že AlphaZero nehrá len šach. Hrá tiež Shogi (aka japonský šach) a Go – a možno nie je prekvapením, že zvládnutie týchto hier trvalo iba dve a osem hodín.

Spoločnosť Google a počítačoví vedci z DeepMind zatiaľ verejne nekomentujú nový výskum, ktorý ešte nebol recenzovaný.

Ale z toho, čo zatiaľ vieme povedať, závratný vzostup tohto algoritmu na vrchol umelej inteligencie nie je ani zďaleka u konca a dokonca aj šachoví veľmajstri sú zmätení predstavou, ktorá sa pred nimi nachádza.

„Vždy som rozmýšľal, aké by to bolo, keby na Zemi pristál nadradený druh a ukázal nám, ako hrajú šach,“ veľmajster Peter Heine Nielsen povedal BBC .

'Teraz už viem.'

Zistenia sú dostupné na webovej stránke preprint arXiv .

O Nás

Publikácia Nezávislých, Osvedčených Skutočností O Správach O Zdraví, Priestore, Prírode, Technológii A Životnom Prostredí.