Encyklopedie

Programátorská encyklopedie KSP

Aktuálně

KSP-H	1. série se opravuje, 2. sérii odevzdávejte do 21. 12. 2025
KSP-Z	1. série opravena, 2. sérii odevzdávejte do 30. 11. 2025

Nepřihlášen: Přihlásit|Registrovat

Záznam přednášky - AlphaZero a AI pro hry s velkým stavovým prostorem

Akce:	Krutá Smršť Přednášek 2023 (záznamy z akce)
Přednášející:	Pasky
Anotace:	Desková hra Go je zajímavá z mnoha úhlů. Je to jedna z nejstarších her na světě, vyniká matematicky svůdnou estetikou, inspirovala kombinatorickou teorii her a tradičně sloužila jako příklad problému, ve kterém ještě před 10 lety lidská mysl a intuice o řád převyšovala výpočetní sílu počítačů. Na začátku roku 2014 velká většina výzkumníků počítačového Go předpokládala, že překonání lidských mistrů je dekády před námi. Na začátku roku 2016 AlphaGo od DeepMindu porazil nejlepšího goistu světa Lee Sedola. Krátce vysvětlíme pravidla Go a povíme si, proč bylo Go pro počítače tak těžké ve srovnání např. s šachy. Popíšeme klíčový herní algoritmus MCTS, od základů Monte Carlo metody přes exploration-exploitation dilema v optimalizačních problémech až po aplikaci v minimaxových herních stromech. Pak se podíváme na to, jakou roli v tom všem hrají hluboké neuronové sítě a v čem spočívá klíčová myšlenka AlphaGo a AlphaZero. Na závěr se zamyslíme, jak robustní ta "AI silnější než lidi" doopravdy je, a jestli nám to něco říká třeba o robustnosti velkých jazykových modelů. Přednášející je autorem historického Go programu Pachi, který sloužil v Nature publikacích DeepMindu jako hlavní referenční baseline pro prezentaci výsledků AlphaGo.
Externí odkazy:	YouTube
Ke stažení:	Video (MP4/H.264) a Audio (Ogg/Opus)
Další materiály:

Audio

Video