Záznam přednášky - AlphaZero a AI pro hry s velkým stavovým prostorem
Akce: | Krutá Smršť Přednášek 2023 (záznamy z akce) |
---|---|
Přednášející: | Pasky |
Anotace: | Desková hra Go je zajímavá z mnoha úhlů. Je to jedna z nejstarších her na
světě, vyniká matematicky svůdnou estetikou, inspirovala kombinatorickou
teorii her a tradičně sloužila jako příklad problému, ve kterém ještě před 10
lety lidská mysl a intuice o řád převyšovala výpočetní sílu počítačů.
Na začátku roku 2014 velká většina výzkumníků počítačového Go předpokládala,
že překonání lidských mistrů je dekády před námi. Na začátku roku 2016 AlphaGo
od DeepMindu porazil nejlepšího goistu světa Lee Sedola. Krátce vysvětlíme pravidla Go a povíme si, proč bylo Go pro počítače tak těžké ve srovnání např. s šachy. Popíšeme klíčový herní algoritmus MCTS, od základů Monte Carlo metody přes exploration-exploitation dilema v optimalizačních problémech až po aplikaci v minimaxových herních stromech. Pak se podíváme na to, jakou roli v tom všem hrají hluboké neuronové sítě a v čem spočívá klíčová myšlenka AlphaGo a AlphaZero. Na závěr se zamyslíme, jak robustní ta "AI silnější než lidi" doopravdy je, a jestli nám to něco říká třeba o robustnosti velkých jazykových modelů. Přednášející je autorem historického Go programu Pachi, který sloužil v Nature publikacích DeepMindu jako hlavní referenční baseline pro prezentaci výsledků AlphaGo. |
Externí odkazy: | YouTube |
Ke stažení: | Video (MP4/H.264) a Audio (Ogg/Opus) |