robogeek.ru

все о роботах и робототехнике

edu.robogeek.ru

все об обучении робототехнике

Искусственный интеллект впервые выиграл в го у профессионального игрока (+ видео)

Программа AlphaGo, разработанная компанией DeepMind, которая является подразделением Google, выиграла в го у трехкратного чемпиона Европы Фань Хуэя в 5 из 5 игр. Это первый случай, когда компьютерная программа смогла победить профессионального игрока в го без форы.

Го - это логическая настольная игра с глубоким стратегическим содержанием, возникшая в древнем Китае более 2,5 тысяч лет назад. В го играют на прямоугольной доске 19х19 линий (гобан) чёрными и белыми камнями. Суть игры - отгородить на игровой доске камнями своего цвета территорию большего размера, чем противник. Комбинаторика в игре го намного сложнее, чем в шахматах: в ходе игры возникает настолько огромное количество возможных позиций, что просчет оптимальных вариантов становится невозможным даже для самых мощных компьютеров. (Как совсем недавно подсчитал математик Джон Тромп, число допустимых, не противоречащих правилам комбинаций камней в го оказалось больше, чем количество атомов в наблюдаемой Вселенной!)

Так что найти тот алгоритм, который позволил бы победить в игре го, крайне сложно, поэтому эта задача всегда была крайне интересной и заманчивой для современных программистов и разработчиков. (На нашем сайте вы уже могли читать интересный материал о российской разработке робота для игры в го и другие логические игры — робот МанГо, созданный в лаборатории Института прикладной математики им. М.В. Келдыша.)

Традиционные методы ИИ — построение дерева поиска по всем возможным позициям — здесь не подходят. Поэтому разработчики из DeepMind создали программу AlphaGo, основанную на глубоких нейронных сетях. Нейросеть постепенно обучалась на 30 млн ходов партий, сыгранных реальными людьми. Потом AlphaGo сыграла тысячи партий между собственными нейросетями. Далее программа была протестирована с другими лучшими разработками для игры в го. И AlphaGo победила своих кремниевых соперников, выиграв 99,8% игр (499 матчей из 500).

Последнее достижение — победа в матче с чемпионом Европы Фань Хуэем (2-ой профессиональный дан), по словам которого, программа играла очень по-человечески. И если бы ему не сказали, что это компьютер, он бы подумал, что против него играет немного странный, но очень сильный игрок.

Теперь разработчики надеются испытать свой алгоритм по-настоящему — сейчас идет подготовка к мартовскому матчу с легендарным корейцем Ли Седолем, который имеет 9-ый профессиональный дан и является лучшим игроком в го за последнее десятилетие. Следите за новостями!

Комментарии

(0) Добавить комментарий