robogeek.ru

все о роботах и робототехнике

edu.robogeek.ru

все об обучении робототехнике

ИИ одерживает убедительную победу над одним из лучших игроков в го

Вчера завершилась серия из 5 партий в уже ставшей исторической игре в го между программой AlphaGo, разработанной в компании DeepMind (принадлежит Google) и Ли Седолем – одним из лучших игроков в го в мире за последние 10 лет, профессионалом 9 дана. Итог неутешителен для для тех, кто болел за Ли – программа выиграла с разгромным счетом 4:1. Подробности о самой игре и супер-программе в нашем материале.

Из-за невероятной степени сложности древнекитайская игра го представлялась как гора Эверест для искусственного интеллекта. Но также, как прежде это было сделано для шахмат, шашек и игры Jeopardy, специалисты Google создали наконец компьютерную программу, превзошедшую соперника, в качестве которого выступал лучший игрок в го последнего десятилетия. Знаменательным шагом в развитии ИИ стала победа AlphaGo в серии из пяти игр.

Состоящий из пяти партий матч с участием Google DeepMind стартовал на прошлой неделе в Сеуле. Компьютерная программа AlphaGo противостояла Ли Седолю – одному из лучших игроков в го в мире. Приобретенная Google компания DeepMind, создавая способный противостоять лучшим игрокам в мире искуственный интеллект, использовала для этого некоторые новаторские подходы к машинному обучению. В действительности, еще в 2014 году эксперты предсказали, что может потребоваться еще десять лет для равития ИИ, чтобы компьютер смог выиграть у человека в го.

Наряду с глубинными нейронными сетями была создана древовидная система ускоренного поиска, чтобы перебрать все возможные позиции на доске, которых больше, чем атомов во Вселенной. Эти сети обрабатывают ситуацию на доске через миллионы нейроно-подобных соединений, с так называемой «сетевой политикой», выбирая следующий ход в игре, при этом «сети создания ценности» прогнозируют, кто выиграет игру.

AlphaGo самообучалась игре, используя нейронные сети для обработки 30 миллионов ходов, сделанных ранее экспертами, что позволило программе правильно предсказывать ходы в 57% игрового времени. А затем, воспроизводя тысячи игр среди собственных нейронных сетей, путем долгих проб и ошибок программе удалось изучить и создать свою собственную стратегию, намекая на потенциальное превосходство над нами, простыми смертными.

Далее эта программа заняла первое место в соперничестве с другими наиболее совершенными программами, играющими в го. Выйдя победителем в 499 из 500 игр, AlpaGo вскоре замахнулась на соперничество с человеком и выиграла в октябре прошлого года со счетом 5:0 у трехкратного чемпиона Европы по го, профессионального игрока Фан Хуэя: Искусственный интеллект впервые выиграл в го у профессионального игрока.

Но чтобы быть лучшим – нужно побеждать сильнейших. Именно эта задача была поставлена и решена AlphaGo. Поначалу в соперничестве с Седолем все шло успешно, после трех поединков программа эффективно завершала серию, не проиграв ни одной партии.

Но Седоль нанес ответный удар в четвертой игре. По словам комментаторов, долгое время AlphaGo была в выгодном положении. Но на 78 ходу, Седоль сделал великолепный маневр, за которым последовала ошибка AlphaGo, что в конечном итоге привело к поражению программы.

В пятой игре ожидалась жаркая схватка, так как соперники уже хорошо изучили друг друга. AlphaGo уже выиграла серию, сможет ли Седоль использовать эту кажущуюся слабость? Партия затянулась на 280 ходов (на предыдущие четыре уходило в среднем по 188). «Трудно сказать, в какой момент AlphaGo был впереди или позади, равная игра была на всем протяжении», - сказал комментатор Майкл Редмонд. На 48 ходу AlphaGo сделала что-то похожее на ошибку в середине доски в четвертой партии. Но, в конечном итоге, программа Google победила, доведя счет в серии до 4:1.

Google DeepMind выиграл $1 млн. за победу в серии. Эти деньги будут переданы детскому фонду ЮНИСЕФ, а также другим благотворительным, научным и занимающимся развитием игры го организациям.

Комментарии

(0) Добавить комментарий