Программа AlphaGo, разработанная компанией DeepMind (одна из дочерних компаний Google), выиграла у профессионального игрока пять игр подряд. Об этом сообщает Nature.
Программа выиграла пять игр из пяти по турнирным правилам против Фана Хуэя, чемпиона Европы по го. Кроме того, программа побеждает других компьютерных игроков в 99,8 процентов случаев. По словам Фана Хуэя, программа играла очень по-человечески: «Если бы меня заранее не предупредили, я бы мог решить, что против меня играет немного странный, но очень сильный живой игрок».
Как отмечают разработчики, изначально алгоритм не учили играть и выигрывать в го — нейросеть самостоятельно обучалась игре на примере реальных партий. Всего программа за период обработала 30 миллионов комбинаций, что позволило ей выработать аналог интуитивной игры у человека. В сочетании с этим разработчики использовали традиционный метод перебора наилучших вариантов, которые используют слабые го-алгоритмы или программы, специализирующиеся в других играх.
В марте разработчики рассчитывают устроить матч AlphaGo против Ли Седоля, одного из сильнейших го-игроков в мире. Первый профессиональный дан он получил в возрасте 13 лет.
Google DeepMind: Ground-breaking AlphaGo masters the game of Go / DeepMind |
Ранее компьютерные программы несколько раз выигрывали партии в го у профессиональных игроков, имея фору в несколько камней.
Сложность обучения искусственного интеллекта игре в го связана с целым рядом особенностей игры — в частности, большим количеством возможностей для хода, размерами доски (19 на 19 клеток) и постепенным увеличением количества камней на доске. По вычислениям математика Джона Тромпа, число допустимых комбинаций в го состоит из 171 цифры и превышает число атомов в наблюдаемой вселенной.
Число допустимых легальных комбинаций выглядит следующим образом:
2081681993819799846 9947863334486277028 6522453884530548425 6394568209274196127 3801537852564845169 8519643907259916015 6281285460898883144 2712971531931755773 6620397247064840935
Программное обеспечение для вычислений было готово еще в 2005 году, однако автор долго не мог найти спонсора или организацию, которая предоставила бы достаточно мощный для решения поставленной задачи компьютер. На вычисление числа возможных комбинаций, не противоречащих правилам, у ученого ушло около 10 месяцев.
Го — одна из древнейших настольных игр и на сегодняшний день компьютер, даже при обладающий высокими вычислительными мощностями, не способен играть на равных с профессиональным игроком из-за высокого уровня абстракции и невозможности перебора всех доступных вариантов развития событий.
Ранее компания Facebook сообщала о намерении разработать алгоритм, способный играть в го «интуитивно» и оценивать позицию камней на гобане. По словам представителей компании, со временем программа сможет обыграть профессиональных игроков. Специалисты Facebook намерены научить алгоритм играть «интуитивно» и оценивать визуальное расположение камней на доске, а не только возможности следующего хода путем перебора. Как объяснил представитель компании, похожим образом играют в го люди, оценивая ход как «сильный» или «слабый» по его влиянию на расстановку сил на гобане.
В феврале 2015 года компания DeepMind также заявила о разработке программы, способной самостоятельно учиться играть в игры с видеоприставки Atari 2600 и достигать больших успехов.