Чемпион по го завершает карьеру из-за поражения от искусственного интеллекта

423921.742xp.jpg

Москва, 28 ноября — «Вести.Экономика». Профессиональный южнокорейский игрок в го Ли Седоль объявил о завершении карьеры. Такое решение он принял в связи с поражением в матче с программой AlphaGo, разработанной компанией DeepMind. Поединок между ними состоялся в 2016 г. и завершился со счетом 4:1 в пользу AlphaGo. Это поражение многие эксперты признали историческим.

По словам Седоля, компьютерные алгоритмы стали настолько совершенны, что одержать над ними верх не под силу никому. «После победы искусственного интеллекта в игре го я понял, что я больше не буду лучшим. Даже если я стану номером один за счет безумных усилий, теперь есть сущность, которую невозможно победить», – сказал Седоль агентству Yonhap.

Го – одна из древнейших настольных игр, возникла в Древнем Китае и считается наиболее сложной для искусственного интеллекта из-за большого размера доски и трудностей в прогнозировании ходов. В игре участвуют двое: один получает черные камни, другой — белые. Цель соперников — отгородить на игровой доске камнями своего цвета большую территорию, чем противник.

До недавнего времени считалось, что компьютер, даже обладающий высокими вычислительными мощностями, не способен играть в го на равных с профессиональным игроком из-за высокого уровня абстракции и невозможности перебора всех доступных вариантов развития событий. Например, точное число допустимых комбинаций на доске для го больше, чем число атомов в наблюдаемой Вселенной.

Ли Седоль получил разряд первого профессионального дана по го в 1996 году в возрасте 13 лет. В 2002-м он завоевал свой первый международный титул, победив в 15-м розыгрыше Кубка Фудзицу. В 2008 году он был признан лучшим игроком мира.

Перед матчем с AlphaGo Седоль предсказывал, что обыграет программу, но в итоге ему удалось победить лишь в одной партии из пяти, а после завершения поединка игрок извинился перед зрителями, пишет The Verge. Тем не менее Седоль является единственным человеком, которому удалось обыграть AlphaGo на официальных турнирах (еще дважды программа проигрывала партии человеку во время тренировок).

Ли Седоль планирует сыграть ещё одну игру в го перед тем, как окончательно уйти. В соперники себе он выбрал южнокорейский ИИ HanDol, который победил пятерых лучших игроков в Южной Корее. Ли получит преимущество в два камня, но даже при таких условиях он не верит в победу. «Даже с преимуществом в два камня я чувствую, что проиграю первый матч HanDol. Сейчас не очень слежу за новостями го. Хочу расслабленно сыграть против программы, поскольку уже закончил карьеру, хотя и сделаю все возможное для победы», – заявил Седоль.

Система искусственного интеллекта AlphaGo появилась в 2014 г. С тех пор ИИ победил лучших игроков в го и одержал 60 побед на двух китайских онлайн-платформах с настольными играми FoxGo и Tygem. Алгоритм состоит из двух нейросетей, которые имитируют работу нейронов в мозге.

Победы AlphaGo ознаменовали собой важный прорыв в области искусственного интеллекта, так как большинство специалистов по искусственному интеллекту считали, что подобная программа не будет создана ранее 2020—2025 гг. Победу AlphaGo над Ли Седолем часто сравнивают с шахматным матчем между программой Deep Blue и Гарри Каспаровым 1997 г., где победа программы, созданной IBM, над действовавшим чемпионом стала символической точкой отсчета новой эпохи, когда компьютеры превзошли людей в шахматах.

В 2018 году Deep Mind представила ещё более продвинутую версию своей программы – Alpha Zero, которая стала наследницей и продолжением нейросети AlphaGo. В отличие от предшественников, AlphaZero не сосредоточена на освоении какой-то конкретной игры, но может в кратчайшие сроки без посторонней помощи научиться играть в любую настольную игру и обыгрывать человека. На данный момент система уже умеет играть в сложнейшую го, шахматы и сёги.

Разработчики DeepMind добавили самообучение в программу для игры в го еще в 2017 г., когда выпустили предыдущее поколение алгоритма. Смысл этого обучения в том, что нейронная сеть программы не следит за поведением человека (как в первой версии AlphaGo), а играет сама с собой. Тогда AlphaGo Zero, зная лишь правила игры, за три дня «наиграла» столько удачных ходов, что со счетом по партиям 100:0 победила AlphaGo.

Нейросети были известны лишь правила игры в го, начальные условия и условия победы. Затем компьютер самостоятельно учился играть. Система обучения ИИ строилась на анализе ходов. Нейросеть запоминала те, которые приближали ее к победе, и заносила в «черный список» те шаги, которые были откровенно проигрышными. Используя эти данные, нейросеть перестраивала себя, постепенно достигнув того уровня, на который вышла первая версия AlphaGo перед серией игр с Ли Седолем.

Ученые встроили в AlphaGo Zero эвристические алгоритмы случайного поиска решений, а также код, учитывавший существование ничьи в некоторых играх. Вдобавок новая версия нейросети непрерывно совершенствовала свою структуру, а не обновлялась этапами, как ее предшественница. После полного цикла обучения (который для го занял 13 дней) AlphaZero на испытаниях показала 16% побед (против 0,6% поражения) в шахматах, 61% — в го и 91% — в сёги.

Разумеется, на играх системы искусственного интеллекта лишь тестируют. DeepMind намерена использовать мощь системы AlphaGo и ее последовательниц для поиска лекарств от тяжелых болезней, сокращения потребления электроэнергии и разработки новых революционных материалов.

«Люди учились играть в шахматы, го, сёги и многие другие игры сотни и тысячи лет. AlphaZero самостоятельно достигла вершин мастерства во всех этих играх без какой-либо помощи с нашей стороны. Моя мечта — создать такую же систему, которая бы не просто умела играть, но и решать повседневные задачи, к примеру, создавала бы новые лекарства», — заявил Дэвид Сильвер, главный разработчик компании DeepMind.

Больше интересных историй:

Загрузка...
Будьте вежливы. Отправляя комментарий, Вы принимаете Условия пользования сайтом.

Оставить комментарий

Загрузка...