Программа AlphaGo, разработанная ранее отделом искусственного интеллекта технического гиганта Google, уже выиграла в Го у двух лучших игроков мира. Она начинала с изучения игры по тысячам партий, сыгранных людьми.
Но новая AlphaGo Zero начинала с чистой доски Го, не имея никаких данных кроме правил игры, и далее играла самостоятельно. В течение 72 часов она достигла такого уровня мастерства, что смогла выиграть 100 партий у исходной программы.
Исполнительный директор DeepMind Демис Хассабис сказал, что теперь систему можно широко применять в научных исследованиях. «Мы взволнованы, потому что понимаем, что теперь она достаточно совершенна для реального решения некоторых реальных проблем, хотя очевидно, что до создания полного искусственного интеллекта нам еще далеко», - отметил он.
В прошлом году программа компании по ИИ, базирующейся в Лондоне, выиграла у ведущего игрока в Го из Южной Кореи Ли Седола четыре партии, проиграв всего лишь одну. В игре, где возможных допустимых позиций на доске больше, чем атомов во Вселенной, машина одержала победу над человеком, и это произошло намного раньше, чем могли предположить многие специалисты в области ИИ. Затем, в мае, последовала победа AlphaGo над игроком номер один в мире – китайцем Ке Цзе.
При всех достижениях в этой сфере для дальнейшего совершенствования было необходимо объединить огромный объем данных, в данном случае – по тысячам записанных партий с высокой вычислительной мощностью компьютера. Руководивший разработкой проблемы Дэвид Силвер заявил, что команда избрала совсем иной подход к программе AlphaGo Zero. Он пояснил: «Новая модификация начинается с нейронной сети, не содержащей сведений об игре Го, единственное, что известно – правила игры. Все остальное программа вычисляет в процессе игры, которую ведет сама с собой».
Считается, что Го возникла в Китае несколько тысячелетий назад. Выкладывая черные и белые камни на расчерченной доске, игроки стараются взять верх над соперником, окружив его участки территории. Правила проще, чем в шахматах, однако в большинстве позиций у игроков имеется выбор из 200 вариантов хода, в то время как в шахматах – около 20. Бывает трудно понять, у кого преимущество, многие лучшие игроки полагаются на интуицию.
Новый подход к решению проблемы оказался более эффективным. В то время как программе AlphaGo понадобились месяцы для достижения профессионального уровня, АlphaGo Zero освоила его за три дня, опираясь на часть своих вычислительных возможностей. «Это показывает, что вычисления выполняются с помощью нового алгоритма, дело не в вычислительной мощности и не в информации», - отметил Силвер, подчеркнувший при этом, что его вдохновляет мысль, которая может кого-то испугать: за несколько дней машина превзошла людей в познании игры, которая тысячи лет была в их распоряжении.
«Теперь, когда мы устранили давление со стороны человеческих знаний, система получила возможность, исходя из основных принципов, самой создавать знания с чистого листа», - продолжил Силвер. В то время как предыдущая версия быстро обучалась и совершенствовалась на основе человеческой стратегии, AlphaGo Zero выработала в игре такие приемы, каких не знал профессиональный игрок, консультировавший DeepMind.
Многие участники команды теперь приступили к новым проектам, в которых пытаются применить новый метод в других областях. Денис Хассабис упоминает в качестве сферы своих интересов разработку лекарств и открытие новых материалов. Кто-то видит в искусственном интеллекте угрозу, он же смотрит в будущее с оптимизмом. «Я предвижу, что такая форма алгоритма будет постоянно сотрудничать с нами в качестве научного эксперта на передовых рубежах науки и медицины - вот на что я надеюсь», - заявил он.
Однако он и его коллеги сдержанно говорят о том, как скоро мы увидим широкое использование этих технологий ИИ. Игра, в которой есть четкие правила и никаких элементов случайности, – это одно, совсем другое дело – реальный мир с его беспорядочностью, случайностями и непредсказуемостью.
Мы должны внимательно следить за этическими проблемами, связанными с машинами, которые способны самостоятельно мыслить, особенно когда ими управляет такой гигант как Google. Но пока почти нет признаков того, что AlphaGo Zero и ему подобные устройства могут отнять у нас работу или что они угрожают вытеснить «устаревшее» человечество.