Саммит «Будущее Го»
(
кит.
中国乌镇围棋峰会
) — совместный проект
китайской ассоциации вэйци
, Sport Bureau провинции Чжэцзян и
Google
, который проходил с 23 по 27 мая 2017 года в китайском городе Вужене (провинция
Чжэцзян
), являющемся постоянным местом проведения
. В рамках мероприятия состоялись пять партий в
го
с участием программы
AlphaGo
и лучших китайских игроков
,
а именно: матч из трёх игр с
Кэ Цзе
,
парное го
(человек и компьютер против человека и компьютера)
и
(пять профессионалов против компьютера)
.
Также в рамка саммита проходило
панельные обсуждения
о будущем
ИИ
.
Содержание
AlphaGo
AlphaGo — компьютерная программа для игры в го, разработанная
DeepMind
, получившая известность в 2016 году, как первая программа
выигравшая матч
у профессионального игрока (
Ли Седоля
).
Версия AlphaGo, которая была использована во время саммита, существенно отличалась от той, которая играла с Ли Седолем. Новая версия больше полагалась на обучение во время игры самой с собой, чем на обучение на играх профессиональных игроков. Кроме того эта версия использовала в десять раз меньше вычислений и обучалась в течение недели, а не нескольких месяцев, как версия 2016 года. В матче против Кэ Цзе использовался только один компьютер на
с
TPU
.
Для сравнения: в игре с Ли Седолем в марте 2016 года AlphaGo использовала 1920 процессоров и 280 графических процессоров, работающих в
распределённой сети
.
Впервые эта версия была использована для управляла игроком «
Master
» в конце 2016 — начале 2017 на го-серверах
и FoxGo, который выиграл все 60 партий у ведущих игроков в го. Поэтому эту версию создатели называют
AlphaGo Master
.
Игры
Игры проводились по стандартным китайским правилам с
коми
в 7,5 очков.
В играх между
Кэ Цзе
и
AlphaGo
каждому игроку давалось три часа основного времени и ещё 5
бёёми
по 1 минуте
.
Игра 1
AlphaGo, играя белыми, выиграла с перевесом в пол очка.
Кэ Цзе против AlphaGo, первая игра
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Первые 99 ходов
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Ходы 100—199 (139 на
)
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Ходы 200—289
Игра 2
Во второй игре Кэ Цзе сдался. На пресс-конференции после окончания игры представители DeepMind сообщили, что первые 50-100 ходов AlphaGo считала, что позиция в партии практически равная для белых и чёрных, и только в конце игры AlphaGo получила преимущество. По их словам это первый случай, когда AlphaGo Master не удавалось так долго получить существенного преимущества (согласно собственной
оценке AlphaGo
)
.
Кэ Цзе против AlphaGo, вторая игра
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Первые 99 ходов
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Ходы 100—155 (104/132/137 в
, 129/135 в 101)
Игра 3
На пресс-конференции после второй партии Кэ Цзе заявил, что он знает, что для игр между машинами вероятность выиграть белыми 55 %, а вероятность выигрывать чёрными 45 %. Он попросил разрешить ему играть третью партию белыми, чтобы показать более интересную игру.
Демис Хассабис
от имени AlphaGo согласился
.
Кэ Цзе сдался после 209-го хода.
Кэ Цзе против AlphaGo, третья игра
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Первые 99 ходов
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Ходы 100–199
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Ходы 200–209
Парное го
26 мая проходила партия в
парное го
между двумя командами. В каждую команду входили профессиональный игрок и компьютер. По правилам парного каждый игрок по очереди делает ход за свою команду, переговоры между партнёрами запрещены. Первым ходил
Гу Ли
за чёрных, потом
за белых, потом
AlphaGo
за чёрных, потом другой экземпляр AlphaGo за белых. После этого последовательность ходов повторялась.
На третьем часу AlphaGo, играющая за чёрных, предложила своему партнёру сдаться, но Гу Ли отказался и продолжил игру. Но вскоре, после 220-го хода, AlphaGo предложила сдаться ещё раз, и Гу Ли согласился. В итоге белые выиграли.
Гу Ли и AlphaGo против Лянь Сяо и AlphaGo
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Первые 99 ходов
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Ходы 100—199
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Ходы 200—220
Командное го
В тот же день происходила игра в командное го. Против AlphaGo играла команда из пяти профессионалов максимального 9 дана —
(№3 в рейтинге сильнейших игроков, рейтинг перед матчем 3571 пункт),
Чэнь Яое
(№8, 3513),
Чжоу Жуйян
(№10, 3509),
(№11, 3508),
(№18, 3474)
. Члены команды сообща выбирали ход. Каждая сторона имела два с половиной часа основного времени. Согласно
жеребьёвке
AlphaGo выпало играть белыми.
После 254 хода чёрные сдались.
Команда профессионалов против AlphaGo
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Первые 99 ходов (87/93/99 в 65, 90/96 в 66)
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Ходы 100–199 (105/111/119/125/131 в
,
108/114/122/128 в 102, 172 в 115)
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Ходы 200–254 (219 в 213)
AlphaGo против AlphaGo
Чтобы отметить конец саммита Future of Go Summit создатели AlphaGo сделали еще один небольшой подарок поклонникам игры го по всему миру, опубликовав серию из 50 игр AlphaGo играющей против самой себя с классическим контролем времени. Анализ этих игр, возможно позволит открыть много новых и интересных идей и стратегий
.
Цензура
Государственное
Центральное телевидение Китая
отменило планировавшуюся прямую трансляцию игры,
прямая потоковая трансляция
игры на всех китайских сайтах была запрещена
.
Кроме того, всем китайским СМИ освещающим событие было запрещено упоминать Google в своих репортажах, поскольку все сервисы Google заблокированы на территории Китая.
Примечания
(неопр.)
.
DeepMind
(10 апреля 2017). Дата обращения: 10 апреля 2017.
11 апреля 2017 года.
(неопр.)
.
Wired.com
(10 апреля 2017). Дата обращения: 10 апреля 2017.
5 октября 2017 года.