Interested Article - Google DeepMind
- 2020-10-05
- 1
Google DeepMind , ранее DeepMind Technologies , — британская компания, занимающаяся искусственным интеллектом . Основана в 2010 году в Лондоне под названием DeepMind Technologies. В 2014 году была приобретена Google .
Компания получила известность благодаря разработке компьютерной системы AlphaGo , победившей профессионального игрока в го . DeepMind создала нейронную сеть , способную научиться играть в видеоигры на уровне человека . В 2020 году компания разработала программу AlphaFold2, позволяющую решать одну из фундаментальных проблем биологической науки по построению трёхмерных моделей белков .
В 2022 году компания разработала нейросетевой алгоритм , при помощи которого были найдены несколько новых алгоритмов перемножения матриц небольших размерностей. Так для матриц 4X4 алгоритм Штрассена требует 49 умножений, а AlphaTensor нашёл алгоритм, требующий 47 умножений, но работает он только для поля .
В апреле 2023 года компания объединилась с подразделением Google Brain и стала Google DeepMind .
История
В 2010 году Демис Хассабис , , основали стартап DeepMind Technologies . До того Хассабис и Легг уже были знакомы по Университетскому Колледжу Лондона , где работали в подразделении вычислительной нейробиологии Gatsby (Gatsby Computational Neuroscience Unit,) .
В компанию вложились большие венчурные фонды , , а также предприниматели и Илон Маск . был одним из ранних инвесторов и советников компании .
В 2014 DeepMind получила награду «Компания года» от Компьютерной лаборатории Кембриджского университета .
26 января 2014 года Google объявил о приобретении DeepMind Technologies . По разным сообщениям сумма сделки составила от 400 до 650 миллионов долларов . Сообщается, что сделка состоялась после того, как Facebook прекратил переговоры о покупке DeepMind Technologies в 2013 году . Одним из условий сделки DeepMind с Google было создание последней коллегии по этическим проблемам искусственного интеллекта .
После покупки Google компания стала называться Google DeepMind.
В начале сентября 2016 года компания перешла в родительскую компанию Google — Alphabet , а из её названия исчезло упоминание Google, теперь она известна как DeepMind Technologies Limited или же DeepMind. Также веб-сайт компании сменил дизайн.
В апреле 2023 года DeepMind объединилась с подразделением Google Brain и образовала Google DeepMind в рамках продолжающихся усилий компании по ускорению работы над ИИ .
Направление исследований
Цель компании — «решить проблему интеллекта» . Для этого они используют «лучшие технологии, начиная от машинного обучения и заканчивая системной психофизиологией , чтобы создать в итоге обучающиеся алгоритмы общего назначения» . Также они работают над формализацией интеллекта для того, чтобы не только реализовать его в машинах, но и чтобы понять, как работает мозг человека. По словам Демиса Хассабиса :
... попытка извлечь сущность интеллекта в виде алгоритмической конструкции может оказаться наилучшим способом понять самые глубокие тайны нашего ума.
Решение проблемы интеллекта DeepMind видит в создании универсальных самообучающихся интеллектуальных агентов , которые были бы способны автономно обучаться на необработанных входных данных и были бы пригодны для решения любых задач в отличие от «ограниченных ИИ », таких как Deep Blue или IBM Watson , решающих только одну предопределённую задачу. В качестве основного подхода к построению интеллектуальных агентов выбрано обучение с подкреплением .
В настоящий момент компания занимается исследованиями в области компьютерных систем, которые умеют играть в различные игры — от стратегических игр вроде го до компьютерных аркад . Шейн Легг утверждает, что искусственный интеллект сможет достичь уровня человека, «когда машина научится играть в широкий класс игр, используя только входной и выходной сигналы потока восприятия, и переносить понимание из игры в игру...» . Демис Хассабис объясняет фокус на играх, а не на более традиционной робототехнике , тем, что « роботы — дорогие, медленные и часто ломаются... исследователь отвлекается на починку механических деталей робота...» . Сообщается, что Google купил компанию именно после публикации исследования об ИИ , успешно играющего в семь различных Atari -игр (Pong, Breakout, Space Invaders, Seaquest, Beamrider, Enduro, Q*bert) .
В начале 2018 года исследователи из DeepMind обучили одну из своих систем играть в компьютерную игру Quake III Arena . Через некоторое время, потраченное на тренировки, по уровню игры эта система сначала догнала, а затем и перегнала людей, являющихся сильными игроками .
Нейронная машина Тьюринга
В 2014 году DeepMind опубликовал архитектуру гибридной нейронной сети , состоящую из рекуррентной нейросети и внешней памяти . Нейросеть использует внешнюю память для записи и последующего чтения информации так же, как это делает машина Тьюринга , по этой причине архитектуре дали название «Нейронная машина Тьюринга» (Neural Turing Machine). По замыслу исследователей Нейронная машина Тьюринга имитирует кратковременную память человека и позволяет понять принципы её работы. В экспериментах нейросеть успешно обучалась простым алгоритмам: копирование, сортировка, ассоциативная память.
Глубинное обучение с подкреплением в видеоиграх
DeepMind представил систему ИИ , которая способна обучиться играть в классические игры 70-80-х гг. для игровой консоли Atari 2600 . В исследовании ИИ обучался игре в 49 видеоигр. В результате был достигнут уровень игры сравнимый с уровнем человека, а в 22 играх система смогла превзойти человека. ИИ DeepMind не запрограммирован жестко под конкретную игру. В начале обучения система ничего не знает о правилах игры и учится играть самостоятельно, используя на входе только пиксельное изображение игры и информацию об очках, получаемых в ходе игры.
В основе ИИ лежит подход, который DeepMind называет глубинным обучением с подкреплением, или deep Q-network (DQN) . Это вариация обучения с подкреплением без модели с применением Q-обучения , в котором функция полезности моделируется с помощью глубинной нейронной сети . В качестве архитектуры нейросети выбрана свёрточная нейронная сеть , в настоящее время эта архитектура эффективно применяется для распознавания изображений .
В планах DeepMind научить ИИ, построенного на тех же принципах, играть в более сложные 3D игры 90-ых, такие как Doom и гоночные симуляторы . В феврале 2016 были представлены первые результаты обучения ИИ 3D играм . ИИ смог обучиться управлению машиной в 3D гоночном симуляторе TORCS , поиску выхода и призов в Doom-подобном 3D лабиринте Labyrinth , выполнению простых задач ( локомоция , поддержание равновесия, манипуляция предметами) в физическом симуляторе MuJoCo () . Как и прежде на вход ИИ подавалось только пиксельное изображение «мира». Архитектура нейросети была расширена добавлением LSTM , разновидности рекуррентной нейронной сети .
AlphaStar
На ежегодном фестивале Blizzcon 2016 компания Blizzard , которая является инициатором данного мероприятия, объявила о своем сотрудничестве с компанией DeepMind. Затем об этом событии была опубликована статья на официальных блогах обеих компаний . Целью данного сотрудничества является внедрение и обучение ИИ в игре Starcraft II . По мнению разработчиков игры — Starcraft II является идеальной средой для обучения искусственного интеллекта, поскольку сложные правила игры достаточно отражают сложность и многогранность реального мира. К тому же, само коммьюнити считало эту игру самой большой проблемой для ИИ, сумевшего победить человека в игре в го, шахматы и покер .
StarCraft II — идеальная среда, которая позволит вывести исследования, связанные с созданием искусственного интеллекта, на новый уровень. Сложные правила игры в достаточной мере отражают многогранность и хаотичность реального мира. Сначала вы учитесь добывать ресурсы, затем возводить простые строения, исследовать карту и искать противника. Стоит производить больше боевых единиц или лучше будет укрепить оборонительный рубеж? Будете вы совершать атаки на раннем этапе или сосредоточитесь на развитии?
В данный момент ведется работа над «Starcraft 2 API», которая позволяет ИИ полностью взаимодействовать с интерфейсом игры, принять участие в разработке может любой желающий, для таковых были опубликованы технические задачи , которые планируется реализовать в первом квартале 2017 года. Сам ИИ будет обучаться, просматривая повторы других игроков, которые принимали участие в рейтинговых играх.
На турнире 19 декабря 2018 года между AlphaStar и двумя профессиональными игроками, входящими в сотню сильнейших TLO и MaNa, AlphaStar выиграла со счётом 10:0. При этом MaNa удалось победить в одной внезачётной игре
24 января 2019 года была представлена программа AlphaStar, специализирующаяся на игре StarCraft II в жанре стратегии в реальном времени . AlphaStar сначала учило программу на записях игр людей, затем включило в «лигу AlphaStar», где ИИ играл не только против себя, но и «эксплуататорских» агентов, которые являлись версиями ИИ, специально нацеленными на слабые места AlphaStar и представлявших каждую из трёх рас . Обучение гарантировало, что AlphaStar станет грозным противником всех трёх рас и каждой игровой стратегии. На момент презентации у AlphaStar были знания, эквивалентные 200 годам игрового времени. . При этом разработчики пытались ограничить возможности ИИ, например ограничив число действий в минуту приравняв его к усредненному числу действий хорошего игрока (что не мешает программе показывать невозможные для людей результаты), из-за чего программа была вынуждена учиться выигрывать долгосрочной стратегией . Скорость реакции около 3 кадров от появления противника в зоне видимости до ответной реакции. Уменьшило размер зоны зрения ИИ до зоны зрения игрока.
К концу октября 2019 года ИИ стал гроссмейстером игры, сумев обойти 99,8 % зарегистрированных в Starcraft II игроков-людей. На это достижение AlphaStar понадобилось 44 дня тренировок. .
Игра в го
В октябре 2015 программа для игры в го AlphaGo , разработанная DeepMind, победила чемпиона Европы по го Фань Хуэя (2-ой дан ) со счётом 5—0 . О новости было объявлено только 27 января 2016 года одновременно с публикацией статьи в журнале Nature .
Это первый в истории случай, когда ИИ выиграл в го у профессионала , до AlphaGo все известные ИИ играли в го только на любительском уровне. Го считается игрой, в которую компьютеру выиграть достаточно тяжело (в сравнении с аналогичными играми, например, c шахматами) в виду большого количества вариантов ходов, из-за этого традиционный для ИИ метод перебора ходов практически неприменим . В марте 2016 года программа выиграла матч у одного из сильнейших гоистов мира Ли Седоля со счетом 4-1.
Другие направления
Публикации DeepMind затрагивают следующие темы : понимание естественного языка машинами , генерация изображений по шаблону с помощью нейронных сетей , распознавание речи , алгоритмы обучения нейронных сетей.
DeepMind Health
DeepMind Health — подразделение DeepMind, работающее в области искусственного интеллекта в медицине . О его открытии было объявлено 24 февраля 2016 года на веб-сайте компании. Подразделение возглавляет .
В своей работе DeepMind Health будет сотрудничать с Национальной службой здравоохранения Великобритании . DeepMind Health планирует предоставлять врачам техническую экспертизу для разработки и совершенствования технологий по уходу за пациентами. Особое внимание будет уделяться безопасности данных пациентов и конфиденциальности. Деятельность подразделения будет проверяться советом из независимых экспертов, в число которых входит (англ.) (, редактор авторитетного журнала по медицине The Lancet .
В настоящее время DeepMind Health работает над созданием электронных инструментов, упрощающих работу врача. Было представлено приложение для смартфона, позволяющее более точно диагностировать острую почечную недостаточность . Также DeepMind купил медицинское приложение, таск-менеджер для врачей. Команда врачей из Имперского колледжа Лондона , создавшая его, присоединяется к DeepMind Health. Сумма сделки не разглашается.
В декабре 2020 года команда DeepMind объявила о решении фундаментальной научной проблемы предсказания структуры белка. Программа, разработанная компанией и основанная на нейросетях, смогла предсказывать структуру белка с 90% точностью (что лучше современных методов сканирования). Это позволяет строить 3-мерные модели белков по кодирующей геномной последовательности, что имеет большое значение для разработки новых лекарств и понимания процессов биохимии в целом.
Сотрудничество с университетами
В 2014 году DeepMind начинает сотрудничество с Оксфордским университетом . DeepMind нанимает две передовые команды из Оксфорда, работающих в области искусственного интеллекта. Это команда ведущих экспертов мира по применению глубинного обучения в области понимания естественного языка машинами : профессора Нандо Де Фрейтас и Фил Блансом, доктора Эдвард Грефенстетт и Карл Мориц. И команда одних из ведущих экспертов мира в области машинного зрения : доктора Карэн Симоньян и Макс Яденберг, профессор Эндрю Зиссерман. В рамках сотрудничества факультет компьютерных наук и факультет инженерных наук получат существенное финансирование от Google. Также DeepMind планирует программу студенческих стажировок, чтение лекций и проведение семинаров для студентов.
С DeepMind работают учёные и из других университетов. Дэвид Сильвер, соавтор статьи о AlphaGo и еще многих публикаций DeepMind об обучении с подкреплением , читает лекции в Университетском Колледже Лондона . Некоторые публикации DeepMind написаны в соавторстве с учёными из следующих организаций : Торонтский университет , Монреальский университет , Австралийский национальный университет , Амстердамский университет , Калифорнийский университет в Беркли , INRIA .
Примечания
- (неопр.) . Дата обращения: 6 февраля 2020. 30 декабря 2019 года.
- ↑ (англ.) . BBC News. Дата обращения: 8 февраля 2016. 30 января 2016 года.
- ↑ The Physics arXiv Blog. (неопр.) . Medium (29 января 2014). Дата обращения: 8 февраля 2016. 1 мая 2019 года.
- от 5 декабря 2020 на Wayback Machine , nplus1.ru , 1 декабря 2020 года.
- (англ.) . www.deepmind.com . Дата обращения: 6 октября 2022. 5 октября 2022 года.
- Alhussein Fawzi, Matej Balog, Aja Huang, Thomas Hubert, Bernardino Romera-Paredes. (англ.) // Nature. — 2022-10. — Vol. 610 , iss. 7930 . — P. 47–53 . — ISSN . — doi : . 6 октября 2022 года.
- ↑ (англ.) . ForkLog (21 апреля 2023). Дата обращения: 21 апреля 2023. 21 апреля 2023 года.
- Amy Thomson. (неопр.) . Bloomberg.com. Дата обращения: 8 февраля 2016. 7 марта 2016 года.
- Gibbs, Samuel . (англ.) , The Guardian (28 January 2014). 16 августа 2015 года. Дата обращения: 8 февраля 2016.
- Davies, Sally . , Financial Times (27 января 2014). 12 марта 2016 года. Дата обращения: 8 февраля 2016.
- (неопр.) . Дата обращения: 8 февраля 2016. 17 марта 2015 года.
- (неопр.) . International Business Times UK. Дата обращения: 8 февраля 2016. 3 февраля 2016 года.
- (неопр.) . Re/code. Дата обращения: 8 февраля 2016. 27 января 2016 года.
- (неопр.) . www.cl.cam.ac.uk. Дата обращения: 8 февраля 2016. 3 февраля 2016 года.
- , Reuters (27 января 2014). 11 марта 2016 года. Дата обращения: 8 февраля 2016.
- // The Economist. — ISSN . 14 января 2018 года.
- Catherine Shu. (неопр.) . TechCrunch. Дата обращения: 8 февраля 2016. 28 января 2014 года.
- , Reuters (27 января 2014). 27 января 2014 года. Дата обращения: 8 февраля 2016.
- Gibbs, Samuel . (англ.) , The Guardian (27 January 2014). 3 февраля 2014 года. Дата обращения: 8 февраля 2016.
- (неопр.) . The Information. Дата обращения: 8 февраля 2016. 31 января 2014 года.
- (неопр.) . Forbes. Дата обращения: 8 февраля 2016. 4 марта 2016 года.
- ↑ (неопр.) . deepmind.com. Дата обращения: 8 февраля 2016. 13 октября 2014 года.
- Legg, Shane; Veness, Joel (29 September 2011). (неопр.) . Дата обращения: 8 февраля 2016. 11 июня 2016 года.
- Hassabis, Demis (23 February 2012). (неопр.) . Дата обращения: 8 февраля 2016. 4 марта 2016 года.
- ↑ Royal Television Society. (неопр.) (19 ноября 2015). Дата обращения: 8 февраля 2016. 2 февраля 2016 года.
- (неопр.) . lesswrong.com. Дата обращения: 8 февраля 2016. 24 октября 2014 года.
- от 5 июля 2018 на Wayback Machine Engadget, March 7, 2018
- (неопр.) . Дата обращения: 15 июля 2018. 15 июля 2018 года.
- Alex Graves, Greg Wayne, Ivo Danihelka. // arXiv:1410.5401 [cs]. — 2014-10-20. 13 января 2016 года.
- (неопр.) . MIT Technology Review. Дата обращения: 8 февраля 2016. 2 апреля 2017 года.
- ↑ (неопр.) . deepmind.com. Дата обращения: 10 февраля 2016. Архивировано из 9 февраля 2016 года.
- Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Andrei A. Rusu, Joel Veness. (англ.) // Nature. — 2015-02-26. — Vol. 518 , iss. 7540 . — P. 529–533 . — ISSN . — doi : . 25 сентября 2017 года.
- ↑ Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Alex Graves, Ioannis Antonoglou. // arXiv:1312.5602 [cs]. — 2013-12-19. 13 февраля 2016 года.
- (англ.) . Research Blog. Дата обращения: 8 февраля 2016. 5 февраля 2016 года.
- (неопр.) . Wired UK. Дата обращения: 8 февраля 2016. 21 мая 2016 года.
- Volodymyr Mnih, Adrià Puigdomènech Badia, Mehdi Mirza, Alex Graves, Timothy P. Lillicrap. // arXiv:1602.01783 [cs]. — 2016-02-04. 18 февраля 2016 года.
- Jacob Aron. (англ.) . New Scientist. Дата обращения: 14 февраля 2016. 6 февраля 2016 года.
- DeepMind. (неопр.) (4 февраля 2016). Дата обращения: 14 февраля 2016. 14 февраля 2016 года.
- DeepMind. (неопр.) (4 февраля 2016). Дата обращения: 14 февраля 2016. 14 февраля 2016 года.
- DeepMind. (неопр.) (4 февраля 2016). Дата обращения: 14 февраля 2016. 4 декабря 2016 года.
- (неопр.) . DeepMind. Дата обращения: 11 ноября 2016. 5 августа 2019 года.
- (рус.) . StarCraft II. Дата обращения: 11 ноября 2016. 10 ноября 2016 года.
- ↑ Sample, Ian . , Guardian (30 октября 2019). 29 декабря 2020 года. Дата обращения: 31 октября 2019.
- (неопр.) . us.battle.net. Дата обращения: 11 ноября 2016. 10 ноября 2016 года.
- (неопр.) . DeepMind. Дата обращения: 24 января 2019. 24 января 2019 года.
- (неопр.) . Дата обращения: 25 января 2019. 11 декабря 2019 года.
- (неопр.) . Дата обращения: 25 января 2019. 26 января 2019 года.
- Ryan Whitwam. (неопр.) . ExtremeTech (24 января 2019). Дата обращения: 8 февраля 2019. 5 февраля 2019 года.
- (неопр.) . deepmind.com. Дата обращения: 10 февраля 2016. Архивировано из 25 февраля 2016 года.
- Tual, David Larousserie et Morgane . (фр.) , Le Monde.fr . 29 января 2016 года. Дата обращения: 8 февраля 2016.
- (неопр.) . Research Blog. Дата обращения: 8 февраля 2016. 1 февраля 2016 года.
- ↑ (неопр.) . deepmind.com. Дата обращения: 10 февраля 2016. Архивировано из 7 февраля 2016 года.
- Karl Moritz Hermann, Tomáš Kočiský, Edward Grefenstette, Lasse Espeholt, Will Kay. // arXiv:1506.03340 [cs]. — 2015-06-10. 19 февраля 2016 года.
- Ivo Danihelka. (неопр.) (17 сентября 2015). Дата обращения: 10 февраля 2016. 21 июля 2017 года.
- (неопр.) . deepmind.com. Дата обращения: 27 февраля 2016. 27 февраля 2016 года.
- Francisco, Sarah Boseley Paul Lewis in San . (англ.) , The Guardian (24 February 2016). 27 февраля 2016 года. Дата обращения: 27 февраля 2016.
- Jack Clark. (неопр.) . Bloomberg.com. Дата обращения: 27 февраля 2016. 27 февраля 2016 года.
- от 13 декабря 2020 на Wayback Machine , meduza.io , 13 декабря 2020 года.
- (англ.) . Google Europe Blog. Дата обращения: 10 февраля 2016. 22 февраля 2016 года.
- (неопр.) . Department of Computer Science. Дата обращения: 10 февраля 2016. 5 февраля 2016 года.
- David Silver, Aja Huang, Chris J. Maddison, Arthur Guez, Laurent Sifre. (англ.) // Nature. — 2016-01-28. — Vol. 529 , iss. 7587 . — P. 484–489 . — ISSN . — doi : . 24 сентября 2019 года.
- (неопр.) . www0.cs.ucl.ac.uk. Дата обращения: 10 февраля 2016. 20 февраля 2016 года.
- 2020-10-05
- 1