Interested Article - Нейронный машинный перевод Google

Нейронный машинный перевод Google (GNMT) — это система нейронного машинного перевода (NMT), разработанная компанией Google и представленная в ноябре 2016 года, которая использует искусственную нейронную сеть для повышения беглости и точности перевода в Google Переводчике .

GNMT улучшает качество перевода, применяя метод машинного перевода на основе примеров (EBMT), в котором система “обучается на миллионах примеров”. Предлагаемая архитектура системного обучения GNMT была впервые опробована на более, чем ста языках, поддерживаемых Google Переводчиком. Благодаря большой , система со временем учится создавать более качественные и естественные переводы. GNMT способна переводить предложения целиком, а не по частям. Сеть GNMT может выполнять , кодируя семантику предложения вместо того, чтобы запоминать переводы отдельных фраз.

История

Проект Google Brain был создан в 2011 году в “секретной исследовательской лаборатории Google X” Джеффом Дином , сотрудником Google, Грегом Коррадо, исследователем из Google, и Эндрю Ыном , профессором компьютерных наук Стэнфордского университета . Работа Ына легла в основу одного из самых больших технологических прорывов в Google и Стэнфорде.

В сентябре 2016 года исследовательская группа Google объявила о разработке системы перевода GNMT, и к ноябрю Google Переводчик начал использовать нейронный машинный перевод (NMT) вместо прежних статистических методов (SMT) , которые использовались с октября 2007 года внутри собственной закрытой SMT системы.

Система NMT внутри Google Переводчика использует большую искусственную нейронную сеть, пригодную для глубинного обучения . Изучая миллионы примеров, GNMT улучшает качество перевода, используя более широкий контекст для вывода наиболее подходящего перевода. Затем результат перестраивается и адаптируется для соответствия грамматике человеческого языка. GNMT не создала свой внутренний универсальный язык, а скорее стремилась найти общее между многими языками, что должно быть интересно больше для психологов и лингвистов, чем для специалистов в области информатики. Новый движок перевода был включен в обе стороны для девяти языков: английского, французского, немецкого, испанского, португальского, китайского, японского, корейского и турецкого в 2016 году. В марте 2017 года были добавлены ещё три языка: русский, хинди и вьетнамский. В том же месяце с помощью сообщества Google Переводчика была добавлена поддержка иврита и арабского языка. Далее в конце апреля 2017 года была добавлена поддержка девяти индийских языков, а именно: хинди, бенгали, маратхи, гуджарати, пенджаби, тамильский, телугу, малаялам и каннада.

Языки, поддерживаемые GNMT

Ниже приведён список языковых пар, в которых для перевода используется модель нейронного машинного перевода Google (NMT). По состоянию на июль 2017 года для всех языков поддерживается только перевод на английский язык и обратно:

Языковая пара Коды языков
1 Африкаанс <-> Английский af <-> en
2 Арабский <-> Английский ar <-> en
3 Болгарский <-> Английский bg <-> en
4 Китайский (упрощенный) <-> Английский zh-CN <-> en
5 Китайский (традиционный) <-> Английский zh-TW <-> en
6 Хорватский <-> Английский hr <-> en
7 Чешский <-> Английский cs <-> en
8 Датский <-> Английский da <-> en
9 Голландский <-> Английский nl <-> en
10 Французский <-> Английский fr <-> en
11 Немецкий <-> Английский de <-> en
12 Греческий <-> Английский el <-> en
13 Иврит <-> Английский iw <-> en
14 Хинди <-> Английский hi <-> en
15 Исландский <-> Английский is <-> en
16 Индонезийский <-> Английский id <-> en
17 Итальянский <-> Английский it <-> en
18 Японский <-> Английский ja <-> en
19 Корейский <-> Английский ko <-> en
20 Норвежский <-> Английский no <-> en
21 Польский <-> Английский pl <-> en
22 Португальский <-> Английский pt <-> en
23 Румынский <-> Английский ro <-> en
24 Русский <-> Английский ru <-> en
25 Словацкий <-> Английский sk <-> en
26 Испанский <-> Английский es <-> en
27 Шведский <-> Английский sv <-> en
28 Тайский <-> Английский th <-> en
29 Турецкий <-> Английский tr <-> en
30 Вьетнамский <-> Английский vi <-> en

Прямой перевод

Утверждается, что система GNMT лучше предыдущего варианта Google Переводчика тем, что она может выполнять “прямой перевод”, т.е. переводить с одного языка на другой напрямую (например, с японского на корейский). Ранее Google Переводчик сначала переводил с на английский, а затем с английского на вместо прямого перевода с одного языка на другой.

См. также

Примечания

  1. Barak Turovsky (November 15, 2016), , Google Blog , Дата обращения: 11 января 2017 от 7 апреля 2017 на Wayback Machine
  2. Mike Schuster, Melvin Johnson, and Nikhil Thorat. . Google Research Blog (22 ноября 2016). Дата обращения: 11 января 2017. от 10 июля 2017 на Wayback Machine
  3. Gil Fewster (January 5, 2017), , freeCodeCamp , Дата обращения: 11 января 2017 от 31 мая 2017 на Wayback Machine
  4. Boitet, Christian; Blanchon, Hervé; Seligman, Mark; Bellynck, Valérie (PDF) (2010). Дата обращения: 1 декабря 2016. Архивировано из 29 марта 2017 года.
  5. Robert D. Hof. Technology Review (14 августа 2014). Дата обращения: 11 января 2017. 8 января 2020 года.
  6. Jeff Dean and Andrew Ng. Official Google Blog (26 июня 2012). Дата обращения: 26 января 2015. 23 августа 2020 года.
  7. . Дата обращения: 25 октября 2015. 16 февраля 2019 года.
  8. . New York Times (25 июня 2012). Дата обращения: 11 февраля 2014. 9 мая 2017 года.
  9. Katyanna Quach (November 17, 2016), , Дата обращения: 11 января 2017 от 22 сентября 2017 на Wayback Machine
  10. Lewis-Kraus, Gideon (2016-12-14). . The New York Times . из оригинала 5 мая 2017 . Дата обращения: 11 января 2017 .
  11. Le, Quoc; Schuster, Mike . Google Research Blog . Google (27 сентября 2016). Дата обращения: 1 декабря 2016. 7 мая 2018 года.
  12. от 29 апреля 2017 на Wayback Machine , October 22, 2007
  13. Barry Schwartz. . Search Engine Land (23 октября 2007). Дата обращения: 4 мая 2017. 21 мая 2017 года.
  14. Chris McDonald (January 7, 2017), , Дата обращения: 11 января 2017 от 22 июня 2017 на Wayback Machine
  15. Turovsky, Barak . The Keyword Google Blog . Google (15 ноября 2016). Дата обращения: 1 декабря 2016. 14 апреля 2020 года.
  16. Turovsky, Barak . The Keyword Google Blog . Google. Дата обращения: 6 марта 2017. 7 марта 2017 года.
  17. Novet, Jordan . VentureBeat (30 марта 2017). 1 января 2020 года.
  18. Turovsky, Barak . The Keyword (25 апреля 2017). 11 ноября 2020 года.
  19. . Google Cloud Platform (4 мая 2017). 16 сентября 2017 года.

Ссылки

  • от 24 июня 2010 на Wayback Machine
  • от 1 апреля 2019 на Wayback Machine от Джона Хатчинса. Электронное хранилище (и библиография) статей, книг и статей в области машинного перевода и технологии компьютерного перевода
  • от 14 апреля 2008 на Wayback Machine – публикации Джона Хатчинса (включают в себя PDF нескольких книг про машинный перевод)
Источник —

Same as Нейронный машинный перевод Google