Interested Article - YandexGPT

YandexGPT нейросеть семейства GPT от компании « Яндекс », которая может создавать и перерабатывать тексты, предлагать новые идеи и учитывать контекст беседы с пользователем.

Для обучения YandexGPT используется датасет , включающий в себя информацию из книг, журналов, газет и других открытых источников из интернета . Нейросеть может ошибаться в фактах и фантазировать, однако по мере обучения будет выдавать всё более точные ответы.

Где используется YandexGPT

YandexGPT 2 — технология, которая используется в различных продуктах для решения разных задач. Нейросеть интегрирована в виртуального помощника «Алису» и доступна в приложениях «Яндекс» и «Яндекс Старт», в « Яндекс Браузере », « Яндекс Станциях », а также в умных телевизорах с «Алисой».

YandexGPT работает на главной странице «Яндекса», в « Поиске » , « Маркете », « Лавке » , « Практикуме », «Учебнике», « Авто.ру » и других сервисах компании. Компания даёт бизнесу доступ к API нейросети через Yandex Cloud и разрабатывает собственные В2В-решения на её основе.

С июля 2023 года 800 компаний приняли участие в закрытом тестировании YandexGPT . ИТ‑разработчики , банки, ритейл и компании других отраслей могут использовать технологию в двух режимах: API и Playground (интерфейс в консоли Yandex Cloud для тестирования модели и проверки гипотез) .

Бизнесу доступны две версии модели: одна работает в асинхронном режиме и лучше справляется с решением сложных задач, а вторая подходит для создания быстрых ответов в режиме реального времени. В результате YandexGPT испытали в десятках сценариев: для контентных задач, техподдержки , создания чат‑ботов , виртуальных ассистентов и т.д.

История

В феврале 2023 года «Яндекс» сообщил, что разрабатывает собственную версию генеративной нейросети ChatGPT в рамках развития языковой модели из семейства YaLM (Yet another Language Model) . Проект получил предварительное название YaLM 2.0, которое впоследствии поменяли на YandexGPT.

17 мая компания представила нейросеть под названием YandexGPT (YaGPT), добавив в своего виртуального ассистента «Алису» специальный навык, позволяющий взаимодействовать с новой языковой моделью .

5 июня 2023 года в пресс-службе «Яндекса» сообщили, что нейросеть научилась запоминать контекст беседы и задавать уточняющие вопросы .

15 июня 2023 года «Яндекс» добавил языковую модель YandexGPT в приложение для генерации изображений « Шедеврум » . Благодаря этому его пользователи получили возможность создавать содержательные посты с текстом, заголовком и подходящей по смыслу иллюстрацией .

В июле 2023 года нейросеть YandexGPT стала доступна бизнесу для создания виртуальных ассистентов и чат-ботов, а также генерирования и структурирования текстовой информации.

27 июня в «Яндексе» сообщили, что нейросеть научилась тезисно пересказывать статьи из интернета. Функция работает с русскоязычными текстами и статьями из интернета объёмом до 30 тысяч знаков .

7 сентября 2023 года «Яндекс» представил на конференции Practical ML Conf новую версию языковой модели — YandexGPT 2 . По сравнению с предыдущей она способна решать больше видов задач, при этом качество её ответов улучшилось . По утверждению разработчиков, YandexGPT 2 отвечает на запросы пользователей лучше первой версии нейросети в 67 % случаев .

14 сентября 2023 года «Яндекс» начал тестировать YandexGPT для создания быстрых ответов на запросы в «Поиске» . Нейросеть в режиме реального времени находит несколько самых подходящих источников по запросу пользователя, делает краткую выжимку каждого из них, а затем выбирает наиболее полезный ответ из получившихся. Он отображается под поисковой строкой вместе со ссылкой на источник.

С  6 октября 2023 года YandexGPT может создавать краткие пересказы русскоязычных видеороликов в интернете . Она обобщает видео длиной от двух минут до четырёх часов, в которых есть речь .

Обучение Yandex GPT

Обучение проходит в несколько этапов:

1. Pretraining. Модель учит структуру языка и запоминает факты о мире. Ей подаются в обучение терабайты текста из интернета, книг и других общедоступных источников, отобранные с помощью поисковых моделей «Яндекса» и разбитые на небольшие фрагменты .

2. Fine-tuning. Эксперты оптимизируют миллиарды параметров модели, собирая большой датасет из сотен тысяч примеров максимально разнообразных задач с хорошими ответами.

Созданием качественных обучающих примеров занимаются AI-тренеры «Яндекса» . Это эксперты широкого круга гуманитарных профессий: журналисты, педагоги, филологи, редакторы, социологи, психологи, филологи . «Яндекс» стал первой в России компанией, которая начала нанимать и обучать таких специалистов.

3. Продуктовые доработки. Модели придают «человеческий характер», чтобы она могла отвечать на вопросы о себе и была более живой в общении .

Интересные факты

В октябре 2023 года YandexGPT 2 смогла сдать ЕГЭ по литературе на 55 баллов . При этом минимальный порог, необходимый для поступления в вуз, — 40 баллов. Это первый случай в России, когда искусственный интеллект успешно справился с ЕГЭ, ответив не только на вопросы тестов, но и выполнив творческие задания .

Для обучения YandexGPT используются суперкомпьютеры «Яндекса» .

Примечания

  1. . РБК Тренды . Дата обращения: 29 декабря 2023. 4 июня 2023 года.
  2. . Хабр (14 сентября 2023). Дата обращения: 29 декабря 2023. 14 января 2024 года.
  3. . Хабр (12 сентября 2023). Дата обращения: 29 декабря 2023. 14 января 2024 года.
  4. . Хабр (29 сентября 2023). Дата обращения: 29 декабря 2023. 14 января 2024 года.
  5. . Коммерсантъ (19 июня 2023). Дата обращения: 29 декабря 2023. 29 июня 2023 года.
  6. Кодачигов, Валерий . Известия (1 февраля 2023). Дата обращения: 29 декабря 2023. 4 июня 2023 года.
  7. . Forbes.ru (17 мая 2023). Дата обращения: 29 декабря 2023. 4 июня 2023 года.
  8. . Ведомости . из оригинала 10 июня 2023 . Дата обращения: 29 декабря 2023 .
  9. . 3DNews - Daily Digital Digest . Дата обращения: 29 декабря 2023. 14 января 2024 года.
  10. . Российская газета (15 июня 2023). Дата обращения: 29 декабря 2023. 17 июня 2023 года.
  11. . Коммерсантъ (27 июня 2023). Дата обращения: 29 декабря 2023. 27 июня 2023 года.
  12. . tass.ru . ТАСС. Дата обращения: 14 января 2024. 14 января 2024 года.
  13. . Компьютерра (8 сентября 2023). Дата обращения: 29 декабря 2023. 13 октября 2023 года.
  14. . 3DNews - Daily Digital Digest . Дата обращения: 29 декабря 2023. 28 октября 2023 года.
  15. . snob.ru . Дата обращения: 14 января 2024. 14 января 2024 года.
  16. . tass.ru . ТАСС. Дата обращения: 14 января 2024. 14 января 2024 года.
  17. . Российская газета (6 октября 2023). Дата обращения: 29 декабря 2023. 6 января 2024 года.
  18. . Хабр (5 июня 2023). Дата обращения: 29 декабря 2023. 5 января 2024 года.
  19. . Хабр (19 апреля 2023). Дата обращения: 29 декабря 2023. 14 января 2024 года.
  20. . Российская газета (18 мая 2023). Дата обращения: 29 декабря 2023. 4 июня 2023 года.
  21. BFM.ru . BFM.ru - деловой портал . Дата обращения: 29 декабря 2023. 14 января 2024 года.
  22. . Код Дурова (12 октября 2023). Дата обращения: 29 декабря 2023. 14 января 2024 года.
  23. . ТАСС . Дата обращения: 29 декабря 2023. 14 января 2024 года.

Ссылки

  • . Хабр (5 июня 2023). Дата обращения: 11 июня 2023.
Источник —

Same as YandexGPT