Interested Article - DALL-E

DALL-E — нейронная сеть НКО OpenAI , созданная при финансовой поддержке Microsoft , способная генерировать высококачественные изображения, исходя из текстовых описаний на английском языке . По заявлениям ряда СМИ и экспертов в области анализа данных, данная нейронная сеть совершила значимый прорыв в области нейронных сетей .

История

Нейронная сеть DALL-E начала разрабатываться в 2018 году. В 2019 году OpenAI получила грант в 1 млрд $ от компании Microsoft на разработку инновационных технологий в сфере искусственного интеллекта . Первая версия нейросети была представлена сообществу 5 января 2021 года .

6 апреля 2022 года была анонсирована DALL-E 2 . В новой версии программы были доработаны алгоритмы, позволяющие создавать фотореалистичные изображения, а также редактор, позволяющий вносить правки во время работы приложения . Пример работы нейронной сети продемонстрировал журнал Cosmopolitan , который использовал DALL-E 2 для создания обложки для одного из выпусков своего журнала .

21 сентября 2023 года OpenAI представила DALL-E 3, которая будет интегрирована с ChatGPT и сможет лучше понимать запросы и генерировать более детальные изображения. Версия станет доступна в октябре в рамках платных подписок ChatGPT Plus и Enterprise через API .

Архитектура

DALL-E использует 12-миллиардную модель GPT-3 для интерпретации данных и генерации на их основании изображения . Сама модель GPT-3 была разработана OpenAI ещё в 2018 году на основе архитектуры глубоких нейронных сетей Трансформер . Таким образом, DALL-E представляет собой мультимодальную реализацию GPT-3 с 12 миллиардами параметров, обучаемая через интернет .

Так, DALL-E сначала генерирует изображения в ответ на запрос, а CLIP (Contrastive Language-Image Pre-training), как отдельная модель, «осознаёт» и ранжирует полученные изображения . Сам CLIP был обучен на 400 миллионах пар изображений и текста, благодаря чему модель более-менее успешно определяет наиболее успешно подходящие изображения по запросу и публикует имеющиеся изображения по степени их схожести с текстовым описанием .

Описание и характеристики

DALL-E способна генерировать изображения в самых разных визуализациях — от фотореализма до картин и эмодзи, передвигая и видоизменяя объекты на своих изображениях . Одна из способностей, отмеченная его создателями, заключалась в правильном размещении элементов дизайна в новых композициях без явных указаний: «Например, когда его попросили нарисовать Редис Дайкон, сморкающийся, потягивающий латте или катающийся на одноколёсном велосипеде, DALL·E часто рисует платок, руки и ноги в правдоподобных местах» . Факт реализма и прорыва в сфере ИИ отмечали различные авторитетные издания — , NBC , Nature , Wired , CNN и BBC . Особенно интересно для специалистов стал тот факт, что ИИ получил некоторые навыки визуального мышления, позволившие оному пройти тест Рейвена , созданный для оценки интеллекта людей .

DALL-E характеризуется как устойчивая и крайне надёжная нейронная сеть для создания изображений различного плана . Сэм Шхед в репортаже для CNBC назвал изображения «интересными» и процитировал Нила Лоуренса, профессора машинного обучения Кембриджского университета, который назвал это «вдохновляющей демонстрацией способности этих моделей хранить информацию о нашем мире и обобщать его способами, которые для людей естественны». Шхед также процитировал Марка Ридла, доцента Технической школы интерактивных вычислений Джорджии, который сказал, что результаты демонстрации DALL-E показали, что он способен «согласованно сочетать концепции», и что «демоверсия DALL-E примечательна созданием иллюстраций, которые гораздо более связны, чем другие системы Text2Image, которые я видел за последние несколько лет» . BBC также цитирует Ридля, который сказал, что он был «впечатлён тем, что система могла сделать» .

Примечания

↑ (англ.) . OpenAI (22 июня 2019). Дата обращения: 4 июля 2022. 7 ноября 2020 года.
Nicolás Rivero. (англ.) . QUARTZ (11 июня 2022). Дата обращения: 4 июля 2022. 5 июля 2022 года.
↑ . vc.ru (7 апреля 2022). Дата обращения: 4 июля 2022. 5 июля 2022 года.
↑ Will Douglas Heaven. (англ.) . MIT Technology Review (5 января 2021). Дата обращения: 4 июля 2022. 5 января 2021 года.
↑ Coldewey, Devin. (англ.) . TechCrunch (5 января 2021). Дата обращения: 4 июля 2022. 6 января 2021 года.
Jordan Novet. (англ.) . CNBC (18 июня 2022). Дата обращения: 4 июля 2022. 5 июля 2022 года.
Gary Marcus, Ernest Davis, Scott Aaronson. (англ.) // Cornell University. — 2022. — doi : . 5 июля 2022 года.
↑ Jeremy Kahn. (англ.) . Fortune (6 апреля 2022). Дата обращения: 4 июля 2022. 10 апреля 2022 года.
Hope Corrigan. (англ.) . PC Gamer (1 июля 2022). Дата обращения: 4 июля 2022. 5 июля 2022 года.
Gloria Liu. (англ.) . Cosmopolitan (21 июня 2022). Дата обращения: 4 июля 2022. 3 июля 2022 года.
. Коммерсантъ (29 сентября 2023). Дата обращения: 25 сентября 2023.
↑ Khari Johnson. (англ.) . VentureBeat (5 января 2021). Дата обращения: 4 июля 2022. 5 января 2021 года.
Radford, Alec; Narasimhan, Karthik; Salimans, Tim; Sutskever, Ilya. (англ.) // OpenAI . — 2018. 5 февраля 2021 года.
S. Dent. (англ.) . Engadget (6 января 2021). Дата обращения: 4 июля 2022. 27 января 2021 года.
Thom Dunn. (англ.) . BoingBoing (10 февраля 2021). Дата обращения: 4 июля 2022. 22 февраля 2021 года.
Mehreen Kasana. (англ.) . (1 июля 2021). Дата обращения: 4 июля 2022. 29 января 2021 года.
Melanie Ehrenkranz. (англ.) . NBC (28 января 2021). Дата обращения: 4 июля 2022. 20 февраля 2021 года.
Emma Stoye. (англ.) . Nature (5 февраля 2021). Дата обращения: 4 июля 2022. 8 марта 2021 года.
Will Knight. (англ.) . Wired (26 января 2021). Дата обращения: 4 июля 2022. 21 февраля 2021 года.
Rachel Metz. (англ.) . CNN (8 января 2021). Дата обращения: 4 июля 2022. 1 июля 2022 года.
↑ Jane Wakefield. (англ.) . BBC (6 января 2021). Дата обращения: 4 июля 2022. 2 марта 2021 года.
Markowitz, Dale. (англ.) . TheNextWeb (23 февраля 2021). Дата обращения: 4 июля 2022. 23 февраля 2021 года.
Sam Shead. (англ.) . CNBC (8 января 2021). Дата обращения: 4 июля 2022. 16 июля 2022 года.

Литература

Jens Knappe: Genesis. A Creation Story in Cooperation with an Artificial Intelligence, Berlin 2022, ISBN 978-3-940948-45-8 .

[:0-2] (англ.) . OpenAI (22 июня 2019). Дата обращения: 4 июля 2022. 7 ноября 2020 года.

[3] Nicolás Rivero. (англ.) . QUARTZ (11 июня 2022). Дата обращения: 4 июля 2022. 5 июля 2022 года.

[:1-4] . vc.ru (7 апреля 2022). Дата обращения: 4 июля 2022. 5 июля 2022 года.

[:2-5] Will Douglas Heaven. (англ.) . MIT Technology Review (5 января 2021). Дата обращения: 4 июля 2022. 5 января 2021 года.

[:3-6] Coldewey, Devin. (англ.) . TechCrunch (5 января 2021). Дата обращения: 4 июля 2022. 6 января 2021 года.

[7] Jordan Novet. (англ.) . CNBC (18 июня 2022). Дата обращения: 4 июля 2022. 5 июля 2022 года.

[8] Gary Marcus, Ernest Davis, Scott Aaronson. (англ.) // Cornell University. — 2022. — doi : . 5 июля 2022 года.

[:5-9] Jeremy Kahn. (англ.) . Fortune (6 апреля 2022). Дата обращения: 4 июля 2022. 10 апреля 2022 года.

[10] Hope Corrigan. (англ.) . PC Gamer (1 июля 2022). Дата обращения: 4 июля 2022. 5 июля 2022 года.

[11] Gloria Liu. (англ.) . Cosmopolitan (21 июня 2022). Дата обращения: 4 июля 2022. 3 июля 2022 года.

[12] . Коммерсантъ (29 сентября 2023). Дата обращения: 25 сентября 2023.

[:4-13] Khari Johnson. (англ.) . VentureBeat (5 января 2021). Дата обращения: 4 июля 2022. 5 января 2021 года.

[14] Radford, Alec; Narasimhan, Karthik; Salimans, Tim; Sutskever, Ilya. (англ.) // OpenAI . — 2018. 5 февраля 2021 года.

[15] S. Dent. (англ.) . Engadget (6 января 2021). Дата обращения: 4 июля 2022. 27 января 2021 года.

[16] Thom Dunn. (англ.) . BoingBoing (10 февраля 2021). Дата обращения: 4 июля 2022. 22 февраля 2021 года.

[17] Mehreen Kasana. (англ.) . (1 июля 2021). Дата обращения: 4 июля 2022. 29 января 2021 года.

[18] Melanie Ehrenkranz. (англ.) . NBC (28 января 2021). Дата обращения: 4 июля 2022. 20 февраля 2021 года.

[19] Emma Stoye. (англ.) . Nature (5 февраля 2021). Дата обращения: 4 июля 2022. 8 марта 2021 года.

[20] Will Knight. (англ.) . Wired (26 января 2021). Дата обращения: 4 июля 2022. 21 февраля 2021 года.

[21] Rachel Metz. (англ.) . CNN (8 января 2021). Дата обращения: 4 июля 2022. 1 июля 2022 года.

[:6-22] Jane Wakefield. (англ.) . BBC (6 января 2021). Дата обращения: 4 июля 2022. 2 марта 2021 года.

[23] Markowitz, Dale. (англ.) . TheNextWeb (23 февраля 2021). Дата обращения: 4 июля 2022. 23 февраля 2021 года.

[24] Sam Shead. (англ.) . CNBC (8 января 2021). Дата обращения: 4 июля 2022. 16 июля 2022 года.

Обработка естественного языка
Общие определения	Языковая модель Корпус текстов Речевой корпус Стоп-слова Мешок слов AI-полнота N-грамма Биграммный шифр Триграмма
Анализ текста	Частеречная разметка Поверхностно-синтаксический анализ Стемминг Лемматизация Разрешение кореферентности Анализ тональности текста Синтаксический анализ Разрешение лексической многозначности Извлечение информации Идентификация языка
Реферирование
Машинный перевод	Автоматизированный Гибридный На основе правил На основе примеров На основе трансформации Нейронный Статистический Синхронный
Идентификация и сбор данных	Распознавание речи Синтез речи Оптическое распознавание символов Генерация текста
Тематическая модель	Размещение патинко Латентное размещение Дирихле Латентно-семантический анализ
	Конкордансер Предиктивный ввод текста Система проверки правописания
	Виртуальный ассистент Виртуальный собеседник Вопросно-ответная система Голосовой интерфейс Интерактивная литература

Искусственный интеллект
История	История искусственного интеллекта Зима искусственного интеллекта Дартмутский семинар
Философия	Тест Тьюринга Китайская комната Сильный и слабый искусственные интеллекты Дружественный искусственный интеллект Этика искусственного интеллекта Проблема контроля
Направления	Агентный подход Адаптивное управление Инженерия знаний Модель жизнеспособной системы Машинное обучение Нейронная сеть Нечёткая логика Обработка естественного языка Распознавание образов Роевой интеллект Символический ИИ Эволюционные алгоритмы Экспертная система
Применение	Голосовое управление Задача классификации Классификация документов Кластеризация документов Кластерный анализ Локальный поиск Машинный перевод Оптическое распознавание символов Распознавание речи Распознавание рукописного ввода Игровой ИИ
Исследователи	Чарлз Бэббидж Владимир Вапник Джозеф Вейценбаум Норберт Винер Виктор Глушков Владимир Городецкий Ян Лекун Алексей Ляпунов Джон Маккарти Марвин Мински Аллен Ньюэлл Сеймур Пейперт Джуда Перл Гермоген Поспелов Дмитрий Поспелов Фрэнк Розенблатт Герберт Александер Саймон Алан Тьюринг Патрик Уинстон Виктор Финн Сергей Фомин Демис Хассабис Джеффри Хинтон Ноам Хомский Клод Шеннон Эндрю Ын Элиезер Юдковский

Машинное обучение и data mining
Задачи	Задача классификации Обучение без учителя Обучение с частичным привлечением учителя Регрессионный анализ AutoML Ассоциативные правила Выделение признаков Обучение признакам Обучение ранжированию Грамматический вывод Онлайновое обучение
Обучение с учителем	Метод k-ближайших соседей Наивный байесовский классификатор Дерево решений Метод опорных векторов Линейная регрессия Логистическая регрессия Перцептрон Ансамблевое обучение Бэггинг Бустинг Random forest Метод релевантных векторов
Кластерный анализ	Метод k-средних Метод нечёткой кластеризации Иерархическая кластеризация EM-алгоритм BIRCH CURE DBSCAN OPTICS Mean-shift
Снижение размерности	Факторный анализ Метод главных компонент CCA ICA LDA Неотрицательное матричное разложение t-SNE
Структурное прогнозирование	Графовая вероятностная модель Байесовская сеть Скрытая марковская модель
Выявление аномалий	Метод k-ближайших соседей Локальный уровень выброса
Графовые вероятностные модели	Байесовская сеть Марковская сеть Скрытая марковская модель
Нейронные сети	Ограниченная машина Больцмана Самоорганизующаяся карта Функция активации Сигмоида Softmax Радиально-базисная функция Метод обратного распространения ошибки Глубокое обучение Многослойный перцептрон Рекуррентная нейронная сеть Долгая краткосрочная память Управляемый рекуррентный блок Свёрточная нейронная сеть U-Net Автокодировщик
Обучение с подкреплением	Марковский процесс Уравнение Беллмана Жадный алгоритм Q-обучение
Теория	Теория Вапника — Червоненкиса Дилемма смещения–дисперсии Теория вычислительного обучения Минимизация эмпирического риска Оккамово обучение PAC learning Статистическая теория обучения
Журналы и конференции	JMLR

Interested Article - DALL-E

Содержание

История

Архитектура

Описание и характеристики

Примечания

Литература

Люциниды

Двустворчатые

Same as DALL-E

Правительство Мелони

Галлетто, Диониджи

Арки (моллюски)

Трубачи (моллюски)

Список моллюсков Исландии

Люциниды

Dalla Dalla

Нукуланы

Dallara

Морские гребешки

Теллиниды

Далл’Олио, Паоло

Пять песен

Венериды

Dallara F191

Двустворчатые

Морские финики

Мета, Эрмал

Dallara F192

Бёрч, Сесил Реджинальд

Финал чемпионата мира по футболу 2010

Талалай, Михаил Григорьевич

Poison (группа)

Штейнегер, Леонард

The title for the last searches