Interested Article - Обработка естественного языка

Обработка текстов на естественном языке ( Natural Language Processing, NLP ) — общее направление искусственного интеллекта и математической лингвистики . Оно изучает проблемы компьютерного анализа и синтеза текстов на естественных языках . Применительно к искусственному интеллекту анализ означает понимание языка, а синтез — генерацию грамотного текста .

Задачи и ограничения

Теоретически, построение естественно-языкового интерфейса для компьютеров — очень привлекательная цель. Ранние системы, такие как SHRDLU , работая с ограниченным «миром кубиков» и используя ограниченный словарный запас, выглядели чрезвычайно хорошо, вдохновляя этим своих создателей. Однако оптимизм быстро иссяк, когда эти системы столкнулись со сложностью и неоднозначностью реального мира.

Понимание естественного языка иногда считают ^{[

кто?

]} AI-полной задачей, потому как распознавание живого языка требует огромных знаний системы об окружающем мире и возможности с ним взаимодействовать. Само определение смысла слова « понимать » — одна из главных задач искусственного интеллекта ^{[

источник не указан 645 дней

]} .

Сложности понимания

В русском языке

Качество понимания зависит от множества факторов: от языка, от национальной культуры, от самого собеседника и т. д. Вот некоторые примеры сложностей, с которыми сталкиваются системы понимания текстов.

Сложности с раскрытием анафор (распознаванием, что имеется в виду при использовании местоимений): предложения «Мы отдали бананы обезьянам, потому что они были голодные» и «Мы отдали бананы обезьянам, потому что они были перезрелые» похожи по синтаксической структуре. В одном из них местоимение они относится к обезьянам, а в другом — к бананам. Правильное понимание зависит от знаний компьютера, какими могут быть бананы и обезьяны.
может привести к совершенно иному толкованию фразы: «Бытие определяет сознание» — что определяет что?
В русском языке свободный порядок компенсируется развитой морфологией , служебными словами и знаками препинания , но в большинстве случаев для компьютера это представляет дополнительную проблему.
В речи могут встретиться неологизмы , например, глагол «Пятидесятирублируй» — то есть высылай 50 рублей. Система должна уметь отличать такие случаи от опечаток и правильно их понимать.
Правильное понимание омонимов — ещё одна проблема. При распознавании речи , помимо прочих, возникает проблема фонетических омонимов. Во фразе «Серый волк в глухом лесу встретил рыжую лису » выделенные слова слышатся одинаково, и без знания, кто глухой, а кто рыжий, не обойтись (кроме того, что лиса может быть рыжей, а лес — глухим, лес также может быть рыжим (характеристика, в данном случае обозначающая преобладающий цвет листвы в лесу), в то время как лиса может быть глухой, что порождает дополнительную проблему, вытекающую из предыдущей, хотя и отчасти компенсируется морфологией — у прилагательных в данном предложении род явно разный).

Классификация задач

Программное обеспечение

General Architecture for Text Engineering (GATE)
Modular Audio Recognition Framework
Natural Language Toolkit (NLTK)

См. также

Примечания

Shervin Minaee, Nal Kalchbrenner, Erik Cambria, Narjes Nikzad, Meysam Chenaghlu. // arXiv:2004.03705 [cs, stat]. — 2020-04-05. 24 июня 2020 года.
Tom Young, Devamanyu Hazarika, Soujanya Poria, Erik Cambria. // arXiv:1708.02709 [cs]. — 2018-11-24. 6 мая 2020 года.
Prof. Jason Eisner. (англ.) . Дата обращения: 7 мая 2020. 13 мая 2020 года.

Ссылки

[1] Shervin Minaee, Nal Kalchbrenner, Erik Cambria, Narjes Nikzad, Meysam Chenaghlu. // arXiv:2004.03705 [cs, stat]. — 2020-04-05. 24 июня 2020 года.

[2] Tom Young, Devamanyu Hazarika, Soujanya Poria, Erik Cambria. // arXiv:1708.02709 [cs]. — 2018-11-24. 6 мая 2020 года.

[3] Prof. Jason Eisner. (англ.) . Дата обращения: 7 мая 2020. 13 мая 2020 года.

Ссылки на внешние ресурсы
Словари и энциклопедии
В библиографических каталогах	J9U : LCCN : NDL : NKC :


Общие определения	Языковая модель Корпус текстов Речевой корпус Стоп-слова Мешок слов AI-полнота N-грамма Биграммный шифр Триграмма
Анализ текста	Частеречная разметка Поверхностно-синтаксический анализ Стемминг Лемматизация Разрешение кореферентности Анализ тональности текста Синтаксический анализ Разрешение лексической многозначности Извлечение информации Идентификация языка
Реферирование
Машинный перевод	Автоматизированный Гибридный На основе правил На основе примеров На основе трансформации Нейронный Статистический Синхронный
Идентификация и сбор данных	Распознавание речи Синтез речи Оптическое распознавание символов Генерация текста
Тематическая модель	Размещение патинко Латентное размещение Дирихле Латентно-семантический анализ
	Конкордансер Предиктивный ввод текста Система проверки правописания
	Виртуальный ассистент Виртуальный собеседник Вопросно-ответная система Голосовой интерфейс Интерактивная литература

Искусственный интеллект
История	История искусственного интеллекта Зима искусственного интеллекта Дартмутский семинар
Философия	Тест Тьюринга Китайская комната Сильный и слабый искусственные интеллекты Дружественный искусственный интеллект Этика искусственного интеллекта Проблема контроля
Направления	Агентный подход Адаптивное управление Инженерия знаний Модель жизнеспособной системы Машинное обучение Нейронная сеть Нечёткая логика Распознавание образов Роевой интеллект Символический ИИ Эволюционные алгоритмы Экспертная система
Применение	Голосовое управление Задача классификации Классификация документов Кластеризация документов Кластерный анализ Локальный поиск Машинный перевод Оптическое распознавание символов Распознавание речи Распознавание рукописного ввода Игровой ИИ
Исследователи	Чарлз Бэббидж Владимир Вапник Джозеф Вейценбаум Норберт Винер Виктор Глушков Владимир Городецкий Ян Лекун Алексей Ляпунов Джон Маккарти Марвин Мински Аллен Ньюэлл Сеймур Пейперт Джуда Перл Гермоген Поспелов Дмитрий Поспелов Фрэнк Розенблатт Герберт Александер Саймон Алан Тьюринг Патрик Уинстон Виктор Финн Сергей Фомин Демис Хассабис Джеффри Хинтон Ноам Хомский Клод Шеннон Эндрю Ын Элиезер Юдковский

Interested Article - Обработка естественного языка

Содержание

Задачи и ограничения

Сложности понимания

В русском языке

Классификация задач

Программное обеспечение

См. также

Примечания

Ссылки

Same as Обработка естественного языка

Обработка естественного языка

Угол естественного откоса

The title for the last searches