Interested Article - Ключевое слово
- 2021-08-15
- 1
- О термине из программирования см. Зарезервированное слово .
Ключевое слово — слово в тексте, способное в совокупности с другими ключевыми словами дать высокоуровневое описание содержания текстового документа, выявить его тематику. В вебе используется главным образом для поиска.
Набор ключевых слов близок к аннотации , плану и конспекту , которые тоже представляют документ с меньшей детализацией.
Когда используют термин «ключевое слово», подразумевают несколько близких, но не сводимых друг к другу понятий.
Ключевое слово в анализе текста
Ключевые слова в анализе текста (в том числе, при построении индекса в поисковых системах ) — особо важные, общепонятные, ёмкие и показательные для отдельно взятой культуры слова в тексте, набор которых может дать высокоуровневое описание его содержания для читателя, обеспечив компактное представление и хранение его смысла в памяти. Ключевые слова (КС) характеризуются тем, что:
- являются наиболее употребительными (частотными) наименованиями, обозначают признак предмета, состояние или действие;
- представлены значимой лексикой, достаточно обобщены по своей семантике (средней степени абстракции), стилистически нейтральны, не оценочны;
- связаны друг с другом сетью семантических связей, пересечения значений;
- более половины слов ядра тематического компонента состоит из ключевых слов, а минимальный набор КС приближается к инварианту содержания при их логическом упорядочивании;
- набор КС состоит из 5—15 или 8—10 слов, что соответствует объёму оперативной памяти человека;
- при слишком частом повторении КС в тексте поисковики могут расценить это как спам и не показывать данный ресурс в строке выдачи ;
- набор КС определяет контексты слов, обладающих максимальной предсказуемостью.
Извлечение ключевых слов
До настоящего времени не разработана последовательная методика обнаружения ключевых слов человеком. Отсюда вытекает и сложность разработки методов и алгоритмов извлечения КС для вычислительной техники. В современных алгоритмах извлечения КС можно выделить три последовательных этапа:
- Предобработка. Здесь могут быть реализованы такие вспомогательные процедуры как графематический анализ (токенизация текста, удаление разметки), морфологический разбор, лексическая нормализация (в том числе согласование синонимов), лемматизация ( стемминг ), частеречная разметка , удаление стоп-слов (служебной лексики) и так далее.
- Распознавание. Принятие решения о принадлежности того или иного слова-кандидата к множеству КС.
- Постобработка. Здесь может осуществляться усечение списка, его ранжирование и упорядочивание, визуализация методами когнитивной графики и так далее.
Совокупность методов автоматического извлечения КС классифицируют по нескольким основаниям:
- наличию элементов обучения и подходов к его реализации;
- типу математического аппарата системы распознавания, обусловленного формой информации представления признаков ключевых слов;
- типу используемых для реализации метода лингвистических ресурсов.
Ключевое слово в разметке веб-страниц
- В HTML для задания ключевых слов есть элементы HTML meta с атрибутом keywords . Такой путь задания ключевых слов открывает ещё больше возможностей для злоупотребления, поэтому некоторые поисковые системы используют этот тег как фактор для улучшения ранжирования страниц, а некоторые нет . Например, Google часто игнорирует ключевые слова в теге из-за слишком большого злоупотребления им в прошлом . Впрочем, их используют другие пользовательские агенты (например, веб-браузеры для поиска по закладкам ).
- В микроформатах XHTML ключевые слова , описывающие документ, представлены в виде списка ссылок , каждая из которых должна вести на страницу, содержащую список документов, также содержащих это ключевое слово. Таким образом, возможность злоупотреблений несколько уменьшается, поскольку каждая ссылка должна вести к реальному содержимому. Для таких ключевых слов чаще используются термины « теги », «метки», а на уровне кода реализуются они с помощью микроформата tag-rel.
Ключевые слова — это основной способ упорядочивания контента в фолксономиях .
История и влияние
До 2009 года метатег keywords был практически незаменим в области поискового продвижения . Многие SEO специалисты использовали его в неправильном формате и со временем он начал терять смысл, а результаты поиска зачастую не отвечали ожидаемому. 21 сентября 2009 года самая популярная Поисковая система Google заявила, что больше не будет учитывать данный метатег в результатах поиска.
Тем не менее некоторые поисковые системы всё ещё продолжают учитывать данный тег, хотя и не так, как ранее. Например, ПС Yandex ещё учитывает его при ранжировании поисковых результатов. Это хорошо видно в проводимом эксперименте от 8 мая 2021 на Wayback Machine .
См. также
- Метаданные
- Индексация в поисковых системах
- Полнотекстовый поиск
- Статистика запросов
- Облако ключевых слов
- Шумовые слова
Примечания
- Benny Alexander. (англ.) . — Macronimous.com, 2014-01-09. — P. 15. — 30 p.
- Simon Kloostra. (англ.) . — Apress, 2015-05-21. — P. 26. — 178 p. — ISBN 9781484211243 .
- Виктор Гаврюков. (рус.) // Скромный сеошник. — 2021. — 12 октября. 11 ноября 2021 года.
- (англ.) . Official Google Webmaster Central Blog. Дата обращения: 9 сентября 2019. 24 августа 2019 года.
- . Top-Bit (21 июня 2018). Дата обращения: 9 сентября 2019. 8 мая 2021 года.
Литература
- Ванюшкин А. С., Гращенко Л. А. // Новые информационные технологии в автоматизированных системах. — 2016. — № 19. — С. 85—93. от 27 сентября 2016 на Wayback Machine
- Корытная М. Л. Роль заголовка и ключевых слов в понимании художественного текста: Автореф. дис. … канд. филол. наук. — Тверь , 1996.
- Роднянский В. Л. О роли ключевых слов в понимании текста // Психолингвистические проблемы семантики и понимания текста. — Калинин, 1986. — С. 106—113.
- Сахарный Л. В., Штерн А. С. Набор ключевых слов как тип текста // Лексические аспекты в системе профессионально-ориентированного обучения иноязычной речевой деятельности. — Пермь: Пермский политехнический университет, 1988. — С. 34—51.
- Сахарный Л. В. Расположение ключевых слов в структуре развернутого текста (к изучению деривационных механизмов компрессии текста) // Деривация в речевой деятельности (Общие вопросы. Текст. Семантика ). — Пермь, 1988. — С. 27—29.
- Сиротко-Сибирский С. А. Смысловое содержание текста и его отражение в ключевых словах (на материале русских текстов публицистического стиля): Автореф. дис. … канд. филол. наук. — Л. , 1988.
- 2021-08-15
- 1