Индекс потребительских цен
- 1 year ago
- 0
- 0
Индекс удобочитаемости — мера определения сложности восприятия текста читателем. Индекс удобочитаемости может вычисляться на основе нескольких параметров: длины предложений, слов, удельного количества наиболее частотных (или редких) слов и т. д.
Наиболее популярная мера была создана , изначально для английского языка . Она оценивает сложность текста по следующей формуле
или
где:
Индекс по шкале FRES ( англ. Flesch reading ease scale ) распределяется таким образом:
Для английского языка значение 90—100 соответствует лёгкому тексту для младших школьников, 60—70 — тексту, который могут читать выпускники школы, тексты с индексом 0—30 предназначены для людей с высшим образованием.
В связи с тем, что в русском языке средняя длина предложения меньше (за счёт меньшего использования служебных слов, таких как артикли или вспомогательные глаголы ), а слова в среднем длиннее, было предпринято несколько попыток разработать специфическую для русского языка версию меры, например, путём подгонки коэффициентов при сравнении индексов, полученных для оригинальных английских текстов и их переводов. Ниже представлен один из вариантов такой адаптации :
В целом, большинство методов оценки сложности текста на основе индексов удобочитаемости для информационно-аналитических документов на русском языке дают оценки, выходящие как за интерпретируемый диапазон значений, так и за эталонные значения. При этом получаемые результаты характеризуются высокой степенью корреляции, так как разработчики используют одну математическую модель линейной регрессии, а также однообразные параметры текста (средняя длина слова, средняя длина предложения). При этом индексы удобочитаемости не адаптированы к тестам для взрослых. У профессионала не должно возникать затруднений с пониманием многосложных слов. В конечном итоге фактором сложности выступает семантика текста и абстрактность его изложения. Индикаторы на основе индексов удобочитаемости недостаточно хорошо интерпретируются, поскольку не могут напрямую быть использованы для прогнозирования времени обработки текста тем или иным человеком .