Interested Article - Вебометрика
- 2020-08-10
- 1
Вебоме́трика ( англ. webometrics ) — это раздел информатики , в рамках которого исследуются количественные аспекты конструирования и использования информационных ресурсов, структур и технологий применительно к Всемирной паутине .
Термин введён Томасом Алминдом ( Tomas C. Almind ) и Петером Ингверсеном ( Peter Ingwersen ) в 1997 году в работе Informetric analyses on the World Wide Web: Methodological approaches to «webometrics» .
Вебометрика является составляющей инфометрии
.С середины 90-х компания занимается вебометрическими исследованиями и ранжированием веб-сайтов университетов мира
.Вебометрика включает в себя четыре основных направления исследований:
- Разработка и использование веб-индикаторов ( индексы цитирования , наблюдаемость сайтов)
- Анализ социальных феноменов в Веб ( социальные сети , сообщества сайтов)
- Сбор данных о Веб ( роботы , краулеры , поисковые машины , информационный поиск )
- Анализ гиперссылок (в частности, связи между сайтами вузов и научных организаций)
Вебометрика как составляющая инфометрии
Вебометрика является одной из составляющих инфометрии. Кроме того, вебометрика связана с библиометрией и в определённой степени пересекается с наукометрией .
Инфометрия — научная дисциплина, предметом которой являются количественные измерения хранимой и используемой информации .
Библиометрия — научная дисциплина, занимающаяся изучением документов на основе количественного анализа первичных и вторичных источников информации с помощью формализованных методов с целью получения данных об эффективности, динамике, структуре и закономерностях развития исследуемых областей .
Наукометрия — научная дисциплина, занимающаяся изучением количественных методов развития науки как информационного процесса .
— научная дисциплина , занимающаяся количественным анализом новых возможностей по обработке информации, хранимой в электронном виде, и её визуализации .
Направления вебометрики
Ранжирование веб-сайтов вузов и научно-исследовательских институтов мира
Испанская лаборатория Cybermetrics Lab разработала методологию ранжирования веб-ресурсов вузов и научно-исследовательских институтов.
В соответствии с данной методологией строится алгоритм ранжирования сайтов на основе четырёх индикаторов :
Индикатор | Аббревиатура | Значение | Поисковые машины |
---|---|---|---|
Visibility | V | Количество ссылок с других сайтов | Google, Yahoo, Live Search и Exalead |
Size | S | Общее количество страниц сайта | Yahoo Search, Live Search и Exalead |
Rich files | R | Количество полноценных текстовых файлов | |
Scholar | Sc | Количество размещенных на сайте статей и их цитирований | Google Scholar |
Алгоритм ранжирования сайтов
Ранжирование сайтов происходит по следующему алгоритму:
- Подсчет значений индикаторов
- Упорядочивание сайтов по убыванию значений соответствующих индикаторов. Для обозначения ранга (или позиции) сайта используются следующие обозначения: RankV для Visibility , RankS для Size , RankR для Rich files , RankSc для Scholar
- Расчет вебометрического ранга (Webometrics Rank — WR)
Критика методологии ранжирования лаборатории Cybermetrics Lab
В работе метода ранжирования веб-сайтов, предложенного лабораторией Cybermetrics Lab, наблюдается ряд недостатоков :
- В методе не учитывается, что учебные учреждения могут поддерживать множество различных доменных областей;
- Не производится учёт веб-ресурсов подразделений учебных учреждений;
- Если на сайте присутствует неакадемическая информация, то она также будет учитываться при составлении индикаторов.
Анализ гиперссылок
Входящие ссылки — количество веб-страниц, ссылающихся на данную веб-страницу или на данный веб-сайт . Данный индикатор используется в качестве показателя значимости некоторой веб-страницы алгоритмами PageRank и HITS . Эти алгоритмы основываются на нахождении страниц релевантных поисковому запросу и на дальнейшим ранжировании полученного списка с учётом входящих ссылок. Страницы с наибольшим количеством входящих ссылок имеют более высокий ранг. Далее происходит упорядочивание списка веб-страниц с учётом их ранга.
Некоторые гиперссылки могут создаваться только с целью навигации между сайтами. Такие гиперссылки должны игнорироваться, так как они не определяют значимость целевой веб-страницы. Кроме того на некоторых сайтах может происходить множественное повторение одних и тех же ссылок. В данном случае следует учитывать только одну входящую ссылку и игнорировать все остальные.
Вебометрика в России
Поскольку методология ранжирования веб-ресурсов, предложенная Cybermetrics Lab, обладает рядом недостатков и к тому же не использует российские поисковые машины (например, Яндекс ), в России разрабатываются проекты по созданию собственных вебометрических рейтингов научных учреждений, избавленных от вышеперечисленных недостатков.
Институт прикладных математических исследований КарНЦ РАН
Под руководством Печникова Андрея Анатольевича был создан . В данном проекте задействованы только официальные сайты научных учреждений России. За основу ранжирования взята методология, предложенная Cybermetrics Lab, но учитывающая использование российской поисковой системы Яндекс и краулера BeeCrawler . Используемая методология ранжирования сайтов описана в работе «О рейтинге официальных сайтов научных учреждений Северо-Запада России» .
Институт вычислительных технологий СО РАН
Одним из проектов данного института является создание , под руководством Ю. И. Шокина . Для расчета количества внешних ссылок (V) и количества страниц на сайте (S) помимо поисковых систем Google и Яндекс используется также Bing . Для нахождения результирующего значения V и S находится среднее арифметическое. Для нахождения индекса цитирования (Sc) используются системы Google Scholar и Индекс цитирования Яндекса. Используемая методология ранжирования сайтов описана в работе «Рейтинг сайтов научных организаций СО РАН» .
Институт научной и педагогической информации РАО
Под руководством, д.т.н А. Б. Антопольского был создан . В качестве источников перечня анализируемых web-ресурсов используются официальные перечни учреждений, размещенные на порталах государственных академий и перечень аккредитованных образовательных учреждений . Для формирования индекса используются основные вебометрические показатели . Показатели V, S и R основываются на результатах работы поисковых систем Google и Яндекс, а показатель Sc вычисляется на основе Цитируемости учреждения по . Используемая методология ранжирования сайтов описана в работе «Измерение присутствия в Интернете образовательных учреждений» .
Дальневосточный геологический институт
предназначен для анализа сайтов научных организаций Дальневосточного Отделения РАН, Отделения Наук о Земле РАН и других научных сайтов. Сервис был создан под руководством . Для расчета основных вебометрических показателей используются поисковые системы Google, Яндекс, Bing и Yahoo . Для расчета вебометрического ранга используется следующая формула:
Используемая методология ранжирования сайтов описана в работе «Информационное пространство Дальневосточного отделения РАН» .
Сибирский федеральный университет
предоставляет вузам наиболее полные актуальные сведения о состоянии их сайтов с точки зрения вебометрики. Для этого производится еженедельное обновление рейтинга и сохранение истории изменений индикаторов. Методика расчёта рейтинга аналогична методике лаборатории Cybermetrics Lab. Расчет вебометрического ранга производится по следующей формуле :
Сравнение методов построения вебометрического индекса
Вычисление основных вебометрических параметров может основываться на результатах различных поисковых систем. Далее представлена сравнительная таблица использования поисковых систем каждым из приведенных выше институтов и количества обработанных ими веб-ресурсов.
Институт | Visibility | Size | Rich files | Scholar | Кол-во обработанных веб-ресурсов |
---|---|---|---|---|---|
Институт прикладных математических исследований КарНЦ РАН | Google, BeeCrawler | Яндекс, Google, BeeCrawler | Яндекс, Google | Google Scholar | 343 (2013 год) |
Институт вычислительных технологий СО РАН | Яндекс, Google, Bing | Яндекс, Google, Bing | Яндекс, Google | Индекс цитирования Яндекса, Google Scholar | 94 (2013 год) |
Яндекс, Google | Яндекс, Google | Яндекс, Google | Цитируемость учреждения по РИНЦ | 1843 (2012 год) | |
ДВО РАН | Google, Yandex, Bing, Yahoo | Google, Yandex, Bing, Yahoo | Google, Yandex, Bing, Yahoo | Google Scholar | 121 (2013 год) |
СФУ | Majestic SEO | Google Scholar | 657 (2013 год) |
См. также
Примечания
- ↑ , p. 2.
- .
- , p. 3.
- ↑ .
- .
- .
- ↑ , p. 25.
- , p. 189.
- , p. 26.
- Печников А. А. от 26 февраля 2021 на Wayback Machine // Современные проблемы науки и образования. № 3. 2014.
- .
- .
- .
- .
- .
- .
- , p. 117.
- .
- .
- от 2 декабря 2013 на Wayback Machine
- . Дата обращения: 24 сентября 2018. 24 сентября 2018 года.
- . Дата обращения: 16 ноября 2013. 18 декабря 2013 года.
- от 16 ноября 2013 на Wayback Machine
- от 21 октября 2014 на Wayback Machine
- от 2 декабря 2013 на Wayback Machine
Литература
- Peter Ingwersen. . — Nancy (France), 2006.
- Tomas C. Almind, Peter Ingwersen. // Journal of documentation. — 1997. — Т. 53 , № 4 . — С. 404—426 .
- А.А. Пронин. . — 11-е изд. — Екатеринбург: Издательство Уральского университета, 2010. — С. 225—226. — ISBN 978-5-7996-0566-7 . (недоступная ссылка)
- В.В. Налимов. . — М. : Наука, 1969. — С. 12.
- Александр Беленький. . — КомпьютерПресс, 2009. — № 4 .
- В.В. Мазалов, А.А. Печников, А.В. Чирков, Ю.В. Чуйко. // Управление большими системами: сборник трудов. — Москва: Институт проблем управления им. В.А. Трапезникова РАН, 2010. — № 30—1 . — С. 187—196 . — ISSN .
- А.А. Печников, О.Г. Илюкевич. (рус.) // Информационные ресурсы России. — Москва: Российское энергетическое агентство Министерства энергетики Российской Федерации, 2008. — № 3 . — С. 25—28 . — ISSN .
- Mike Thelwall. . — University of Wolverhampton, 2013.
- Мазалов Владимир Викторович, Печников Андрей Анатольевич. // Управление большими системами: сборник трудов. — 2009. — № 24 . — С. 130—146 .
- Ю.И. Шокин, О.А. Клименко, Е.В. Рычкова, И.В. Шабальников. . — 2008.
- А.Б. Антопольский, Ю.Е. Поляк. // Проблемы современного образования. — 2012. — № 4 . — С. 117—131 . — ISSN .
- А.И. Ханчук, В.В. Наумов. // Вестник ДВО РАН. — 2009. — № 4 . — С. 122—129 . 23 октября 2014 года.
Ссылки
- (ноябрь 2013). Дата обращения: 16 ноября 2013. Архивировано из 10 июня 2015 года.
- (ноябрь 2013).
- (ноябрь 2013).
- . Ноябрь 2013 года.
- (ноябрь 2013). Архивировано из 21 октября 2014 года.
- 2020-08-10
- 1