Interested Article - Академия Google

Академия Google ( англ. Google Scholar ) — бесплатная поисковая система по научным публикациям, запущенная в ноябре 2004 года по инициативе инженеров Google Алекса Верстака и . С помощью поисковых роботов портал индексирует метаданные и осуществляет полнотекстовый поиск по научной литературе, включая журнальные статьи, препринты , диссертации, книги и технические отчёты. Пользователи могут искать нужные работы по авторам, ключевым словам, названию журнала. Углублённый поиск позволяет ранжировать материалы по публикации, дате и предметной области.

Академия Google не предоставляет данные о точном количестве проиндексированных работ, однако, по предварительным подсчётам, на 2019 год их было не менее 390 млн. Несмотря на отсутствие достоверных данных о размере базы, портал считается крупнейшей в мире академической поисковой системой, со степенью охвата до 90 % всех англоязычных статей.

История

Логотип портала

Идея создания Академии Google принадлежит Алексу Верстаку и . В начале 2000-х годов инженеры совместно работали над улучшением веб-индексирования научных публикаций в Google . Впоследствии они решили создать аналогичную поисковую систему для научной литературы . По словам Ачария, он задумал подобный проект ещё во время учёбы в Индийском институте технологии . Тогда инженер впервые столкнулся с проблемой пейволлов , из-за которых научные работы не попадали в результаты поиска, и учёным приходилось проделывать двойную работу для составления обзора литературы . Верстак и Ачария стремились облегчить доступ к научному знанию. Слоганом Академии Google стала фраза « Стоя на плечах гигантов », приписываемая Бернару Шартрскому и Исааку Ньютону .

Бесплатная поисковая система была запущена в 2004 году . На момент создания Академия Google индексировала работы из баз данных журналов Nature , Online Computer Library Center , Association for Computing Machinery и других . При этом отсутствовали некоторые базовые функции, такие как фильтрация данных по дате .

В 2006 году в Академию Google добавили новую функцию, автоматически формирующую и импортирующую библиографические ссылки на индексированные научные работы в коммерческие системы управления библиографической информацией , включая , , EndNote и BibTeX . С 2007 по 2011 год ссылка на Академию Google была на главной странице Google . В 2007 году по соглашению с издательствами сервис запустил программу оцифровки научных журналов. Главной её целью было получение доступа к метаданным публикаций, чтобы облегчить процесс поиска, идентификации и цитирования . В 2010 году Академия Google анонсировала новую функцию — «будильник» на определённые запросы — пользователи могли получить обновления о новых публикациях по почте . С 2012 году исследователей получили возможность создавать личные профили, самостоятельно добавлять и регулярно обновлять информацию обо всех опубликованных работах. При этом сервис автоматически подсчитывает индивидуальные наукометрические показатели . Опция не только улучшила поисковые возможности системы, но и позволила отслеживать индивидуальные карьеры исследователей . В 2013 году сервис подключил функцию личной библиотеки для подборок научной литературы и результатов поиска по определённым запросам в личном кабинете .

В мае 2014 года Академию Google заблокировали в Китае . Многие китайские учёные заявили, что блокировка негативно повлияет на развитие науки в стране .

В 2021 году портал ввёл дополнительную функцию, позволяющую отслеживать доступность для чтения тех исследовательских работ, которые попадают под мандаты открытого доступа — политику грантодателей, требующей от исследователей открыть свои работы через архивирование в репозиториях .

Принцип работы

Индексация

Стартовая страница

Поисковые роботы Академии Google постоянно сканируют сеть и автоматически добавляют материалы, подходящие по содержанию и оформлению под формат научной статьи . Так, новостные статьи, книги, обзоры, коммерческие сайты, блоги и страницы Википедии не подлежат индексации . Поисковые роботы сканируют материалы из двух основных групп источников. В первую входят журнальные публикации, препринты , диссертации и технические отчёты. Выявленные таким образом материалы включают как полнотекстовые документы, так и цитирования с аннотациями. Ко второй группе относят материалы, предоставленные партнёрскими организациями — издателями журналов, научными обществами, поставщиками баз данных и исследовательскими учреждениями. Большая часть таких работ представлена в Академии Google в виде цитирования с аннотациями, поскольку полный текст по-прежнему скрыт за пейволлами .

Поисковым роботам предоставлен доступ к крупнейшим базам данных коммерческих научных и университетских издательств, включая Association for Computing Machinery , Nature , Institute of Electrical and Electronics Engineers , Online Computer Library Center , Macmillan Publishers , John Wiley & Sons , University of Chicago Press . Помимо этого, роботы сканируют и их цифровые хосты, включая , , , сайты научных и государственных учреждений, таких как Американское физическое общество , Национальные институты здравоохранения США , Национальное управление океанических и атмосферных исследований и серверы препринтов, например, arXiv.org , Астрофизической информационной системы НАСА , RePEc и Citebase . В 2007 году издательство Elsevier также открыло доступ Google к своей базе данных ScienceDirect .

В некоторых случаях Академия Google индексирует и веб-сайты. Для этого порталы должны соответствовать определённым критериям: публиковать в основном научные работы (оригинальные исследовательские статьи, технические отчёты, журнальные публикации, материалы конференций, диссертации и рефераты), находиться в публичном доступе, а также следовать всем необходимым техническим рекомендациям .

Система не предоставляет данные о точном количестве проиндексированных работ, поэтому исследователи вынуждены проводить самостоятельные оценки. Предположительно, в 2010 году количество добавленных в Академию Google документов составило около 82 млн, в 2014 году — 99,3-109,3 млн, в 2015-м — 160—165 млн, а в 2019-м — более чем 390 млн . Несмотря на отсутствие достоверных данных о размере базы данных, Академия Google считается крупнейшей в мире академической поисковой системой, со степенью охвата до 90 % всех англоязычных статей и 50 % всех полнотекстовых документов .

Поисковые роботы Академии Google индексируют научные работы всех языков и дисциплин . Бо́льшая часть индексируемого контента хранится на серверах издателей, где полнотекстовые документы доступны для платного скачивания .

Алгоритм ранжирования

Для изучения ссылочной структуры статьи и определения её «важности» Академия Google использует аналогичные PageRank алгоритмы . Поисковые роботы извлекают библиографические данные и информацию о цитированиях, которые впоследствии используются для ранжирования результатов поиска. Наибольший вес алгоритм придаёт количеству цитирований научной работы — чем их больше, тем выше статья будет отображаться в результатах поиска. Это отличается от подхода большинства аналогичных научных баз данных, использующих обратный хронологический порядок . Важную роль играет и качество цитирующих работ; так, если на публикацию ссылаются материалы с высоким рейтингом, то и её позиция в поисковой выдаче растет . Поисковая система ранжирует результаты поиска и по степени их релевантности запросу. Наличие ключевых слов в названии работы оказывает существенное влияние на положение статьи в списке. При этом частота встречаемости ключевых слов запроса в полном тексте не имеет значения . Возраст статьи также не играет существенной роли для алгоритма .

Отдельные организации, включая Elsevier, OpenScience, Mendeley, SAGE Publishing советуют авторам следовать принципам поисковой оптимизации и модифицировать свои работы таким образом, чтобы академическим поисковым системам было легче её сканировать и индексировать . Авторам также советуют самостоятельно адаптировать свои тексты под стандарты Google Scholar, чтобы как можно большее количество людей смогли получить к ним доступ .

Цитирование

Функция отслеживания цитирований появилась в Академии Google в декабре 2004 года, почти сразу после запуска платформы . Исследователи часто полагаются на количественный показатель цитирований, импакт-фактор , чтобы отслеживать наиболее влиятельные работы по определённой теме . Функция позволила Академии Google соревноваться с платными поисковыми системами традиционных издательств. До этого подобную опцию предлагал только портал Web of Science от .

Академия Google автоматически рассчитывает и отображают три показателя цитирования автора :

  • цитирование — общий необработанный подсчёт того, сколько раз исследование было процитировано в других публикациях ;
  • индекс Хирша — наукометрический показатель, изобретённый физиком Хорхе Хиршем в 2005 году. Показатель отражает общий вклад автора в отдельную научную область и основывается на количестве публикаций и цитирований этих работ ;
  • I10-index — показатель, внедрённый Академией Google в 2011 году, рассчитывающий количество научных публикаций, которые были процитированы как минимум 10 разными источниками .

Доступные функции

Интерфейс Академии Google аналогичен заглавной странице Google. Пользователи могут осуществлять поиск по авторам, ключевым словам, названию журналов. Углублённый поиск позволяет фильтровать выдачу по определённым журналам, дате и предметной области . После введения запроса, портал выдаёт до 1000 результатов, каждый из которых содержит библиографические данные (название, имена авторов, источник публикации), а также ссылки на аннотацию или полную версию работы, если она есть в открытом доступе . Пользователи могут просмотреть цитирования публикации в других источниках, ссылки на онлайн ресурсы, где представлен материал, или на библиотеки, в которых есть физическая копия работы. При этом цифровой идентификатор объекта не отображается. Академия Google предоставляет пользователям доступ к нескольким версиям одного и того же документа .

Функция «Моя библиотека» позволяет «сохранять» личные коллекции статей, которые можно систематизировать с помощью тегов. Пользователи могут сформировать библиографические ссылки на любую научную статью. Система формирует ссылки во всех наиболее часто используемых международных библиографических стандартах, таких как , стиль APA , , , , стиль AIP American Institute of Physics, , стиль Ванкувер и других . Также портал позволяет импортировать цитирование для таких программ, как EndNote, BibTeX, RefMan или RefWorks. Пользователи могут настраивать и редактировать профили авторов, в том числе указывать свою институциональную принадлежность, пять областей научных интересов, добавлять публикации. При этом в результатах поиска отображаются только профили с подтверждёнными академическими адресами электронной почты. Также существует возможность подписаться на обновления других авторов, чтобы получать уведомления по электронной почте о новых статьях или цитированиях .

Влияние

Современные учёные называют появление Академию Google революцией в области поиска научной литературы. По разным данным, портал используют от 43,7 % до 88 % исследователей. Академия Google снижает вероятность непреднамеренного дублирования исследований, что особенно важно для областей науки с высокой стоимостью проведения экспериментов, таких как физика и медицина .

Распространение Академии Google привело к росту значимости «непрестижных» научных журналов и старых статей. Это можно объяснить влиянием алгоритма ранжирования, который ставит приоритет на соответствие работы запросу пользователя, а не на элитность журнала, в котором они опубликованы. Старые статьи имеют больше преимуществ, потому что система фокусируется на работах с бо́льшим количеством цитирований .

Функционал Академии Google способствовал популяризации использования наукометрических показателей для оценки работы исследователей: многие работодатели стали опираться на них при оценке кандидатов . Поисковая система оказала влияние и на движение за открытый доступ . Благодаря сотрудничеству с ведущими издательствами Академия Google подтолкнула коммерческих издателей на оцифровку аннотаций закрытых за пейволлами работ — до этого краткое содержание не было доступно для просмотра и пользователи могли просмотреть его только получив полный доступ к работе .

Критика

Многие исследователи предостерегают об опасности использования Академии Google как единственного источника для составления обзора научной литературы. Причинами этого являются недочёты работы алгоритма ранжирования, иногда показывающего неточные результаты, ошибки каталогизации, приписывание ошибочных цитат или включение не строго академического материала. Охват проиндексированных работ также ограничен доступом к определённым организациям и зависит от соглашения с издателями . Поиск в Академии Google не воспроизводим и не прозрачен — повторные запросы часто выдают разные результаты . Помимо этого, индексируемые журналы не подлежат ручной проверке, что приводит к попаданию в базу данных хищнических журналов . Также исследование 2021 года обнаружило лингвистическую предвзятость в алгоритме работы Академии Google — документы, опубликованные не на английском языке, систематически отводятся на позиции, которые делают их практически невидимыми .

Распространение Академии Google способствовало усилению эффекта Матфея — относительно небольшое количество публикаций привлекает непропорционально растущее число цитирований, в то время как большинство других работ остаются в значительной степени незамеченными . Это происходит потому, что исследователи продолжают выбирать статьи из лучших результатов, автоматически предполагая их достоверность (например, основываясь на большом количестве предшествующих цитирований), и также цитировать их в своих работах . При этом алгоритм ранжирования Академии Google обладает рядом уязвимостей. Исследователи проводили эксперименты по манипулированию собственным индивидуальным рейтингом цитирования, добавляя невидимые слова на первую страницу одного из своих докладов на конференции и меняя содержание и библиографию некоторых из своих уже опубликованных статей. Это привело к увеличению числа цитирований и улучшению индивидуальных показателей . Помимо этого, популяризация порталом индивидуальных показателей цитирований потенциально приводит к ухудшению качества научных работ, поскольку исследователи больше обеспокоены индивидуальными показателями, чем содержанием .

Примечания

  1. .
  2. Anurag Acharya. . New Indian Express (15 ноября 2014). Дата обращения: 10 мая 2022. 2 ноября 2021 года.
  3. . Wired. Дата обращения: 11 мая 2022. 11 мая 2022 года.
  4. Steven Levy. . Wired (17 октября 2014). Дата обращения: 6 мая 2022. 17 мая 2022 года.
  5. John Markoff. . The New York Times (18 ноября 2004). Дата обращения: 6 мая 2022. 17 мая 2022 года.
  6. , pp. 177—214.
  7. .
  8. .
  9. Daniel Terdiman. . The New York Times (25 ноября 2004). Дата обращения: 6 мая 2022. 17 мая 2022 года.
  10. . Nature. Дата обращения: 10 мая 2022.
  11. . Wired (7 мая 2007). Дата обращения: 11 мая 2022. 17 мая 2022 года.
  12. Amy Cavender. . The Chronicle of Higher Education (19 декабря 2013). Дата обращения: 12 мая 2022. 17 мая 2022 года.
  13. Ryan Cordell. . The Chronicle of Higher Education (1 июля 2010). Дата обращения: 12 мая 2022. 17 мая 2022 года.
  14. Paul Stapleton. . South China Morning Post (27 мая 2015). Дата обращения: 11 мая 2022. 17 мая 2022 года.
  15. Alexis Modrigal. . Wired (24 февраля 2010). Дата обращения: 11 мая 2022. 17 мая 2022 года.
  16. . Science (1 сентября 2017). Дата обращения: 12 мая 2022. 17 мая 2022 года.
  17. Richard Van Noorden. . Nature (31 марта 2021). Дата обращения: 6 мая 2022. 17 мая 2022 года.
  18. Pola Lem. . Research Professional News (25 марта 2021). Дата обращения: 12 мая 2022. 21 апреля 2021 года.
  19. , pp. 41—42.
  20. , pp. 1121—1132.
  21. , pp. 871—906.
  22. Jim Giles. // Nature. — 2005. 17 мая 2022 года.
  23. .
  24. , pp. 208.
  25. . Social Science Space (19 марта 2019). Дата обращения: 11 мая 2022. 21 января 2021 года.
  26. . O’relly radar (3 июля 2007). Дата обращения: 14 мая 2022. 21 апреля 2008 года.
  27. Jonathan Knepper. . Business 2 community (4 ноября 2021). Дата обращения: 11 мая 2022.
  28. , pp. 931—949.
  29. Jia You. Science (30 сентября 2014). Дата обращения: 12 мая 2022. 17 мая 2022 года.
  30. David Matthews. . Nature. Дата обращения: 11 мая 2022. 27 апреля 2022 года.
  31. .
  32. .
  33. , pp. 387—399.
  34. Declan Butler. . Nature. Дата обращения: 6 мая 2022. 17 мая 2022 года.
  35. , pp. 475—481.
  36. , pp. 160—164.
  37. . The Guardian (22 ноября 2004). Дата обращения: 11 мая 2022. 17 мая 2022 года.
  38. , pp. 230—241.
  39. .
  40. .
  41. Wietold Kinc. . De Gruyter Conversation (9 апреля 2014). Дата обращения: 16 мая 2022. 20 января 2022 года.
  42. . Elsevier. Дата обращения: 16 мая 2022. 23 октября 2019 года.
  43. James Fallows. . The New York Times (26 декабря 2004). Дата обращения: 6 мая 2022. 17 мая 2022 года.
  44. .
  45. , pp. 787—804.
  46. .
  47. .
  48. .
  49. Ричард Ван Норден. . Nature (13 августа 2014). Дата обращения: 6 мая 2022. 11 мая 2022 года.
  50. LSE blog (19 ноября 2015). Дата обращения: 12 мая 2022. 17 мая 2022 года.
  51. .
  52. . LSE blog (11 ноября 2015). Дата обращения: 12 мая 2022. 23 апреля 2022 года.
  53. Neal Haddaway. . блог LSE (3 февраля 2020). Дата обращения: 6 мая 2022. 26 апреля 2022 года.
  54. .
  55. Gina Kolata. . New York Times (30 октября 2017). Дата обращения: 15 мая 2022. 8 ноября 2017 года.
  56. .
  57. .
  58. .
  59. Hilda Bastian. . PLOS (27 сентября 2019). Дата обращения: 11 мая 2022. 17 января 2022 года.
  60. , pp. 154—160.
  61. John Bonannon. Science (3 января 2014). Дата обращения: 12 мая 2022. 17 мая 2022 года.
  62. Forbes (8 августа 2017). Дата обращения: 12 мая 2022. 17 мая 2022 года.

Литература

  • Aalst J. Using Google Scholar to Estimate the Impact of Journal Articles in Education (англ.) // Educational Researcher. — 2010. — Vol. 39 , iss. 5 . — P. 4387—400 .
  • Bakkabalbasi N., Bauer K., Glover J., Wang L. Three options for citation tracking: Google Scholar, Scopus and Web of Science (англ.) // Biomedical Digital Libraries. — 2006. — Vol. 3 , no. 7 . — P. 515—520 . — doi : .
  • Bauer K., Bakkalbasi N. (англ.) // D-lib Magazine. — 2005. — Vol. 11 , no. 9 . — P. 787—804 .
  • Beel J., Gipp B. (англ.) // Proceedings of the 12th International Conference on Scientometrics and Informetrics. — 2009. — Vol. 1 . — P. 230–241 . — doi : .
  • Dewan, Pauline. Making the Most of Google Scholar in Academic Libraries (англ.) // Feliciter. — 2012. — Vol. 58 , no. 6 . — P. 41—42 .
  • Serenko A., Dumay J. (англ.) // Journak of knoweledge management. — 2015. — Vol. 19 , iss. 6 . — P. 1335—1355 . — doi : .
  • Gray J., Hamilton M., Hauser A. (англ.) // Issues in Science and Technology Librarianship. — 2012. — doi : .
  • Gusenbauer, M. (англ.) // Scientometrics. — 2019. — Vol. 118 . — P. 177—214 . — doi : .
  • Kim H., Grofman B. Who Creates a Google Scholar Profile? (англ.) // Political Science and Politics. — 2020. — Vol. 53 , no. 3 . — P. 515—520 . — doi : .
  • Jacso P. Google Scholar: the pros and the cons (англ.) // Emerald Group Publishing Limite. — 2005. — Vol. 29 , no. 2 . — P. 208—214 . — doi : .
  • Jacso P. (англ.) // Online Information Review. — 2011. — Vol. 35 , iss. 1 . — P. 154—160 . — doi : .
  • Halevi G., Moed H., Bar-Ilan J. (англ.) // Scientometrics. — 2017. — Vol. 11 , no. 3 . — P. 823—834 . — doi : .
  • Neal Robert Haddaway, Alexandra Mary Collins, Deborah Coughlin, Stuart Kirk. // PLOS One. — 2015. — doi : .
  • Harzing A.W., Alakangas S. (англ.) // Scientometrics. — 2015. — Vol. 1—6 . — P. 787—804 . — doi : .
  • Maharana B. Google scholar: a tool to search scholarly information on the web (англ.) // Convention PLANNER -2006. — 2006. — P. 475—481 .
  • Martín-Martín, A., Thelwall, M., Orduna-Malea, E. et al. (англ.) // Scientometrics. — 2021. — Vol. 126 . — P. 876—906 . — doi : .
  • Khabsa, Giles C.L. (англ.) // Plos One. — 2014. — Vol. 118 . — doi : .
  • Mayr P., Walter A-K. An exploratory study of Google Scholar (англ.) // Emerald Group Publishing Limited. — 2007. — Vol. 9 , no. 5 . — P. 814—830 . — doi : .
  • Noorden R. (англ.) // Nature. — 2014. — Vol. 118 . — doi : .
  • Perc M. (англ.) // Interface. — 2014. — Vol. 11 , no. 98 . — P. 931–949 . — doi : .
  • Rovira C., Codina L., Lopesosa C. Language Bias in the Google Scholar Ranking Algorithm // future internet. — 2021. — Т. 12 , вып. 2 .
  • Orduna-Malea, E., Ayllón, J.M., Martín-Martín, A. et al. (англ.) // Scientometrics. — 2015. — Vol. 104 . — P. 931–949 . — doi : .
  • H.Walters W. (англ.) // Information Processing & Management. — 2007. — Vol. 43 , iss. 4 . — P. 1121—1132 . — doi : .
  • Varshney, L.R. (англ.) // Scientometrics. — 2012. — Vol. 92 , iss. 6 . — P. 785—793 . — doi : .
  • Vine R. (англ.) // J Med Libr Assoc. — 2006. — Vol. 94 , iss. 1 . — P. 97—99 .
  • Schilhan, Lisa, Christian Kaier, and Karin Lackner. Increasing Visibility and Discoverability of Scholarly Publications with Academic Search Engine Optimization // Insights. — 2021. — Т. 34 , вып. 1 . — doi : .
  • Beel J., Wilde E., Gipp B. Academic Search Engine Optimization ( ASEO ): Optimizing Scholarly Literature for Google Scholar & Co. // Journal of Scholarly Publishing. — 2010. — Т. 41 , вып. 2 . — С. 176—190 . — doi : .
  • Бизенков Е.А. Практическое применение поисковой и наукометрической платформы Google Scholar (Академия Google) (англ.) // Международный журнал прикладных и фундаментальных исследований.. — 2017. — Vol. 10 , iss. 1 . — P. 9—15 .
Источник —

Same as Академия Google