Interested Article - Сессия (веб-аналитика)

Определение «сессия» ( англ. Session ), или «HTTP сессия», варьируется, особенно применительно к поисковым системам . Обычно под сессией понимается «последовательность запросов, сделанных конечным клиентом (веб-браузером, приложением, краулером и др.) во время посещения определённого хоста» . В контексте поисковых систем «сессия», или «сессия запросов», имеют как минимум два определения . В широком смысле слова — это все запросы, сделанные пользователем в конкретный период времени . В узком смысле «сессия» в веб-аналитике — это серия запросов или переходов с согласованной потребностью пользователя.

В Google Аналитике используется понятие « веб-сеанс » . Яндекс.Метрика использует термин « сессия » или « визит » .

Описание

Сессия - базовая эвристика для определения истории взаимодействий клиента и хоста по протоколу HTTP. Механизмы сессий и сеансов используются при построении эвристик более высокого уровня, таких как пользователь и др.

Сессия создаётся при первом запросе к хосту (серверу). При обращении клиента хост генерирует идентификатор сессии, который затем используется клиентом при каждом обращении к хосту пока существует сессия. На стороне хоста может быть реализована различная логика разрыва сессии: например, сохранение сессии долговременно, удаление сессии при завершении сеанса, открытие новой сессии при каждом переходе с нового источника, открытие новой сессии при идентификации (логине), удаление сессии через промежуток времени и др. Если клиент обращается к хосту с использованием не активного (например, удалённого или помеченного как не активный, устаревший) идентификатора сессии, то создаётся новая сессия. На стороне клиента разрыв HTTP сессии реализуется как правило через удаление идентификатора сессии. В разных клиентах это реализуется по-разному. В веб-браузерах это осуществляется в основном через обновление или удаление файлов Cookies.

В некоторых системах веб-аналитики сессия заканчивается, когда в течение определённого времени пользователь не совершает новых действий, например в Google Analytics и Яндекс.Метрика по умолчанию это 30 минут.

Подсчет органических сессий на сайте и рекламных отличается. Каждый переход по рекламе, независимо от времени пребывания пользователя на сайте, будет считаться как новый визит . Также Google.Analytics всегда будет считать сессию завершённой, если по времени наступила полночь, а после полуночи продолжающаяся сессия считается новой .

Применение

Сессии могут быть использованы для отчетов веб-аналитики , чтобы изучать поведение пользователей на веб-сайтах . Исследуемые показатели включают продолжительность сеанса и действия пользователя за сессию . Длительность сеанса рассматривается как более точная альтернатива количеству просмотров страниц .

Сессии, которые прошли на сайте, также используются для измерения общего пользовательского трафика, в том числе для измерения количества рабочих часов, затраченных на создание Википедии . Сессии также используются для оперативной аналитики, анонимизации данных, выявления сетевых аномалий и генерации искусственной рабочей нагрузки для тестирования серверов с искусственным трафиком .

Сессии хранят данные о сайте в момент взаимодействия пользователя с веб-ресурсом через браузер при помощи соответствующего ключа .

Благодаря оценке посещаемости сайта можно определять покупательскую вовлеченность, для этого следует учитывать продолжительность и частоту визитов на сайт, процент повторных визитов, давность визита, широту визита (процент посетивших сайт), а также статистику продаж через сайт .

Реконструкция сессии

Веб-аналитики изучают сессии для получения необходимой информации о сайте, и важную роль здесь играет возможность идентификации сессий. Возможность реконструировать сессию пользователя также называют «восстановлением сеанса». Подходы к реконструкции сессии можно разделить на две основные категории: ориентированные на время и ориентированные на навигацию .

Ориентированный на время подход показывает определённый период неактивности пользователя, который называют «порогом неактивности». И когда наступает бездействие пользователя, предполагается, что он покинул сайт или полностью прекратил использование браузера, и сессия завершилась. Дальнейшие запросы от того же пользователя считаются вторым сеансом. Общее значение для порога неактивности пользователя составляет 30 минут . Некоторые утверждают, что период сессии в 30 минут создает артефакты вокруг естественно длинных сеансов и экспериментируют с другими периодами . Другие считают: «нет временного порога, эффективного при выявлении сессий» , есть альтернатива «порогу неактивности» в 30 мин, которая заключается в использовании пользовательских периодов пребывания на сайте .

Второй подход, который используют для изучения пользовательской сессии — это подход, ориентированный на навигацию . В этом случае, аналитики используют структуру веб-сайтов, в частности, наличие гиперссылок и склонность пользователей переходить между страницами одного и того же веб-сайта, нажимая на них, не вводя полный URL-адрес в своем браузере . Один из способов идентификации сессий по этим данным состоит в том, чтобы создать карту веб-сайта: если можно определить первую страницу захода, сессия продолжается до тех пор, пока пользователь не окажется на странице, к которой нельзя получить доступ ни с одной ранее просмотренной страницы. При этом учитывается обратное отслеживание, когда пользователь будет пересматривать свои шаги перед открытием новой страницы . Более простой вариант, который не учитывает обратное отслеживание, когда HTTP referer каждого запроса является страницей, которая уже находилась в сессии . Если это не так, сессия считается как новая. Этот метод «демонстрирует очень низкую производительность» на сайтах, которые содержат наборы фреймов .

См. также

Примечания

  1. Gayo-Avello, Daniel. A survey on session detection methods in query logs and a proposal for future evaluation // Information Sciences. — 2009. — № 179 (12) . — С. 1822–1843 . — ISSN . — doi : .
  2. Arlitt, Martin. // SIGMETRICS Performance Evaluation Review. — 2000. — № 28 (2) . — С. 50–63 . — doi : . 15 мая 2021 года.
  3. Donato, Debora; Bonchi, Francesco; Chi, Tom. Do you want to take notes?: identifying research missions in Yahoo! search pad // Proceedings of the 19th International Conference on World Wide Web. — 2010.
  4. . support.google.com. Дата обращения: 18 февраля 2020. 17 марта 2020 года.
  5. . yandex.ru. Дата обращения: 18 февраля 2020. 18 февраля 2020 года.
  6. . yandex.ru. Дата обращения: 5 марта 2020. 24 октября 2019 года.
  7. . support.google.com. Дата обращения: 5 марта 2020. 17 марта 2020 года.
  8. Weischdel, Birgit; Huizingh, Eelko K. R. E. . — Proceedings of the 8th International Conference on Electronic Commerce. — 2006. — 463 с. — ISBN 978-1595933928 . — doi : . 4 марта 2016 года.
  9. Jansen, Bernard J.; Spink, Amanda. How are we searching the world wide web? A comparison of nine search engine transaction logs // Information Processing and Management. — 2006. — № 42 (1) . — С. 248–263 . — ISSN . — doi : .
  10. Jansen, Bernard J.; Spink, Amanda; Saracevic, Tefko. Real life, real users, and real needs: a study and analysis of user queries on the web // Information Processing and Management. — 2000. — № 36 (2) . — С. 207–227 . — ISSN . — doi : .
  11. Khoo, Michael; Pagano, Joe; Washington, Anne L.; Recker, Mimi; Palmer, Bart; Donahue, Robert A. Using Web Metrics to Analyze Digital Libraries. — Proceedings of the 8th ACM/IEEE-CS Joint Conference on Digital Libraries. — ACM, 2008.
  12. Catledge, L.; Pitkow, J. Characterizing browsing strategies in the world-wide web" (PDF) // Proceedings of the Third International World-Wide Web Conference on Technology, Tools and Applications. — 1995. — № 27 (6) . — С. 1065–1073 . — doi : .
  13. Geiger, R.S.; Halfaker, A. Using Edit Sessions to Measure Participation in Wikipedia // Proceedings of the 2013 ACM Conference on Computer Supported Cooperative Work. — ACM, 2014. — С. 861 . — ISSN . — doi : .
  14. Meiss, Mark; Duncan, John; Gonçalves, Bruno; Ramasco, José J.; Menczer, Filippo. // Proceedings of the 20th ACM Conference on Hypertext and Hypermedia. — ACM, 2009. 8 мая 2021 года.
  15. Arlitt, Martin. Characterizing Web User Sessions (PDF) // SIGMETRICS Performance Evaluation Review. — 2000. — № 28 (2) . — С. 50–63 . — doi : .
  16. . Веб-документация MDN. Дата обращения: 18 февраля 2020. 18 февраля 2020 года.
  17. Окольнишникова И.Ю. Как измерить степень покупательской вовлеченности в бренд? // Российское предпринимательство. — 2011.
  18. Spiliopoulou, Myra; Mobasher, Bamshad; Berendt, Bettina; Nakagawa, Miki. A framework for the evaluation of session reconstruction heuristics in web-usage analysis // INFORMS Journal on Computing. — 2003. — № 15 (2) . — С. 171–190 . — ISSN . — doi : .
  19. Ortega, J.L.; Aguillo, I. Differences Between Web Sessions According to the Origin of their Visits // Journal of Informetrics. — 2010. — № 4 (3) . — С. 331–337 . — ISSN . — doi : .
  20. Eickhoff, Carsten; Teevan, Jaime; White, Ryen; Dumais, Susan. Lessons from the Journey: A Query Log Analysis of Within-Session Learning. — Proceedings of the Seventh International Conference on Web Search and Web Data Mining. — ACM, 2014. — С. 223–232. — ISBN 9781450323512 . — doi : .
  21. Mehrzadi, David; Feitelson, Dror G. // SYSTOR '12. ACM. — 2012. — ISSN . — doi : . 20 сентября 2019 года.
  22. He, Daqing; Goker, Ayse; Harper, David J. Combining evidence for automatic Web session identification // Information Processing and Management. — 2002. — № 38 (5) . — С. 727–742 . — ISSN . — doi : .
  23. Jones, Rosie; Klinkner, Kristina Lisa. Beyond the Session Timeout: Automatic Hierarchical Segmentation of Search Topics in Query Logs doi. — ACM. — 2008. — 699 с. — ISBN 9781595939913 . — doi : .
  24. Murray, G. Craig; Lin, Jimmy; Chowdhury, Abdur. // Proceedings of the American Society for Information Science and Technology. — 2006. — № 43 (1) . — С. 1–9 . — doi : . 21 сентября 2019 года.
  25. Mehrzadi, David; Feitelson, Dror G. // SYSTOR '12. ACM.. — 2012. — ISBN 978-1-4503-1448-0 . — doi : . 20 сентября 2019 года.
  26. Spiliopoulou, Myra; Mobasher, Bamshad; Berendt, Bettina; Nakagawa, Miki. A framework for the evaluation of session reconstruction heuristics in web-usage analysis // INFORMS Journal on Computing. — 2003. — № 15 (2) . — С. 171–190 . — ISSN . — doi : .
  27. Cooley, Robert; Mobasher, Bamshad; Srivastava, Jaideep. Data Preparation for Mining World Wide Web Browsing Patterns // Knowledge and Information Systems. — 1999. — № 1 (1) . — С. 19 . — ISSN . — doi : .
  28. Cooley, Robert; Mobasher, Bamshad; Srivastava, Jaideep. Data Preparation for Mining World Wide Web Browsing Patterns (PDF) // Knowledge and Information Systems. — 1999. — 1 (1). — С. 5–32 . — ISSN . — doi : .
  29. Berendt, Bettina; Mobasher, Bamshad; Nakagawa, Miki; Spiliopoulou, Myra. The Impact of Site Structure and User Environment on Session Reconstruction in Web Usage Analysis (PDF) // WEBKDD 2002 - Mining Web Data for Discovering Usage Patterns and Profiles. WEBKDD. Springer.. — 2003. — ISBN 978-3-540-39663-5 . — doi : .
Источник —

Same as Сессия (веб-аналитика)