Interested Article - Google Code Search

Google Code Search — проект поисковой машины от Google Labs , индексировавшей исходные коды открытых программ, и позволявшей использовать в поисковых запросах регулярные выражения . В виде бета-версии работал с 5 октября 2006 года по 15 января 2012 года . Закрыт в связи с закрытием Google Labs .

Кроме поддержки регулярных выражений , имелась возможность более точного поиска с помощью специальных операторов. Среди них: lang: (указание языка программирования ), package: (имя проекта), license: (лицензия ) и file: (имя файла).

Индексировался код программ, хранившихся в различных форматах, включая tar.gz, tar.bz2, .tar, .zip, репозитории CVS и Subversion .

В ограниченном виде наработки Google Code Search продолжают использоваться для поиска в рамках кодов проекта Chromium, код которого расположен на сайте Google Code .

Автором проекта, Russ Cox, была опубликована пара консольных утилит Cindex/Csearch, предоставляющая возможность индексирования и поиска по исходным кодам. Утилиты используют схожие с Google Code Search принципы, хотя не могут масштабироваться более чем на несколько десятков гигабайт исходников.

Движок регулярных выражений

Сайт позволял использовать регулярные выражения в запросах и искал любые символы (в отличие от обычных поисковиков, которые игнорируют нетекстовые символы ). На момент создания такими возможностями не обладали другие поисковые системы . Это делало его похожим на программу grep , который выполняет поиск по огромной базе открытого исходного кода . Используется поиск на базе индекса триграмм и собственной реализации POSIX -совместимых регулярных выражений — RE2, написанной Russ Cox. Исходные коды RE2 были открыты в марте 2010 .

Google Code Search поддерживал POSIX-расширенный синтаксис регулярных выражений, за исключением обратных ссылок , сопоставления элементов и сортировки классов.

Интересные факты

  • Некоторое время в 2008 году результаты поиска Code Search могли интегрироваться в основную поисковую выдачу Google .
  • Google code search использовался в комитете ISO при выборе имен некоторых новых функций в стандарте языка программирования Си ( стандарт C11 от 2011 года) .
  • Code Search применялся хакерами для поиска уязвимостей в программах . Были найдены тысячи небезопасных фрагментов кода

Примечания

  1. Ed Burnette. (англ.) . ZDNet Dev Connection (5 октября 2006). — «Code search. This is for developers to help them find open source code. Features include the ability to search by regular expressions (go{2}gle), by language (lang:"c++" sprintf.*%s), or by license (-license:gpl quicksort).» Дата обращения: 17 ноября 2013.
  2. от 4 марта 2016 на Wayback Machine // The Register, 2011-09-05
  3. от 3 июня 2016 на Wayback Machine по проекту Chromium.
  4. от 5 ноября 2013 на Wayback Machine — command-line file search tool, based on ideas from GCS
  5. от 11 мая 2014 на Wayback Machine
  6. , Russ Cox, January 2012
  7. . Дата обращения: 22 января 2013. Архивировано из 3 февраля 2013 года.
  8. // Google, архивная копия от 2008 года
  9. Nik Cubrilovic (2008-07-13). (англ.) . Washington Post. из оригинала 17 ноября 2013 . Дата обращения: 17 ноября 2013 .
  10. P.J. Plauger, от 20 января 2022 на Wayback Machine , ISO/IEC JTC1 SC22 WG14 N1327: "while there are no occurances of quick_exit in a Google code search. "
  11. Johnny Long. Locating Code with Google Code Search // . — Syngress, 2011. — С. 227—230. — 560 с.
  12. от 14 июля 2013 на Wayback Machine // Dennis Fisher, Executive Editor, TechTarget, Oct 11, 2006
  13. Bill Brenner (2006-10-13). . TechTarget. из оригинала 13 июля 2013 . Дата обращения: 17 ноября 2013 .
  14. от 10 июня 2015 на Wayback Machine 10 июня 2015 года. // Jose Blog

Ссылки

  • — Архивная копия страницы, ноябрь 2010 года.
  • — command-line file search tool, based on ideas from GCS (Russ Cox)
  • для поиска по кодам проекта Chromium на Google Code
  • — сходный поиск по исходным кодам Debian
Источник —

Same as Google Code Search