Interested Article - Google Code Search
- 2020-06-05
- 1
Google Code Search — проект поисковой машины от Google Labs , индексировавшей исходные коды открытых программ, и позволявшей использовать в поисковых запросах регулярные выражения . В виде бета-версии работал с 5 октября 2006 года по 15 января 2012 года . Закрыт в связи с закрытием Google Labs .
Кроме поддержки регулярных выражений , имелась возможность более точного поиска с помощью специальных операторов. Среди них: lang: (указание языка программирования ), package: (имя проекта), license: (лицензия ) и file: (имя файла).
Индексировался код программ, хранившихся в различных форматах, включая tar.gz, tar.bz2, .tar, .zip, репозитории CVS и Subversion .
В ограниченном виде наработки Google Code Search продолжают использоваться для поиска в рамках кодов проекта Chromium, код которого расположен на сайте Google Code .
Автором проекта, Russ Cox, была опубликована пара консольных утилит Cindex/Csearch, предоставляющая возможность индексирования и поиска по исходным кодам. Утилиты используют схожие с Google Code Search принципы, хотя не могут масштабироваться более чем на несколько десятков гигабайт исходников.
Движок регулярных выражений
Сайт позволял использовать регулярные выражения в запросах и искал любые символы (в отличие от обычных поисковиков, которые игнорируют нетекстовые символы ). На момент создания такими возможностями не обладали другие поисковые системы . Это делало его похожим на программу grep , который выполняет поиск по огромной базе открытого исходного кода . Используется поиск на базе индекса триграмм и собственной реализации POSIX -совместимых регулярных выражений — RE2, написанной Russ Cox. Исходные коды RE2 были открыты в марте 2010 .
Google Code Search поддерживал POSIX-расширенный синтаксис регулярных выражений, за исключением обратных ссылок , сопоставления элементов и сортировки классов.
Интересные факты
- Некоторое время в 2008 году результаты поиска Code Search могли интегрироваться в основную поисковую выдачу Google .
- Google code search использовался в комитете ISO при выборе имен некоторых новых функций в стандарте языка программирования Си ( стандарт C11 от 2011 года) .
- Code Search применялся хакерами для поиска уязвимостей в программах . Были найдены тысячи небезопасных фрагментов кода
Примечания
- ↑ Ed Burnette. (англ.) . ZDNet Dev Connection (5 октября 2006). — «Code search. This is for developers to help them find open source code. Features include the ability to search by regular expressions (go{2}gle), by language (lang:"c++" sprintf.*%s), or by license (-license:gpl quicksort).» Дата обращения: 17 ноября 2013.
- ↑ от 4 марта 2016 на Wayback Machine // The Register, 2011-09-05
- от 3 июня 2016 на Wayback Machine по проекту Chromium.
- от 5 ноября 2013 на Wayback Machine — command-line file search tool, based on ideas from GCS
- от 11 мая 2014 на Wayback Machine
- , Russ Cox, January 2012
- . Дата обращения: 22 января 2013. Архивировано из 3 февраля 2013 года.
- // Google, архивная копия от 2008 года
- Nik Cubrilovic (2008-07-13). (англ.) . Washington Post. из оригинала 17 ноября 2013 . Дата обращения: 17 ноября 2013 .
- P.J. Plauger, от 20 января 2022 на Wayback Machine , ISO/IEC JTC1 SC22 WG14 N1327: "while there are no occurances of quick_exit in a Google code search. "
- Johnny Long. Locating Code with Google Code Search // . — Syngress, 2011. — С. 227—230. — 560 с.
- от 14 июля 2013 на Wayback Machine // Dennis Fisher, Executive Editor, TechTarget, Oct 11, 2006
- Bill Brenner (2006-10-13). . TechTarget. из оригинала 13 июля 2013 . Дата обращения: 17 ноября 2013 .
- от 10 июня 2015 на Wayback Machine 10 июня 2015 года. // Jose Blog
Ссылки
- — Архивная копия страницы, ноябрь 2010 года.
- — command-line file search tool, based on ideas from GCS (Russ Cox)
- для поиска по кодам проекта Chromium на Google Code
- — сходный поиск по исходным кодам Debian
- 2020-06-05
- 1