Interested Article - Wget
- 2020-03-23
- 1
Wget — (GNU Wget) свободная консольная программа для загрузки файлов по сети. Поддерживает протоколы HTTP , FTP и HTTPS , а также поддерживает работу через HTTP прокси-сервер . Программа включена почти во все дистрибутивы GNU/Linux .
Wget является неинтерактивной программой. Это означает, что после её запуска пользователь может повлиять на её работу только с помощью средств управления процессами операционной системы. Как правило, для этого используются сочетания клавиш Ctrl+C при необходимости прерывания работы программы и Ctrl+Z для помещения текущего задания в фон. Современные web-браузеры , как правило, имеют функцию закачки файлов, однако так как браузер рассчитан на интерактивный режим работы, то скачивание большого количества файлов вручную может быть утомительным. Браузеры, как правило, не предоставляют средств для автоматизации подобных задач. Wget же, например, поддерживает загрузку URL, указанных в файле. Таким образом можно составить список файлов, а в любое удобное время скачать их с помощью wget. Интерфейс командной строки позволяет управлять wget из других программ и скриптов , что используется при автоматизации загрузки файлов (регулярные обновления, мониторинг доступности сервера и т. д.).
Wget позволяет загружать любые файлы во всемирной паутине (в том числе и ( X ) HTML -страницы) по протоколам http и https, а также файлы и списки каталогов по протоколу ftp.
Файлы можно скачивать рекурсивно по ссылкам в HTML страницах, как с одного сайта с определённой глубиной следования по ссылкам, так и с нескольких. Помимо этого, при загрузке по ftp файлы можно скачивать «по маске» имени (то есть можно задавать с помощью «*» группу файлов).
Wget поддерживает докачку файла в случае обрыва соединения.
Ведётся разработка продолжения Wget — Wget2 .
Примеры
Загрузка всех URL, указанных в локальном или внешнем ФАЙЛЕ:
wget -i ФАЙЛ
Скачивание файлов в указанный каталог (-P) :
wget -P /path/for/save ftp://ftp.example.org/some_file.iso
Использование имени пользователя и пароля на FTP/HTTP (вариант 1):
wget ftp://login:[email protected]/some_file.iso
Использование имени пользователя и пароля на FTP/HTTP (вариант 2):
wget --user=login --password=password ftp://ftp.example.org/some_file.iso
Скачивание в фоновом режиме (-b):
wget -b ftp://ftp.example.org/some_file.iso
Продолжить (-c continue) загрузку ранее не полностью загруженного файла:
wget -c http://example.org/file.iso
Скачивание без проверки сертификата (--no-check-certificate):
wget --no-check-certificate http://example.org/file.iso
Скачать содержимое каталога (недоступная ссылка) и всех его подкаталогов, при этом не поднимаясь по иерархии каталогов выше:
wget -r --no-parent http://example.org/~user/my-archive/
Также поддерживается идентификация на сервере:
wget --save-cookies cookies.txt \
--post-data 'user=foo&password=bar' \
http://example.org/auth.php
Скачать весь сайт целиком (глубина рекурсии — 10):
wget -r -l 10 -k -o log-file.txt -p http://example.org/
-r, --recursive включение рекурсивной загрузки
-l, --level=ЧИСЛО глубина рекурсии (inf и 0 - бесконечность)
-k, --convert-links делать ссылки локальными в загруженном HTML или CSS
-o, --output-file=ФАЙЛ записывать сообщения (логи) в ФАЙЛ
-p, --page-requisites загрузить все изображения и проч., необходимые для отображения HTML-страницы
-m, --mirror короткий параметр, эквивалентный -N -r -l inf --no-remove-listing.
Вывести содержание ответа в консоль:
wget http://example.org --quiet -O -
Возвращаемый статус
До версии 1.12, возвращает 0 при успешном выполнении и 1 в случае ошибки. Начиная с версии 1.12 , в случае ошибки возвращает от 1 до 8, в зависимости от вида.
Критика
Разработка Wget идёт медленно, многие новые расширения протоколов HTTP, FTP , сценарии JavaScript и другие функции не поддерживаются.
В некоторых случаях хорошей альтернативой может являться cURL , а для создания зеркал сайтов (чего cURL не умеет ) обычно используется rsync . В версии 1.17 и выше обязательна поддержка SSE2-инструкций процессором.
wget2
Следующее значительное обновление Wget должно произойти в wget2, который, предположительно, должен прийти ему на смену. wget2 обладает значительным количеством усовершенствований по сравнению с Wget, в первую очередь касающихся производительности:
- Поддержка HTTP/2
- HTTP-сжатие
- Параллельные соединения
- TCP Fast Open
и рядом других.
Основным разработчиком wget2 является Тим Рюсен (Tim Rühsen), также являющийся одним из основных разработчиков и текущих майнтейнеров Wget.
Клоны
Для встроенных систем характерен ограниченный размер памяти и для них есть клоны, которые имитируют интерфейс и поведение GNU Wget, но имеют меньше опций, в основном, только скачивание файла:
- OpenWrt от 6 октября 2021 на Wayback Machine
- BusyBox от 6 октября 2021 на Wayback Machine
- от 6 октября 2021 на Wayback Machine
См. также
Примечания
- Дата обращения: 6 октября 2021. 15 сентября 2021 года.
- (англ.) — 2023.
- — 2006.
-
В силу принятых в
*nix
-системах соглашений в командной строке эта программа вызывается словом, начинающимся со строчной буквы:
wget
- от 1 марта 2018 на Wayback Machine (англ.)
- . Дата обращения: 6 октября 2021. 6 октября 2021 года.
- от 6 октября 2021 на Wayback Machine Возвращаемый статус (en)
- от 6 октября 2021 на Wayback Machine : «Curl is not a web site mirroring program.»
Ссылки
- от 15 сентября 2021 на Wayback Machine
- от 7 октября 2021 на Wayback Machine
- от 6 октября 2021 на Wayback Machine // Opennet
- от 6 октября 2021 на Wayback Machine
- 2020-03-23
- 1