Вход для пользователей

Использование wget

Изображение пользователя FraDe.

Пратические примеры применения wget. В принципе, всё ниже изложенное вы можете узнать набрав в командной строке man wget. Здесь я записываю примеры из своей повседневной практики.

wget --limit-rate=50k -с -i download.lst

Позволяет скачать список файлов из файла download.lst. URL каждого файла записывается на отдельной строчке.

*
Ключик -i указывает на файл со списком.
*
Ключик –limit-rate= позволяет ограничить скорость скачивания.
*
Ключик -c указывает, что если файл с таким именем уже существует, его следует докачать. Иначе файл будет скачан в новый файл с добавленым числовым индексом.

wget -r -np -c

Позволяет выкачать сайт целиком. Рекурсивно проходится по всем найденным на странице ссылкам, выкачивает их. Если выкачана новая страница - повторяет. В результате весь сайт с картинками и файлами у вас в кармане.

*
Ключик -r указывает, что надо рекурсивно ходить по ссылкам.
*
Ключик -np не даёт wget'у выкачать весь сайт целиком, если вам нужна только какая-то часть. К примеру, если вы задали URL http://www.linuxcenter.ru/lib/articles/programming/?pid=4706 то будут выкачаны только статьи по программированию.

wget -p -k

Выкачивает указанную страницу с картинками и оформлением.

*
Ключ -p указывает, что дополнительно к странице нужно скачать файлы необходимые для корректного отображения страницы в оффлайн.
*
Ключ -k заставляет wget преобразовать все внешние, по отношению к странице, ссылки таким образом, что бы они вели на оригинальный сайт.

wget -rEkp -np -nc

«Помощь зала» для более корректного выкачивания сайта.

*
r - скачивать рекурсивно
*
E - дописывать при необходимости расширение .html
*
p - закачивать все ресурсы, а-ля картинки, css.
*
k - после завершения загрузки конвертировать ссылки в документе для просмотра в автономном режиме
*
np - не подниматься выше по дереву каталогов
*
nc - не закачивать уже имеющиеся файлы

Имеет смысл назначить для этой команды алиас: alias wget-site="wget -rEkp -np -nc" и пользоваться уже им: wget-site .

Из комментариев:

Fd, 03.04.2008 17:54:

Более корректно писать wget -rEkp -np -nc

*
r - скачивать рекурсивно
*
E - дописывать при необходимости расширение .html
*
p - закачивать все ресурсы, а-ля картинки, css.
*
k - после завершения загрузки конвертировать ссылки в документе для просмотра в автономном режиме
*
np - не подниматься выше по дереву каталогов
*
nc - не закачивать уже имеющиеся файлы

Источник:
— Ivan A-R 02.04.2008 12:13
http://iar.spb.ru/linux/2008-04-02-wget-usage

Комментарии

Изображение пользователя DiFor.

уххх, спасибище огромнейшее!

Изображение пользователя D3viL.

Wget, вобще, отличное изобретение. Как то кто то спрашивал про зеркализацию репозиториев. У меня это реализовано на wgete. Вот скрипт отрабатывающий в кроне каждые 12 часов:

if ! ps -ef | grep «wget -b -nH --cut–dirs=3 -P /home/ftp/pub/slackware/slackware–current» | grep slackr
then wget -b -nH --cut–dirs=3 -P
/home/ftp/pub/slackware/slackware–current -o
/home/Download/slackrep_13.log -c -R index.h* -np -m -k
ftp://slackware.perespim.ru/pub/slackware–current/slackware
fi 

Изображение пользователя Auror.

Есть же rsync для этого :)

Изображение пользователя D3viL.

(: зинаю, но я извращенец.
Да и мне пофигу в принципе :)

Изображение пользователя CORPSE.

Присоединяюсь. :) Спасибо. :)

[root@brain root]# mount /dev/hands /mnt/ass -o nosuid,umask=000