Скачивание сайта программой WGET
Техническая информацияСкачивание сайта программой WGET
О чем здесь вообще идет речьЕсли вы работаете с интернетом через телефон, то вам будет удобнее скачать сайт к себе на компьютер, отключиться от сети и потом в спокойной оффлайновой обстановке, долгими зимними вечерами его изучить. Особенно это касается библиотеки. Далее мы попробуем разобраться, как это можно сделать ценой относительно малой крови. Трагедия «чайника»О, конечно, как я вас понимаю. Почти на всех сайтах, когда вы кликаете на картинку "Скачать всю книгу", то получаете ее в архивированном виде. Мы сталкивались с подобным решением настолько часто, что уже успели привыкнуть считать это единственно правильным решением. Осознавая это, я понимаю, что скорее всего огорчу вас, ибо - ЗДЕСЬ ВСЕ БУДЕТ ИНАЧЕ! Увы, но мы не можем себе позволить, формируя сайт, закачивать одну и ту же информацию по нескольку раз, пусть даже и в архивном виде. Зато мы можем дать вам небольшую программку, которая умеет качественно делать локальную копию с любого сайта в интернете (или почти любого). Однако, она, будучи для вас абсолютно новой, потребует времени и внимания, чтобы вам к ней привыкнуть и с ней подружиться. Утешение «чайника»Понимая те сложности (скорее психологические, чем технические), с которыми вам предстоит столкнуться, мне тут подумалось максимально упростить ваше первое знакомство с этой программкой. Хотя, возможно, это все равно будет сложнее, чем скачать архив, но, надеюсь, все же довольно просто (по крайней мере вам не придется изучать архиваторы ;-) ). Это надо сделать только в самый первый разДля начала, скачайте мини-дистрибутив программы Wget (296 Кб). БЕЗ ЭТОЙ ПРОГРАММЫ ВСЕ ОПИСАННОЕ ДАЛЕЕ РАБОТАТЬ НЕ БУДЕТ. Если впоследствии вы захотите получше разобраться, как эта программа работает, чтобы ее использовать, то документацию на английском можно найти здесь (120 Кб). Скачав файл программы, его надо запустить (это еще часто называется "Открыть файл" или "Запустить файл"). Программа молча установится на ваш компьютер. Может даже показаться, что ничего не произошло. (Информация для особенно любопытных - это будет каталог <Диск>:\Program Files\unx\, где <Диск> - это ваш системный диск, на котором установлена Windows.). Как скачивать информацию с данного сайтаЭто делается довольно просто. Вкратце это звучит так: кликнув на коробку с бантиков, вы можете скачать файл с расширением BAT. Запустив его (точно так же как все остальные программы) вы инициируете закачку выбранной части сайта в каталог, где этот батник находится. Далее расписываем по шагам:
Фуф 8-) Прошу прощения за въедливось, но опыт показал, очень многие даже весьма умные люди не понимают часто самых простых вещей. Поэтому пришлось говорить не о простом, а о примитивном. Ааааааааа!!! У меня ничего не получается!Хотя мне и трудно представить, ЧТО тут может не получиться, но люди все разные, и опыт тоже разный. Самое лучшее, что можно сделать в такой ситуации - это прислать письмо, в котором описать: что вы сделали, что ожидали увидеть, и что получилось. Обязательно пришлите мне файл wget.log, который будет лежать там же, где и скаченный файл. Мы попробуем разобраться, решить задачу и подправить этот текст, чтобы вслед-идущим было проще. Самым неконструктивным из всех возможных действий будет обидеться, молчать, ничего не делать, а заодно предоставить всем остальным наступать на те же грабли. А как мне теперь все таки скачать книжечку?Если вы только что пытались скачать часть сайта, то просто вернитесь на страницу и повторите попытку. Только на этот раз нажмите кнопку "ОК". И помните о том, что только что прочитали. Краткая информация о программе Wget (не для «чайников»)Программа wget.exe предназначена для того, чтобы без вашего особого участия скачивать большие количества файлов из интернета. Внизу предложены два варианта ее использования на данном сайте (хотя существуют еще десятки других): с помощью первого можно выкачать весь сайт; и с помощью второго можно выкачать избранную книгу из библиотеки. В последнем случае, укажите страницу оглавления выбранной вами книги. Выполнять эту команду надо из каталога на вашем компьютере, в который вы хотите выкачать сайт. По оканчании в файле wget.log будет находится информация о том, какие страницы были закачены, и какие ошибки возникли в процессе. Если эти варианты выкачки вас по каким-либо причинам не устраивают, то прочтите описание флагов и попробуйте самостоятельно придумать, как настроить работу этой программы под вашу задачу (предпочтительно) или пишите - разберемся вместе.
Для того, чтобы полностью скачать сайт, используйте следующую команду (здесь и далее, сайт будет скачан в каталог, из которого программа была запущена): Если нужно скачать не весь сайт, а только какую-то его часть (в данном случае книгу "Дао Пуха"), то используйте такую команду: Если вы работаете с интернетом через прокси сервер или через FireWall, то к списку указанных опций (перед адресом страницы) надо добавить еще и такие: Где ххх - это логин (если нужен) yyy - это пароль для данного логина (если нужен) server - имя прокси сервера или FireWall-а (узнать у администратора) port - порт, через который работает прокси сервер или FireWall (узнать у администратора) Страницы сайта будут выкачены с банерами. Если вы хотите от них избавиться, то из выкаченных файлов надо удалить все что стоит до строки "<!-- Начало страницы tm-sidhi.narod.ru -->" и все, что стоит после строки "<!-- Конец страницы tm-sidhi.narod.ru -->". Процесс удаления может быть автоматизирован (если вам позволяет это сделать ваш опыт), и здесь не рассматривается. Информация для любознательных:
© Design В.А.Б.
|