Описание тега httrack

HTTrack (Website copier)
0 ответов

Ползунок Revolution 5.0 не отображается

Я успешно загрузил веб-сайт, используя httrack. Однако, 1 проблема, которую я имею, состоит в том, что слайдер революции домашней страницы не отображается. Все, что есть, - это скрипт, который подсказывает мне вставить его в то, что я безуспешно сде…
01 дек '18 в 03:35
1 ответ

httrack загружает только файл index.html

Обычно, когда я загружаю сайты с помощью Httrack, я получаю все файлы; изображения, CSS, JS и т. д. Сегодня программа закончила загрузку всего за 2 секунды и захватывает только файл index.html с CSS, IMG-кодом и т. д., который по-прежнему связан с в…
22 ноя '14 в 17:16
0 ответов

Httrack неисправен при обнаружении закодированных японских URL

У меня обычно нет проблем с Httrack, но на этот раз я обнаружил, что ему не удается захватить страницы с символами не ascii, такими как этот японский URL: domain.com/ リ ー ク 情報 の 真偽 の ほ / (читается браузером следующим образом: domain.com/E3%83%A0%E7%…
29 сен '16 в 01:47
3 ответа

Использование HTTrack для зеркалирования одной страницы

Я пытался использовать HTTrack для зеркалирования одной страницы (загрузка html + предварительные условия: таблицы стилей, изображения и т. Д.), Аналогично вопросу [зеркальное отображение одной страницы с httrack][1]. Тем не менее, принятый ответ та…
14 янв '16 в 17:33
0 ответов

Веб-сканер сайтов с поддержкой командной строки html4/5, javascript, командная строка, мультиплатформенный, с возможностью перенаправления

Мне нужен веб-сканер сайтов с поддержкой командной строки html4/5, javascript, images, css, командной строки, мультиплатформенный, с возможностью перенаправления (с http:// на https://, с домена на www.domain), как httrack или лучше (универсальный и…
10 сен '17 в 05:13
0 ответов

Зеркальное отображение веб-сайтов - 403 Запрещено с помощью строк агента пользователя

Я работаю над приложением для зеркалирования академических каталогов университетов США. Для этого у меня есть группа работников Celery, которые используют wget или httrack, чтобы отразить содержимое, стили и сценарии, а затем загрузить их в нашу кор…
27 май '16 в 16:51
1 ответ

Использование подпроцесса для запуска HTTrack из python в Windows

Я нахожусь в процессе написания скрипта Python для очистки веб-страниц, и я хотел бы, чтобы он сделал снимок определенных страниц (все HTML, таблицы стилей и изображения, необходимые для просмотра этой конкретной страницы в автономном режиме). Похож…
13 янв '16 в 21:19
0 ответов

Как получить структуру сайта в виде списка файлов?

Я знаю, что могу скачать весь сайт с помощью Wget/Httrack. Но вместо загрузки всего сайта и удаления того, что мне больше не нужно,Сначала я хочу получить предварительный просмотр веб-сайта и составить конкретный список загрузок. Windows 7
17 июл '18 в 14:24
0 ответов

Как я могу зеркально отразить все страницы сайта в одной папке с HTTrack

Я хочу отразить сайт с подпапками, но хочу, чтобы все страницы в разных подпапках были зеркально отображены в одной папке. Можно ли этого добиться? Я пытался, но не смог настроить HTTrack для достижения этой цели. Кто-нибудь, помогите мне, пожалуйст…
08 окт '18 в 09:09
0 ответов

httrack --catchurl нет оставшегося порта

Я пытаюсь запустить httrack на Mac OS 10.13 high sierra с включенным флагом --catchurl, но получаю следующую ошибку: Unable to create a temporary proxy (no remaining port) Я попытался отключить брандмауэр Mac OS, переключить ipv6 только на локальный…
19 фев '18 в 12:22
5 ответов

Компиляция Httrack на MAC OS X

Я пытаюсь скомпилировать httrack на моем MAC. ./configure успешно. Но при компиляции пакета я получаю следующую ошибку и не могу ее исправить. In file included from htscore.c:40: In file included from ./htscore.h:81: In file included from ./htslib.h…
16 дек '15 в 19:20
2 ответа

httrack wget скручиваемость

В Интернете существует ряд инструментов для загрузки статической копии веб-сайта, например HTTrack. Существует также множество инструментов, в том числе коммерческих, для "удаления" контента с веб-сайта, такого как Mozenda. Тогда есть инструменты, к…
30 сен '13 в 15:39
0 ответов

Как не создавать пустые папки?

Я пытаюсь загружать только изображения с определенного веб-сайта, сохраняя исходную структуру вложенности папок, где изображения расположены на сервере веб-сайта. В настройках фильтра я устанавливаю типы файлов для скачивания, например: +www.example…
04 авг '17 в 11:25
1 ответ

HTTrack дает 404 на URL-адресах Unicode с немецкими специальными символами

Я понял, что HTTrack не может загружать файлы, если в URL есть специальные символы, например, немецкий ß - возвращает ответ 404. Ошибки выглядят как на скриншоте: Есть ли в HTTrack какие-либо настройки, позволяющие ему работать с такими персонажами?…
04 авг '17 в 13:50
0 ответов

Получение полной веб-страницы, включая динамически загружаемые ссылки / изображения

проблема Загрузка полной рабочей автономной копии сайта, который динамически загружает ссылки / изображения Исследование Есть вопросы (например, [1], [2], [3]) о Stackru, направленные на решение этой проблемы, большинство из которых имеют лучшие отв…
15 апр '18 в 17:11
0 ответов

Загрузка всех флеш-игр с веб-сайта с помощью HTtrack (или другого)

Я пытаюсь просто загрузить все.swf(ну, я хочу только игры) с веб-сайта, используя Httrack, и я понятия не имею, что я делаю. Такие сайты, как flonga.com или armorgames.com, если у вас есть предложения по флеш-играм, это было бы здорово.:D
20 авг '18 в 15:48
1 ответ

Удалить URL домена с загруженного сайта с помощью HTTrack

Я загрузил полный сайт HTTrack. Но после загрузки сайта все URL содержат URL-адрес доменного имени сайта, например: www.example.com/index.html вместо index.html, есть ли способ удалить этот URL-адрес?
10 сен '16 в 18:30
3 ответа

Неверные атрибуты srcset из httrack

Я спайдерил сайт с httracks и генерировал много файлов на разных уровнях. Но сайт использует picture / source теги с srcset атрибуты, которые httrack не обрабатывает, все эти картинки не работают в автономном режиме. httrack может видеть ссылки, есл…
20 сен '17 в 11:56
1 ответ

Node.js получает HTTP_USER_AGENT и блокирует HTTrack

Я хочу заблокировать всех ботов (например, HTTrack) на моем сайте. Обычно я бы использовал файл.htaccess для блокировки ботов через RewriteCond %{HTTP_USER_AGENT} HTTrack [NC,OR], Тем не менее, мой сервер работает под управлением Node.js Express. Ка…
25 апр '16 в 16:30
1 ответ

HTTrack возвращает файл не найден

Я загрузил веб-сайт с HTTrack, используя следующую команду: /usr/local/bin/httrack https://www.website.com -O /Users/mainuser/Desktop/website -n -j Затем я обнаружил файл index.html в папке сайта и запустил его. Chrome возвращает сообщение: файл не …
09 окт '16 в 11:49