Создавать эскизы с помощью WWW::Mechanize::FireFox с помощью Mozrepl - несколько попыток отладки
Хорошо, я запускаю этот скрипт, который написан, чтобы сделать несколько скриншотов веб-сайтов, у меня также работает Mozrepl
здесь у нас есть файл с некоторыми запрошенными URL-адресами... обратите внимание, что это только короткий фрагмент реального списка - реальный список намного длиннее. содержит более 3500 строк и URL
http://www.unifr.ch/sfm
http://www.zug.phz.ch
http://www.schwyz.phz.ch
http://www.luzern.phz.ch
http://www.schwyz.phz.ch
http://www.phvs.ch
http://www.phtg.ch
http://www.phsg.ch
http://www.phsh.ch
http://www.phr.ch
http://www.hepfr.ch/
http://www.phbern.ch
http://www.ph-solothurn.ch
http://www.pfh-gr.ch
http://www.ma-shp.luzern.phz.ch
http://www.heilpaedagogik.phbern.ch/
Что странного в выводе - см. ниже... Вопрос: должен ли я изменить скрипт
почему я получаю вывод с помощью следующего маленького скрипта:
#!/usr/bin/perl
use strict;
use warnings;
use WWW::Mechanize::Firefox;
my $mech = new WWW::Mechanize::Firefox();
open(INPUT, "<urls.txt") or die $!;
while (<INPUT>) {
chomp;
print "$_\n";
$mech->get($_);
my $png = $mech->content_as_png();
my $name = "$_";
$name =~s/^www\.//;
$name .= ".png";
open(OUTPUT, ">$name");
print OUTPUT $png;
sleep (5);
}
смотрите здесь ошеломляющий вывод - честно говоря, мне никогда не приходилось получать такой забавный вывод... мне нужно отладить весь код.... см. ниже,
http://www.unifr.ch/sfm
print() on closed filehandle OUTPUT at test_3.pl line 20, <INPUT> line 2.
http://www.zug.phz.ch
print() on closed filehandle OUTPUT at test_3.pl line 20, <INPUT> line 3.
http://www.schwyz.phz.ch
print() on closed filehandle OUTPUT at test_3.pl line 20, <INPUT> line 4.
http://www.luzern.phz.ch
print() on closed filehandle OUTPUT at test_3.pl line 20, <INPUT> line 5.
http://www.schwyz.phz.ch
print() on closed filehandle OUTPUT at test_3.pl line 20, <INPUT> line 6.
http://www.phvs.ch
print() on closed filehandle OUTPUT at test_3.pl line 20, <INPUT> line 7.
http://www.phtg.ch
print() on closed filehandle OUTPUT at test_3.pl line 20, <INPUT> line 8.
http://www.phsg.ch
print() on closed filehandle OUTPUT at test_3.pl line 20, <INPUT> line 9.
http://www.phsh.ch
print() on closed filehandle OUTPUT at test_3.pl line 20, <INPUT> line 10.
http://www.phr.ch
print() on closed filehandle OUTPUT at test_3.pl line 20, <INPUT> line 11.
http://www.hepfr.ch/
print() on closed filehandle OUTPUT at test_3.pl line 20, <INPUT> line 12.
http://www.phbern.ch
Некоторые размышления: ну, во-первых, я думаю, что это не очень серьезная ошибка - я думаю, что мне нужно отладить ее, и тогда она будет работать лучше. Во-вторых, я сначала подумал, что сценарий "перегружает машину"? Теперь я не совсем уверен в этом: симптомы выглядят странно, но я думаю, что нет необходимости заключать "перегрузку машины"
В-третьих, я думаю о некоторых шагах, которые необходимо предпринять, чтобы проблема вообще была связана с WWW::Mechanize::Firefox? Это подводит меня к тому, что означает предупреждение Perl, и к идее использовать диагностическую прагму, чтобы получить больше объяснений: что вы думаете?
print() on unopened filehandle FH at -e line 1 (#2) (W unopened) An I/O operation was attempted on a filehandle that w +as never initialized.
во-первых - нам нужно сделать вызов open(), sysopen () или so + cket(), или вызвать конструктор из пакета FileHandle, кроме того - альтернативно, print() в закрытом дескрипторе файла OUTPUT также дает много ответов это скажет нам, что мы не использовали autodie, а также не проверяли возвращаемое значение open. Прежде всего, я должен отладить его и убедиться, что ошибка обнаружена [/QUOTE]
Но после некоторых размышлений я думаю, что стоит поближе взглянуть на все тестовые вещи, что вы думаете об идее, всегда проверяющей, чтобы убедиться, что файл открыт перед его использованием. Это означает, что мы должны также войти в привычка использовать три
arg open():
open my $fh, '>', $name or die "Can't open file $name : $!";
print $fh $stuff;
хорошо - я думаю, что мы можем или должны обойти это без использования die()
, но у нас должен был быть ручной метод, чтобы сообщить нам, какие файлы не могут быть созданы. В нашем случае все выглядит так, как показано выше...
обновить в выборе хорошего имени файла, вы имеете в виду, что мне нужно иметь имя файла для хранения изображений.. Примечание: я хочу хранить все из них локально. Но если у меня есть огромный список URL-адресов, то я получаю огромный список выходных файлов. Поэтому мне нужно иметь хорошие имена файлов. Можем ли мы отразить эти вещи и потребности в программе!?
самое последнее обновление; Кажется, есть некоторые ошибки с Mechanize.... я так думаю!!!
1 ответ
Если вы хотите распечатать двоичные данные (файл jpg), вы должны установить их явно. Во-вторых, закройте обработчик файлов, если он вам больше не нужен, и вы "или умрете" при открытии. В-третьих, выберите хорошее имя файла.
С Уважением,
http://perldoc.perl.org/functions/binmode.html
#!/usr/bin/perl
use strict;
use warnings;
use WWW::Mechanize::Firefox;
my $mech = new WWW::Mechanize::Firefox();
open(INPUT, "<urls.txt") or die $!;
while (<INPUT>) {
chomp;
next if $_ =~ m/http/i;
print "$_\n";
$mech->get($_);
my $png = $mech->content_as_png();
my $name = "$_";
$name =~s#http://##is;
$name =~s#/##gis;$name =~s#\s+\z##is;$name =~s#\A\s+##is;
$name =~s/^www\.//;
$name .= ".png";
open(my $out, ">",$name) or die $!;
binmode($out);
print $out $png;
close($out);
sleep (5);
}