В Perl, как я могу прочитать весь файл в строку?

Question

В Perl, как я могу прочитать весь файл в строку?

Я пытаюсь открыть файл.html в виде одной большой длинной строки. Вот что у меня есть:

open(FILE, 'index.html') or die "Can't read file 'filename' [$!]\n";  
$document = <FILE>; 
close (FILE);  
print $document;

что приводит к:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN

Тем не менее, я хочу, чтобы результат был похож на:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">

Таким образом, я могу искать весь документ легче.

131

string perl slurp

Источник

user117554 05 июн '09 в 00:04

20 ответов

Решение

Я бы сделал это так:

my $file = "index.html";
my $document = do {
    local $/ = undef;
    open my $fh, "<", $file
        or die "could not open $file: $!";
    <$fh>;
};

Обратите внимание на использование версии с тремя аргументами open. Это намного безопаснее, чем старые версии с двумя (или одним) аргументами. Также обратите внимание на использование лексического дескриптора файла. По многим причинам лексические файловые дескрипторы более хороши, чем старые варианты без слов. Мы пользуемся преимуществом одного из них: они закрываются, когда выходят за рамки.

102

Источник

user78259 05 июн '09 в 01:28

С File:: Slurp:

use File::Slurp;
my $text = read_file('index.html');

Да, даже вы можете использовать CPAN.

82

Источник

user19068 05 июн '09 в 08:55

Все посты немного не-идиоматичны. Идиома это:

open my $fh, '<', $filename or die "error opening $filename: $!";
my $data = do { local $/; <$fh> };

В большинстве случаев нет необходимости устанавливать $/ to undef,

60

Источник

user8457 05 июн '09 в 03:20

От perlfaq5: Как я могу прочитать весь файл сразу?:

Вы можете использовать модуль File::Slurp, чтобы сделать это за один шаг.

use File::Slurp;

$all_of_it = read_file($filename); # entire file in scalar
@all_lines = read_file($filename); # one line per element

Обычный подход Perl для обработки всех строк в файле состоит в том, чтобы делать это по одной строке за раз:

open (INPUT, $file)     || die "can't open $file: $!";
while (<INPUT>) {
    chomp;
    # do something with $_
    }
close(INPUT)            || die "can't close $file: $!";

Это значительно эффективнее, чем считывание всего файла в память в виде массива строк и последующая обработка его по одному элементу за раз, что часто - если не почти всегда - неправильный подход. Всякий раз, когда вы видите, кто-то делает это:

@lines = <INPUT>;

Вы должны долго и усердно думать о том, зачем вам все загружать сразу. Это просто не масштабируемое решение. Вы также можете найти более интересным использование стандартного модуля Tie::File или привязок $DB_RECNO модуля DB_File, которые позволяют привязать массив к файлу так, чтобы при доступе к элементу массив фактически обращался к соответствующей строке в файле.,

Вы можете прочитать все содержимое файлового дескриптора в скаляр.

{
local(*INPUT, $/);
open (INPUT, $file)     || die "can't open $file: $!";
$var = <INPUT>;
}

Это временно отстраняет ваш разделитель записей и автоматически закрывает файл при выходе из блока. Если файл уже открыт, просто используйте это:

$var = do { local $/; <INPUT> };

Для обычных файлов вы также можете использовать функцию чтения.

read( INPUT, $var, -s INPUT );

Третий аргумент проверяет размер байта данных в файловом дескрипторе INPUT и считывает столько байтов в буфер $var.

19

Источник

user2766176 05 июн '09 в 17:06

Либо установить $/ в undef (см. ответ jrockway) или просто объедините все строки файла:

$content = join('', <$fh>);

Рекомендуется использовать скаляры для файловых дескрипторов на любой версии Perl, которая его поддерживает.

8

Источник

user11260 05 июн '09 в 07:24

Простой способ это:

while (<FILE>) { $document .= $_ }

Другой способ - изменить разделитель входной записи "$/". Вы можете сделать это локально в пустом блоке, чтобы избежать изменения глобального разделителя записей.

{
    open(F, "filename");
    local $/ = undef;
    $d = <F>;
}

8

Источник

05 июн '09 в 00:12

Использование

 $/ = undef;

до $document = <FILE>;, $/ является разделителем входных записей, который по умолчанию является новой строкой. Переопределив его undef, вы говорите, что нет разделителя полей. Это называется режимом "slurp".

^{Другие решения, такие как} undef $/ ^{а также} local $/ ^{(но нет} my $/ ^{) redeclare $/ и, таким образом, производит тот же эффект.}

6

Источник

user1429450 14 мар '16 в 16:29

Еще один возможный способ:

open my $fh, '<', "filename";
read $fh, my $string, -s $fh;
close $fh;

5

Источник

user332348 12 май '13 в 00:43

Вы получаете только первую строчку от алмазного оператора <FILE> потому что вы оцениваете это в скалярном контексте:

$document = <FILE>;

В контексте списка / массива оператор diamond вернет все строки файла.

@lines = <FILE>;
print @lines;

3

Источник

user71650 05 июн '09 в 17:18

Это скорее предложение о том, как НЕ делать этого. Я только что плохо нашел ошибку в довольно большом Perl-приложении. Большинство модулей имели свои собственные файлы конфигурации. Чтобы прочитать файлы конфигурации в целом, я нашел эту единственную строку Perl где-то в Интернете:

# Bad! Don't do that!
my $content = do{local(@ARGV,$/)=$filename;<>};

Он переназначает разделитель строк, как описано выше. Но это также переназначает STDIN.

Это имело по крайней мере один побочный эффект, который стоил мне часов, чтобы найти: он не закрывает неявный дескриптор файла должным образом (так как он не вызывает closeсовсем).

Например, делая это:

use strict;
use warnings;

my $filename = 'some-file.txt';

my $content = do{local(@ARGV,$/)=$filename;<>};
my $content2 = do{local(@ARGV,$/)=$filename;<>};
my $content3 = do{local(@ARGV,$/)=$filename;<>};

print "After reading a file 3 times redirecting to STDIN: $.\n";

open (FILE, "<", $filename) or die $!;

print "After opening a file using dedicated file handle: $.\n";

while (<FILE>) {
    print "read line: $.\n";
}

print "before close: $.\n";
close FILE;
print "after close: $.\n";

результаты в:

After reading a file 3 times redirecting to STDIN: 3
After opening a file using dedicated file handle: 3
read line: 1
read line: 2
(...)
read line: 46
before close: 46
after close: 0

Странно то, что счетчик строки $. увеличивается для каждого файла на один. Он не сбрасывается и не содержит количества строк. И он не сбрасывается в ноль при открытии другого файла, пока не будет прочитана хотя бы одна строка. В моем случае я делал что-то вроде этого:

while($. < $skipLines) {<FILE>};

Из-за этой проблемы условие было ложным, потому что счетчик строки не был сброшен должным образом. Я не знаю, это ошибка или просто неправильный код... Также звоню close; Одер close STDIN; не помогает.

Я заменил этот нечитаемый код, используя open, string string и close. Однако решение, опубликованное Брэдом Гилбертом, также работает, поскольку вместо него используется явный дескриптор файла.

Три строки в начале можно заменить на:

my $content = do{local $/; open(my $f1, '<', $filename) or die $!; my $tmp1 = <$f1>; close $f1 or die $!; $tmp1};
my $content2 = do{local $/; open(my $f2, '<', $filename) or die $!; my $tmp2 = <$f2>; close $f2 or die $!; $tmp2};
my $content3 = do{local $/; open(my $f3, '<', $filename) or die $!; my $tmp3 = <$f3>; close $f3 or die $!; $tmp3};

который правильно закрывает дескриптор файла.

2

Источник

user1106285 20 фев '12 в 10:48

open f, "test.txt"
$file = join '', <f>

<f> - возвращает массив строк из нашего файла (если $/ имеет значение по умолчанию "\n") а потом join '' вставит этот массив в.

2

Источник

user2429014 28 май '13 в 14:36

Я бы сделал это самым простым способом, чтобы каждый мог понять, что происходит, даже если есть более разумные способы:

my $text = "";
while (my $line = <FILE>) {
    $text .= $line;
}

2

Источник

user3322273 08 май '14 в 20:07

Я не знаю, если это хорошая практика, но я использовал это:

($a=<F>);

1

Источник

user5820933 31 май '17 в 10:30

Для текстового файла без установки дополнительных модулей (только основные , т.е. установленные по умолчанию) можно попробовать так:

      use IO::File;
my $content = join '', IO::File->new($filename)->getlines;

0

Источник

user109396 29 авг '22 в 15:58

Вы можете просто создать подпрограмму:

#Get File Contents
sub gfc
{
    open FC, @_[0];
    join '', <FC>;
}

0

Источник

user2126689 30 дек '13 в 16:44

Еще один подход:

      sub configure_logger ( ) {
  my @configuration = DATA -> getlines;
  my $configuration = join( "\n", @configuration );
  Log::Log4perl -> init( \$configuration );
}

configure_logger();

my $logger = Log::Log4perl -> get_logger;

Здесь мы читаем дескриптор файла в массив (сgetlinesметод), а затем преобразовать значение массива в строку (используяjoin).

getlines — это встроенный в Perl метод дескриптора файла, полученный из автоматически загружаемого класса IO::Handle , который позволяет нам рассматривать дескрипторы файлов как объекты.

DATA — это специальный дескриптор файла в Perl, но он также может ссылаться на любой другой.

0

Источник

user13762488 06 окт '22 в 10:38

      use Path::Tiny qw( path );
 
my $file = 'data.txt';
my $data = path($file)->slurp_utf8;

Режим Slurp — чтение файла за один шаг: https://perlmaven.com/slurp

0

Источник

user3439968 12 май '22 в 00:38

Это все хорошие ответы. НО, если вы чувствуете себя ленивым, и файл не такой большой, и безопасность не является проблемой (вы знаете, что у вас нет испорченного имени файла), тогда вы можете выложить:

$x=`cat /tmp/foo`;    # note backticks, qw"cat ..." also works

-1

Источник

user256810 26 сен '12 в 08:29

Вы можете использовать cat в Linux:

@file1=\`cat /etc/file.txt\`;

-2

Источник

user1474509 27 дек '12 в 20:57

Другие вопросы по тегам string perl slurp

user100754 05 июн '09 в 00:18 2009-06-05 00:18 · Accepted Answer · 2009-06-05 00:18

Добавлять:

 local $/;

перед чтением из дескриптора файла. См. Как я могу прочитать весь файл сразу?, или же

 $ perldoc -q "весь файл"

См. Переменные, связанные с файловыми дескрипторами в perldoc perlvar а также perldoc -f local,

Кстати, если вы можете разместить свой скрипт на сервере, вы можете иметь все необходимые модули. См. Как мне сохранить мой собственный каталог module/library?,

Кроме того, Path:: Class:: File позволяет хлебать и извергать.

Path:: Tiny дает еще больше удобных методов, таких как slurp , slurp_raw , slurp_utf8 а также их spew двойники.