Как я могу фильтровать адреса электронной почты, принадлежащие определенному домену, используя Perl?
Как я могу сканировать файл, который содержит адреса электронной почты, разделенные символом новой строки, и избавиться от тех, которые принадлежат определенному домену, например hacker@bad.com
, Я хочу избавиться от всех адресов электронной почты, которые @bad.com
7 ответов
Использование grep
вместо Perl
grep -v '@bad\.com' inputfile > outputfile
На винде
findstr /v "@bad\.com" inputfile > outputfile
Email::Address
хороший модуль для работы с адресами электронной почты.
Вот пример, который может вызвать у вас аппетит:
use Email::Address;
my $data = 'this person email is hacker@bad.com
blah blah hacker@good.com blah blah
another@bad.com
';
my @emails = Email::Address->parse( $data );
my @good_emails = grep { $_->host ne 'bad.com' } @emails;
say "@emails"; # => hacker@bad.com hacker@good.com another@bad.com
say "@good_emails"; # => hacker@good.com
Следующее позволит вам иметь скрипт, который вы сможете усовершенствовать во времени... Вместо того, чтобы просто отфильтровывать @bad.com (что вы можете сделать с помощью простого grep), вы можете написать свой скрипт, чтобы вы могли легко определить, какие домены нежелательны.
my $bad_addresses = {'bad.com'=>1};
while (my $s = <>) {
print $s unless (is_bad_address($s));
}
sub is_bad_address {
my ($addr) = @_;
if ($addr=~/^([^@]+)\@([^@\n\r]+)$/o) {
my $domain = lc($2);
return 0 unless (defined $bad_addresses->{$domain});
return $bad_addresses->{$domain};
}
return 1;
}
Не слишком отличается от того, что сделали другие.
use strict;
use warnings;
my @re = map { qr/@(.*\.)*\Q$_\E$/ } qw(bad.com mean.com);
while (my $line = <DATA>) {
chomp $line;
if (grep { $line =~ /$_/ } @re) {
print "Rejected: $line\n";
} else {
print "Allowed: $line\n";
}
}
__DATA__
good@good.com
bad@bad.com
notbad@bad.comm.com
alsobad@bad.com
othergood@good.com
not@mean.com
good@reallymean.com
bad@really.mean.com
Это должно сделать:
$badDomain = "bad.com";
while(<>)
{
s{\s+$}{};
print "$_\n" if(!/\@$badDomain$/);
}
Perl
perl -ne 'print if !/@bad\.com/' file
AWK
awk '!/@bad\.com/' file
Этот код должен фильтровать все адреса @bad.com из входных файлов.
my @array = <>;
foreach(@array) {
if(!/\@bad.com$/) {
print $_;
}
}