Как удалить повторяющиеся строки в файле...AWK, SED, UNIQ не работает на моем файле

Question

Как удалить повторяющиеся строки в файле...AWK, SED, UNIQ не работает на моем файле

Я нахожу много способов сделать это, AWK, SED, UNIQ, но никто из них не работает над моим файлом.

Я хочу удалить дубликаты строк. Вот пример части моего файла:

KTBX
KFSO
KCLK
KTBX
KFSO
KCLK
PAJZ
PAJZ

ПРИМЕЧАНИЕ: мне пришлось вручную добавлять перевод строки, когда я вырезал и вставил из файла... по какой-то причине он помещал все переменные в одну строку. Заставляет меня думать, что мой текстовый файл с 44 000 строк на самом деле имеет только 1 строку? Есть ли способ изменить его, чтобы я мог удалить дубликаты?

2

awk sed duplicates lines uniq

Источник

user2651301 26 сен '13 в 21:28

2 ответа

Другие вопросы по тегам awk sed duplicates lines uniq

user2327328 27 сен '13 в 14:29 2013-09-27 14:29 · Answer 1 · 2013-09-27 14:29

Вы можете увидеть все непечатные символы с помощью этой команды:

od -c oldfile

Если все ваши записи находятся в одной строке, вы можете использовать sed, чтобы заменить пробел (пробел, табуляция, новая строка) переводом строки:

sed -e 's/\s\+/\n/g' oldfile > oldfile.1

Если у вас есть несколько строк, это awk one-liner:

awk '!x[$0]++' oldfile.1 > newfile

мой файл:

KTBX
KFSO
KCLK
PAJZ

user564335 27 сен '13 в 06:22 2013-09-27 06:22 · Answer 2 · 2013-09-27 06:22

Perl One-Liner:

файл perl -nle 'кроме ($hash{$_}++){print $_}'

1

Источник

user564335 27 сен '13 в 06:22