Как использовать awk для разбора файла с несколькими типами записей
Хотите обработать входной файл с awk
, Существует несколько типов записей, обозначенных одним из полей во входящих записях. Когда тип записи содержит определенное значение, мне нужно обработать N дополнительных записей после текущей, которые содержат данные, относящиеся к этому типу записи.
Это выполнимо с awk
?
Вот пример формата входящего файла:
1 [001:01.0] [ 2] IOCTL 048477589
...
...
28 [002:02.0] [ 2] TX(56)
81480d0d 0a524141 435a5955 5705243 .H...RAACZYW RC
43544848 41303033 32203034 3032325 CTHHA0032 04025
332d4343 43432d2d 52435554 4848412 3-CCCC--RCETHHA
Таким образом, в основном, когда запись типа TX найдена, прочитайте следующие N записей, обрабатывающих данные, читая в шестнадцатеричном и ASCII-эквиваленте.
??
1 ответ
Не совсем понятно, что вы хотите сделать, но вот что может послужить началом. Заменить print
заявления с более существенной обработкой, по мере необходимости.
awk '
/^[ 0-9][0-9] / {
# This is a record header line. Check if it is a TX.
inTx = ($0 ~ / TX\([0-9]*\)$/);
if (inTx) {
print "Start of TX record.";
next; # Avoid printing the header line below.
}
}
inTx { print "TX:", $0; }
' file.txt
Вот несколько более простой пример файла, чтобы было немного яснее, что делает скрипт:
1 [001:01.0] [ 2] IOCTL 048477589
...
...
28 [002:02.0] [ 2] TX(56)
81480d0d 0a524141 435a5955 5705243 .H...RAACZYW RC
43544848 41303033 32203034 3032325 CTHHA0032 04025
332d4343 43432d2d 52435554 4848412 3-CCCC--RCETHHA
1 [001:01.0] [ 2] IOCTL 048477589
2 [dsfsdsdf] [ 2] BLORT
29 [002:02.0] [ 2] TX(77)
abbababa 0a524141 435a5955 5705243 STUFFSTUFFSTUFF
43544848 bbbbbbbb 32203034 d0d0d0d CTHULUCTHULUCTH
332d4343 43432d2d cccccccc 4848412 BLORTZORCHFNORD
1 [001:01.0] [ 2] IOCTL 048477589
2 [dsfsdsdf] [ 2] BLORT
Стенограмма запуска сценария:
Start of TX record.
TX: 81480d0d 0a524141 435a5955 5705243 .H...RAACZYW RC
TX: 43544848 41303033 32203034 3032325 CTHHA0032 04025
TX: 332d4343 43432d2d 52435554 4848412 3-CCCC--RCETHHA
Start of TX record.
TX: abbababa 0a524141 435a5955 5705243 STUFFSTUFFSTUFF
TX: 43544848 bbbbbbbb 32203034 d0d0d0d CTHULUCTHULUCTH
TX: 332d4343 43432d2d cccccccc 4848412 BLORTZORCHFNORD