Описание тега unix-text-processing

1 ответ

Regex для соответствия блоку местоположения nginx?

Я работаю над сценарием bash, который может добавлять блоки местоположения nginx в файл, а также удалять их, если они уже существуют. Для удаления блока, если он уже существует, я сделал следующее регулярное выражение. Регулярное выражение должно со…
22 июн '21 в 12:58
2 ответа

Удаление строк на основе повторяющегося первого слова без учета регистра

У меня есть 1M векторов слов в формате fasttext (игнорируя первую строку, содержащую размер словаря и тусклость) . Каждая строка представляет собой слово, за которым следуют 300 чисел, разделенных пробелами, например. Word 1.00 0.50 -2.30 WORD 0.90 …
24 июн '21 в 02:15
5 ответов

Извлечь подстроки между строками

У меня есть файл с таким текстом: ###interest1 moreinterest1### sometext ###interest2### not-interesting-line sometext ###interest3### sometext ###interest4### sometext othertext ###interest5### sometext ###interest6### Я хочу извлечь все строки меж…
24 июн '21 в 17:50
2 ответа

Miller - игнорировать допустимые имена полей при использовании -N

я использую miller для обработки некоторых файлов CSV, например: mlr --mmap --csv --skip-comments -N cut -f 2 my.csv Он работает хорошо, но некоторые из файлов CSV содержат имена полей, а некоторые нет, поэтому я использую -N. В файлах с именами пол…
24 июн '21 в 22:46
1 ответ

Удалить раздел из файла в зависимости от его содержимого

Как удалить раздел конфигурации, содержащий config B2в следующем файле с помощью bash? Любое быстрое решение с использованием sed или же awkили похожие? Если это помогает, разные разделы разделяются пустой строкой. Входной файл: section X config A1 …
25 июн '21 в 13:16
1 ответ

Сценарий оболочки для очистки файла listener.ora

у нас есть файл listener.ora, как показано ниже [oracle@orahow admin]$ more listener.ora LISTENER = (DESCRIPTION_LIST = (DESCRIPTION = (ADDRESS = (PROTOCOL = TCP)(HOST = host-ip-address)(PORT = 1521)) (ADDRESS = (PROTOCOL = IPC)(KEY = extproc)) ) ) …
26 июн '21 в 13:24
10 ответов

Преобразование всех числовых сокращений в числовые значения в текстовом файле

Я хотел бы преобразовать все числовые сокращения, такие как 1K, 100K, 1M и т. Д. В текстовом файле, в простые числовые значения, такие как 1000, 100000, 1000000 и т. Д. Так, например, если у меня есть следующий текстовый файл: 1.3K apples 87.9K oran…
02 янв '21 в 07:58
5 ответов

Как отформатировать файл TXT в структурированный файл CSV в bash?

Я хотел получить некоторую информацию о температуре процессора на моем Linux Server (OpenSuse Leap 15.2). Поэтому я написал сценарий, который собирает данные каждые 20 секунд и записывает их в текстовый файл. Теперь я удалил все ненужные данные (нап…
29 июн '21 в 15:58
3 ответа

удалить закрывающие скобки из файла

Как я могу эффективно удалить закрывающие скобки из файла с помощью сценария bash (первое появление [ и последнее появление ]в файле)? Следует сохранить все скобки, которые находятся внутри внешних скобок и могут занимать несколько строк. Могут прис…
30 июн '21 в 01:49
2 ответа

замените новую строку пробелом, если следующая строка начинается с символа слова

У меня большой текстовый файл, который выглядит как some random : demo text for illustration, can be long and : some more here is : another one Мне нужен результат вроде some random : demo text for illustration, can be long and : some more here is :…
03 июл '21 в 16:01
3 ответа

Как извлечь текст из журнала доступа?

Я новичок в этом. Я пытаюсь извлечь текст из журнала доступа в новый файл. Мой файл журнала выглядит так: 111.111.111.111 - - [02/Jul/2021:18:35:19 +0000] "GET /api/items HTTP/2.0" 304 0 "https://example.com/some/text/call-log?roomNo=5003" "Mozilla …
04 июл '21 в 18:39
2 ответа

AWK: объединить и обработать три или более файлов методом, аналогичным подходу FNR==NR.

Обновлено окончательным кодом и желаемым результатом в END блок Я создал новый массив arr4 с элементами, где оба arr1 а также arr2имеют общего, вдохновленные этим ответом. Получите общие значения в 2 массивах в сценариях оболочки. (Для минимально во…
08 июл '21 в 14:35
3 ответа

Bash обрезать часть текста [дубликат]

У меня есть результат, который выглядит так root@machine:path# someapp report | grep Lost Lost Workers: 0 Как я могу найти только цифру в конце? Спасибо
20 июл '21 в 14:32
2 ответа

gsub: удалить до первого появления вместо последнего появления данного символа в строке

У меня есть html-файл, из которого я в основном пытаюсь удалить первые появления <...> с участием sub/ gsub функциональные возможности. Я использовал регулярное выражение awk . * + в соответствии с чем-либо между <. Однако первое появление …
02 сен '21 в 10:58
2 ответа

Разделить текстовый файл Markdown по регулярному выражению, определяющему заголовки

Я пытаюсь использовать программу командной строки, чтобы разбить более крупный текстовый файл на куски с помощью: разделить на определенный шаблон регулярного выражения имена файлов, определенные группой захвата в этом шаблоне регулярного выражения …
2 ответа

Как я могу вставить новую строку в текстовый файл через каждые две другие строки?

Начиная с этого, example.txt 1.qwer 2.asdf 3.xzcv 4.cbvn 5.erty Идя к этому, apendedtext.txt 1.append 2.qwer 3.asdf 4.append 5.xzcv 6.cbvn 7.append
03 сен '21 в 02:16
1 ответ

как проверить, не содержит ли поле в одном файле список значений из другого файла в UNIX

У меня есть два файла, в одном есть данные, которые являются транзакционной ценностью для этого столбца. Предположим, код валюты, а другой файл имеет допустимый / ожидаемый код валюты. Файл1: ID | col1 | curr_cd 1 | abc | INR 2 | def | долл. США 3 |…
19 окт '21 в 06:50
0 ответов

заменить corpid пробелом в текстовом файле с помощью команды sed

У меня есть файл с идентификатором сотрудника и другими данными. Файл выглядит так #send email a:b:c:12 GMT:S658072@gmail.com:east-1:prod b:d:e:f:S987654:east-1:dr Мое требование — удалить идентификатор сотрудника с @gmail.com и даже без него. Так п…
24 янв '22 в 09:08
2 ответа

Обработка текста с несколькими разделителями в awk

У меня есть текст, который выглядит так: Application.||dates:[2022-11-12]|models:[MODEL1]|count:1|ids:2320 Application.||dates:[2022-11-12]|models:[MODEL1]|count:5|ids:2320 Я хочу номер из count:1столбцы так 1и я хочу сохранить эти числа в массиве. …
29 янв '22 в 19:30
2 ответа

Как извлечь имя ветки, используя регулярное выражение и sed?

Как я могу извлечь имя ветки из строки с помощью bash? Например, у меня есть следующая команда: branch=$(git branch -a --contains $sha) Это может вернуть: * branch-1.0(префикс всегда звездочка) branch-2.0 remotes/origin/branch-2.0(здесь может быть н…