Описание тега unix-text-processing
1
ответ
Regex для соответствия блоку местоположения nginx?
Я работаю над сценарием bash, который может добавлять блоки местоположения nginx в файл, а также удалять их, если они уже существуют. Для удаления блока, если он уже существует, я сделал следующее регулярное выражение. Регулярное выражение должно со…
22 июн '21 в 12:58
2
ответа
Удаление строк на основе повторяющегося первого слова без учета регистра
У меня есть 1M векторов слов в формате fasttext (игнорируя первую строку, содержащую размер словаря и тусклость) . Каждая строка представляет собой слово, за которым следуют 300 чисел, разделенных пробелами, например. Word 1.00 0.50 -2.30 WORD 0.90 …
24 июн '21 в 02:15
5
ответов
Извлечь подстроки между строками
У меня есть файл с таким текстом: ###interest1 moreinterest1### sometext ###interest2### not-interesting-line sometext ###interest3### sometext ###interest4### sometext othertext ###interest5### sometext ###interest6### Я хочу извлечь все строки меж…
24 июн '21 в 17:50
2
ответа
Miller - игнорировать допустимые имена полей при использовании -N
я использую miller для обработки некоторых файлов CSV, например: mlr --mmap --csv --skip-comments -N cut -f 2 my.csv Он работает хорошо, но некоторые из файлов CSV содержат имена полей, а некоторые нет, поэтому я использую -N. В файлах с именами пол…
24 июн '21 в 22:46
1
ответ
Удалить раздел из файла в зависимости от его содержимого
Как удалить раздел конфигурации, содержащий config B2в следующем файле с помощью bash? Любое быстрое решение с использованием sed или же awkили похожие? Если это помогает, разные разделы разделяются пустой строкой. Входной файл: section X config A1 …
25 июн '21 в 13:16
1
ответ
Сценарий оболочки для очистки файла listener.ora
у нас есть файл listener.ora, как показано ниже [oracle@orahow admin]$ more listener.ora LISTENER = (DESCRIPTION_LIST = (DESCRIPTION = (ADDRESS = (PROTOCOL = TCP)(HOST = host-ip-address)(PORT = 1521)) (ADDRESS = (PROTOCOL = IPC)(KEY = extproc)) ) ) …
26 июн '21 в 13:24
10
ответов
Преобразование всех числовых сокращений в числовые значения в текстовом файле
Я хотел бы преобразовать все числовые сокращения, такие как 1K, 100K, 1M и т. Д. В текстовом файле, в простые числовые значения, такие как 1000, 100000, 1000000 и т. Д. Так, например, если у меня есть следующий текстовый файл: 1.3K apples 87.9K oran…
02 янв '21 в 07:58
5
ответов
Как отформатировать файл TXT в структурированный файл CSV в bash?
Я хотел получить некоторую информацию о температуре процессора на моем Linux Server (OpenSuse Leap 15.2). Поэтому я написал сценарий, который собирает данные каждые 20 секунд и записывает их в текстовый файл. Теперь я удалил все ненужные данные (нап…
29 июн '21 в 15:58
3
ответа
удалить закрывающие скобки из файла
Как я могу эффективно удалить закрывающие скобки из файла с помощью сценария bash (первое появление [ и последнее появление ]в файле)? Следует сохранить все скобки, которые находятся внутри внешних скобок и могут занимать несколько строк. Могут прис…
30 июн '21 в 01:49
2
ответа
замените новую строку пробелом, если следующая строка начинается с символа слова
У меня большой текстовый файл, который выглядит как some random : demo text for illustration, can be long and : some more here is : another one Мне нужен результат вроде some random : demo text for illustration, can be long and : some more here is :…
03 июл '21 в 16:01
3
ответа
Как извлечь текст из журнала доступа?
Я новичок в этом. Я пытаюсь извлечь текст из журнала доступа в новый файл. Мой файл журнала выглядит так: 111.111.111.111 - - [02/Jul/2021:18:35:19 +0000] "GET /api/items HTTP/2.0" 304 0 "https://example.com/some/text/call-log?roomNo=5003" "Mozilla …
04 июл '21 в 18:39
2
ответа
AWK: объединить и обработать три или более файлов методом, аналогичным подходу FNR==NR.
Обновлено окончательным кодом и желаемым результатом в END блок Я создал новый массив arr4 с элементами, где оба arr1 а также arr2имеют общего, вдохновленные этим ответом. Получите общие значения в 2 массивах в сценариях оболочки. (Для минимально во…
08 июл '21 в 14:35
3
ответа
Bash обрезать часть текста [дубликат]
У меня есть результат, который выглядит так root@machine:path# someapp report | grep Lost Lost Workers: 0 Как я могу найти только цифру в конце? Спасибо
20 июл '21 в 14:32
2
ответа
gsub: удалить до первого появления вместо последнего появления данного символа в строке
У меня есть html-файл, из которого я в основном пытаюсь удалить первые появления <...> с участием sub/ gsub функциональные возможности. Я использовал регулярное выражение awk . * + в соответствии с чем-либо между <. Однако первое появление …
02 сен '21 в 10:58
2
ответа
Разделить текстовый файл Markdown по регулярному выражению, определяющему заголовки
Я пытаюсь использовать программу командной строки, чтобы разбить более крупный текстовый файл на куски с помощью: разделить на определенный шаблон регулярного выражения имена файлов, определенные группой захвата в этом шаблоне регулярного выражения …
02 сен '21 в 23:59
2
ответа
Как я могу вставить новую строку в текстовый файл через каждые две другие строки?
Начиная с этого, example.txt 1.qwer 2.asdf 3.xzcv 4.cbvn 5.erty Идя к этому, apendedtext.txt 1.append 2.qwer 3.asdf 4.append 5.xzcv 6.cbvn 7.append
03 сен '21 в 02:16
1
ответ
как проверить, не содержит ли поле в одном файле список значений из другого файла в UNIX
У меня есть два файла, в одном есть данные, которые являются транзакционной ценностью для этого столбца. Предположим, код валюты, а другой файл имеет допустимый / ожидаемый код валюты. Файл1: ID | col1 | curr_cd 1 | abc | INR 2 | def | долл. США 3 |…
19 окт '21 в 06:50
0
ответов
заменить corpid пробелом в текстовом файле с помощью команды sed
У меня есть файл с идентификатором сотрудника и другими данными. Файл выглядит так #send email a:b:c:12 GMT:S658072@gmail.com:east-1:prod b:d:e:f:S987654:east-1:dr Мое требование — удалить идентификатор сотрудника с @gmail.com и даже без него. Так п…
24 янв '22 в 09:08
2
ответа
Обработка текста с несколькими разделителями в awk
У меня есть текст, который выглядит так: Application.||dates:[2022-11-12]|models:[MODEL1]|count:1|ids:2320 Application.||dates:[2022-11-12]|models:[MODEL1]|count:5|ids:2320 Я хочу номер из count:1столбцы так 1и я хочу сохранить эти числа в массиве. …
29 янв '22 в 19:30
2
ответа
Как извлечь имя ветки, используя регулярное выражение и sed?
Как я могу извлечь имя ветки из строки с помощью bash? Например, у меня есть следующая команда: branch=$(git branch -a --contains $sha) Это может вернуть: * branch-1.0(префикс всегда звездочка) branch-2.0 remotes/origin/branch-2.0(здесь может быть н…
29 ноя '21 в 12:01