Описание тега text-parsing
Text parsing is a variation of parsing which refers to the action of breaking a stream of text into different components, and capturing the relationship between those components.
5
ответов
Разобрать два значения из файла
Часть моего файла выглядит так: STATUS REPORT FOR JOB: Job_logging Generated: 2014-03-14 07:05:03 Job start time=2014-03-13 06:37:49 Job end time=2014-03-13 06:37:51 Job elapsed time=00:00:02 Job status=1 (Finished OK) Stage: Oracle_Connector_0, 1 r…
14 мар '14 в 12:36
1
ответ
Соответствие регулярных выражений Bash
У меня есть такой текст ниже: Insights into Wireless 53m 16s Insights into Wireless8m 34s New Terms to Learn11m 19s Advantages & Disadvantages5m 50s Types of Wi-Fi Networks2m 39s Wi-Fi Standards7m 24s Wi-Fi Authentication Modes3m 11s Chalking4m …
23 окт '16 в 06:56
1
ответ
log parser 2.2 запрос, анализ и проверка текста
Существует простой текстовый файл, который необходимо проанализировать с помощью анализатора журнала. Я только начал использовать анализатор логов, но не понял, каков его предел разбора. Я имею в виду, могу ли я сделать такую вещь, используя logpa…
11 май '11 в 12:05
1
ответ
Regex для токенизации строки в класс
msiinv 2015\03\22 14:58:10 SSMSBoost for SSMS 2012 Product code: {94EDFFE7-E4F4-4C9B-A57E-C7267BB4A777} Product state: (5) Installed. Assignment: per user Package code: {5D9DA43D-E03A-4420-A8AF-3D2FFBA1A696} Version: 2.15.5473.18051 Publisher: Solut…
23 мар '15 в 10:03
2
ответа
Как извлечь часть данных, которые мы получаем с сайта, используя url.open()
Я написал программу, которая подключается к этому сайту http://mbox.dr-chuck.net/sakai.devel/1/2 Мне нужно разобрать его и получить электронную почту на этом сайте url = http://mbox.dr-chuck.net/sakai.devel/1/2 data = urllib.urlopen(url).read() for …
07 фев '17 в 13:44
4
ответа
Гибкие стратегии анализа текста
проблема Я пытаюсь найти гибкий способ анализа содержимого электронной почты. Ниже приведен пример фиктивного текста письма, с которым я работаю. Я также хотел бы избежать регулярных выражений, если это вообще возможно. Тем не менее, в этот момент м…
28 янв '11 в 18:42
1
ответ
Парсинг информации из таблицы
Есть интернет-сайт, который я хотел бы проверить, изменился ли результат поиска на этом интернет-сайте с тех пор, как я в последний раз проверял наличие изменений. На сайте есть 2 запрошенных поля, которые необходимо заполнить (например, "дата рожде…
02 май '12 в 11:46
1
ответ
JavaScript Разбор текста регулярного выражения
У меня есть строка, подобная следующей ~~<b>A<i>C</i></b>~~/~~<u>D</u><b>B</b>~~has done this. Я пытаюсь получить текст внутри тега . я стараюсь <b>(.+)</b> Но я получаю <b>A<i>…
24 апр '14 в 14:59
0
ответов
Python - Разделение несовместимых столбцов в текстовом файле с непоследовательным интервалом и разреженными данными
У меня есть текстовый файл, который является банковской выпиской OCRed, которую я обрабатываю с использованием Python 2.7. В настоящее время я извлекаю название банка, реквизиты счета и список транзакций. Список транзакций в настоящее время хранится…
20 ноя '16 в 19:45
3
ответа
Как получить фрагменты текста из строки в Ruby?
Если пользователь отправляет строку вроде: Мои планы в гостиной #plans #livingroom @cbmeeks #design @moe @larry - это круто! Я хочу иметь следующие массивы / строки: text = "My living room plans" tags = ['plans', 'livingroom', 'design'] people = ['c…
07 янв '12 в 05:01
1
ответ
Код VBA для продолжения форматирования с использованием текста в столбец, когда некоторые ячейки пусты
Поскольку мои знания VBA невелики, я обычно записываю нужные мне макросы. Поскольку у меня есть столбцы с датой и временем в одной и той же ячейке, я использовал функцию Excel "Текст в столбцы" и записал ее, придумав код, приведенный ниже. Однако, е…
15 июл '16 в 06:23
4
ответа
Разбор вложенного текста в C#
Если у меня есть ряд строк, которые имеют этот базовый формат: "[id value]"//id and value are space delimited. id will never have spaces Затем они могут быть вложены так: [a] [a [b value]] [a [b [c [value]]] Таким образом, каждый элемент может иметь…
12 окт '10 в 07:25
3
ответа
Java: Как читать файл построчно, игнорируя "\n"
Я пытаюсь прочитать строку текстового файла в каждой строке. Строки разделяются с помощью возврата каретки ("\r\n"), и LineFeed (\ "n") допускается в текстовых полях, разделенных табуляцией. Поскольку я хочу читать строку "Файл" на строку, я хочу, ч…
23 май '13 в 10:55
2
ответа
Пакет: Как мне разобрать строку, содержащую путь к файловой системе?
У меня есть строка, содержащаяся в переменной, например: "C:\Users\SomeUser\Desktop\SomeFolder\File.jar" Я хотел бы проанализировать File.jar из этой строки в другую переменную. В настоящее время я немного работаю с кодом: FOR /f "tokens=1-6 Delims=…
04 дек '14 в 04:11
3
ответа
Обнаружение ошибок и создание отчетов с использованием Maybe
Я пишу синтаксический анализатор высказываний в Haskell. Сейчас я выполняю разбор вручную как учебное упражнение. Со временем я займусь Парсек. В то же время я пытаюсь обернуть голову вокруг монад. В частности, я использую Maybe сообщать об ошибках …
12 июн '13 в 00:47
5
ответов
Как убрать комментарии из файла sql raw
У меня проблема с очисткой комментариев и пустых строк из уже существующего файла sql. Файл содержит более 10 тыс. Строк, поэтому его очистка вручную невозможна. У меня есть небольшой скрипт на Python, но я не знаю, как обрабатывать комментарии внут…
03 май '11 в 15:22
3
ответа
Как я могу выполнить синтаксический анализ всех значений после специального тега
У меня есть текстовый файл, структурированный следующим образом. [email] emailAddress emailAddress emailAddress [somthingelse] stuff stuff stuff так далее... Я безуспешно пробовал несколько методов регулярных выражений, чтения файлов и потокового чт…
12 апр '18 в 14:13
1
ответ
Сравнение времени в Excel, отформатированного как текст (включая отрицательное время)
Необходимо отфильтровать все строки, которые имеют отрицательное время или время менее 20 часов. Продолжительность времени падает до -300 часов. Поскольку я импортирую эти данные, он импортирует как =TEXT("-20:42","[h]:mm") или же =TEXT("3:29","[h]:…
22 май '18 в 14:44
1
ответ
Использование Django для передачи текста для обработки Python и возврата ответа
Я новичок в Django и борюсь с передачей данных туда и обратно. Моя песочница сейчас пытается создать быструю страницу с текстовой областью, чтобы принять введенный JSON, а затем в основном ответить обратно выводом этого ввода, проходящего через json…
04 мар '16 в 17:29
2
ответа
C# - Разделить полностью заглавную строку на отдельные слова (без пробелов)
В настоящее время я работаю над проектом, где мне нужно будет отделить отдельные слова от строки. Подвох в том, что все слова в строке написаны заглавными буквами и не имеют пробелов. Ниже приведен пример вида ввода, который получает программа: "COM…
14 ноя '17 в 02:17