Как сопоставить каждую последующую пунктуацию толстой кишки в Комодо?

В текстовом файле диалога (сценария фильма) я должен сопоставить все имена в начале предложения с последующей пунктуацией двоеточия :, Как мне сделать это с помощью Komodo?

Вот пример текста:

Мартин: Давайте покажем мистеру Хуперу наш гекс. Вот. Хупер: Ах, жертва опознана как Кристина Уоткинс. Кавказская женщина. Мартин: Да, сейчас, вот где у нас это есть. Хупер: Вероятная авария на лодке. Мартин: Да. Хупер: Рост и вес жертвы можно оценить только по частичным останкам. Туловище было перерезано в середине грудной клетки. Здесь нет крупных органов, останков.

2 ответа

Следующее регулярное выражение найдет все имена, которые имеют : после них.

\s?(\w+)(?=:)

Независимо от того, находятся ли диалоги в отдельных строках или все они в однострочных, это будет работать в обоих сценариях.

Попробуйте приведенное выше регулярное выражение на https://regex101.com/r/WyPGrE/3.

Я не тестировал его с Komodo, но вы можете разделить вывод по динамикам с Unix/Linux sed команда RegEx

sed -e "s/\(\w\+\):/\\n\1:/g" text.txt

Его вывод:

Martin: Let's show Mr. Hooper our, uh, hex. Here. 
Hooper: Ah, victim identified as Christine Watkins. Female Caucasian. 
Martin: Yeah now, now here's where we have it. 
Hooper: Probable boating accident. 
Martin: Yeah. 
Hooper: The height and weight of the victim can only be estimated from the partial remains. The torso has been severed in mid-thorax. There are no major organs remai.
Другие вопросы по тегам