Как сопоставить каждую последующую пунктуацию толстой кишки в Комодо?
В текстовом файле диалога (сценария фильма) я должен сопоставить все имена в начале предложения с последующей пунктуацией двоеточия :
, Как мне сделать это с помощью Komodo?
Вот пример текста:
Мартин: Давайте покажем мистеру Хуперу наш гекс. Вот. Хупер: Ах, жертва опознана как Кристина Уоткинс. Кавказская женщина. Мартин: Да, сейчас, вот где у нас это есть. Хупер: Вероятная авария на лодке. Мартин: Да. Хупер: Рост и вес жертвы можно оценить только по частичным останкам. Туловище было перерезано в середине грудной клетки. Здесь нет крупных органов, останков.
2 ответа
Следующее регулярное выражение найдет все имена, которые имеют :
после них.
\s?(\w+)(?=:)
Независимо от того, находятся ли диалоги в отдельных строках или все они в однострочных, это будет работать в обоих сценариях.
Попробуйте приведенное выше регулярное выражение на https://regex101.com/r/WyPGrE/3.
Я не тестировал его с Komodo, но вы можете разделить вывод по динамикам с Unix/Linux sed
команда RegEx
sed -e "s/\(\w\+\):/\\n\1:/g" text.txt
Его вывод:
Martin: Let's show Mr. Hooper our, uh, hex. Here.
Hooper: Ah, victim identified as Christine Watkins. Female Caucasian.
Martin: Yeah now, now here's where we have it.
Hooper: Probable boating accident.
Martin: Yeah.
Hooper: The height and weight of the victim can only be estimated from the partial remains. The torso has been severed in mid-thorax. There are no major organs remai.