Откройте POS-теги.txt-файл с тегами в Python

Я пытаюсь пометить несколько интервью на немецком языке. Я получил отличные результаты с ClassifierBasedGermanTagger, используя Tiger-Corpus. Я сохранил отмеченные результаты в виде файлов.txt, но из-за некоторых проблем, касающихся качества транскрипции, я хочу вернуться к файлам и внести некоторые изменения в слова или теги. Есть ли простой способ сделать это в Python?

Пока я попробовал nltk.corpus.reader function, но я даже не был уверен, что это правильная функция для этого. я получил немного дальше с функцией str2tuple, используя код:

[nltk.tag.str2tuple(t) for t in sent.split()]

но это всегда будет разделять слова и теги

Это формат файла.txt:

("слово", "тег"),("слово", "тег"),("слово", "тег"), ...

0 ответов

Другие вопросы по тегам