Откройте POS-теги.txt-файл с тегами в Python
Я пытаюсь пометить несколько интервью на немецком языке. Я получил отличные результаты с ClassifierBasedGermanTagger, используя Tiger-Corpus. Я сохранил отмеченные результаты в виде файлов.txt, но из-за некоторых проблем, касающихся качества транскрипции, я хочу вернуться к файлам и внести некоторые изменения в слова или теги. Есть ли простой способ сделать это в Python?
Пока я попробовал nltk.corpus.reader function
, но я даже не был уверен, что это правильная функция для этого. я получил немного дальше с функцией str2tuple, используя код:
[nltk.tag.str2tuple(t) for t in sent.split()]
но это всегда будет разделять слова и теги
Это формат файла.txt:
("слово", "тег"),("слово", "тег"),("слово", "тег"), ...