Как объединить три файла Conllu с библиотекой Conllu python?
Я впервые работаю с файлами conllu. Я не могу найти способ объединить эти файлы в библиотеке Py thon Conllu. Любые зацепки были бы полезны. Спасибо.
0 ответов
Каждый раз, когда вы вызываете parse(), вы получаете обратно список TokenLists. Таким образом, объединение нескольких файлов может быть выполнено путем объединения этих списков токенов.
Пример:
from io import open
from conllu import parse_incr
files = ["file1.conllu", "file2.conllu", "file3.conllu"]
merged_tokenlists = []
for file in files:
data_file = open("file1.conllu", "r", encoding="utf-8")
for tokenlist in parse_incr(data_file):
merged_tokenlists.append(tokenlist)
Автор библиотеки conllu, рад видеть, что люди ее используют!