Генерирование оценки ROUGE для каждого предложения

Я хочу выполнить задачу суммирования текста под наблюдением. во-первых, я должен предварительно обработать все обучающие файлы, чтобы получить оценку для каждого предложения (эти оценки являются нашими руководителями, позже). Я хочу знать, как генерировать оценку ROUGE для каждого предложения?

Я пишу свои коды на Python, и я использую от Pyrouge. к сожалению, я не понимаю, как это работает.

прежде чем я попытался сделать неконтролируемую задачу суммирования текста. Я генерирую сводки и помещаю их все в папку (я использую набор данных DUC2007, поэтому у меня 45 кластеров, и поэтому я генерирую 45 сводок). Я создаю 45 резюме в виде 45 текстовых файлов и помещаю их все в одну папку. Я запустил этот кусок кода, и все было хорошо, и я мог генерировать балл ROUGE для каждого резюме.

from pyrouge import Rouge155
r = Rouge155()
r.system_dir = "/home/mahsa/Desktop/summarization/summarization_dataset/DUC_2007/2007/Test_Data/duc2007_testdocs/main/temp/utf_8/"
r.model_dir = "/home/mahsa/Desktop/summarization/summaries/ref_sum_utf_8/"
r.system_filename_pattern = "all.(\d+).txt"
r.model_filename_pattern = "sum.[A-Z].#ID#.txt"
output = r.convert_and_evaluate()
print(output)
output_dict = r.output_to_dict(output)

Теперь я хочу генерировать оценку ROUGE для каждого предложения, а не для каждого резюме. теперь я должен поместить все предложения в файл, чтобы получить оценку для каждого из них? что-то проще?

0 ответов

Другие вопросы по тегам