Как вывести данные в подходящий формат для кластеризации в WEKA?

У меня около 10000 текстовых файлов. Каждый текстовый файл содержит видео метаданные в виде:

Title: ...\n 
Video Id: ...\n
Url: ...\n
Duration: ...\n

и другие атрибуты

Я хочу сгруппировать эти видео, используя их метаданные с помощью k в weka, но у меня возникла проблема с предварительной обработкой их. Я загружаю их с textDirectoryLoader, но я хочу, чтобы атрибуты были Title, Photo Id, Url, Duration и т. Д. Есть ли способ перенести данные в этой форме в файл arff?

0 ответов

Другие вопросы по тегам