Как создать табличный файл для ввода в ReadMe: программное обеспечение для автоматического анализа содержимого
Я пытаюсь использовать пакет ReadMe от Hopkins et al. но не могу заставить его работать с моими собственными данными. Демонстрация работает нормально, и я конвертировал свои данные так, как этого ожидает пакет (отдельные txt-файлы для каждого текста и файл control.txt с настоящими метками и т. Д.). Что мне не удалось сделать, так это создать table.file. Файл таблицы содержит таблицу частот слов, и демонстрационный файл выглядит так при открытии в Excel:
К сожалению, нет никакой документации о том, как создать такую таблицу. Документация только говорит:
table.file: путь к файлу, в котором должна храниться таблица частот слов. По умолчанию используется "tablefile.txt". Конечно, пользователь должен иметь права на чтение и запись в этот файл, и предыдущее содержимое файла будет перезаписано.
Кто-нибудь может указать мне на программу или код, который производит такие файлы? Или я что-то упустил в документации?
1 ответ
Я искал немного дольше и теперь решил свою собственную проблему. Я отправляю это так, чтобы любой, кто находит это, получил решающие подсказки.
Tablefile.txt - это матрица терминов документа, разделенная табуляцией, с тремя дополнительными столбцами: "FILENAME" (имя файла каждого анализируемого текста, например, "text21.txt."), "TRUTH" (истинное значение категории; может быть NA для набора тестов), "TRAININGSET" (указывает, принадлежит ли текст 1= обучающий набор или 0= набор тестов).
Матрица терминов документа может быть получена с помощью учебника из сети, например.