Эдгар Пакет | Проблема с файлами.txt

Спасибо заранее за ваш вклад.

Моя проблема getSentimentCount(word.frq, words.list) функция пакета Эдгар. Функция должна читать word.list который представляет собой файл.txt и сравнивает содержимое другого существующего списка (word.frq)также.txt файл.

Это прекрасно работает для одного файла.txt, в котором нет пробелов между словами, но R все равно может прочитать файл, как если бы он был (количество> 1). Другой файл может быть прочитан (count > 1), если после каждого слова есть новая строка, но это приводит к ошибке getSentimentCount(word.frq, words.list) функция. Если в файле.txt удаляются новые строки и все слова помещаются в одну строку (как в другом файле), тогда R может прочитать только одно слово (в основном все слова в одной строке) и считать = 1.

Существуют ли различные типы файлов.txt, которые R различает?

ССЫЛКА на оба файла.txt. negwords.txt работает, litwords.txt приводит к ошибке.

Я благодарен за любой вклад.

2 ответа

Решение

Решено: функцияgetSentimentCount(word.frq, words.list)только читает.txt (MS-DOS),

Тот факт, что R читает только одно слово в nospace txt нормально: что касается R, то это всего лишь одна символьная строка без разделителя.

У меня нет проблем с чтением других документов:

library(edgar)
wf <- getWordfrquency("R/litwords_space.txt")
neg <- readLines("R/negwords.txt")
wgs <- getSentimentCount(word.frq = wf, words.list = neg)

На данный момент ваш список слов содержит только слова, которые появляются один раз, поэтому таблица частот будет всегда равна единице.

Если вы когда-либо занимаетесь анализом текста и анализом настроений, я настоятельно советую вам перейти к tidytext пакет.

Colin

Другие вопросы по тегам