Эдгар Пакет | Проблема с файлами.txt
Спасибо заранее за ваш вклад.
Моя проблема getSentimentCount(word.frq, words.list)
функция пакета Эдгар. Функция должна читать word.list
который представляет собой файл.txt и сравнивает содержимое другого существующего списка (word.frq)
также.txt файл.
Это прекрасно работает для одного файла.txt, в котором нет пробелов между словами, но R все равно может прочитать файл, как если бы он был (количество> 1). Другой файл может быть прочитан (count > 1), если после каждого слова есть новая строка, но это приводит к ошибке getSentimentCount(word.frq, words.list)
функция. Если в файле.txt удаляются новые строки и все слова помещаются в одну строку (как в другом файле), тогда R может прочитать только одно слово (в основном все слова в одной строке) и считать = 1.
Существуют ли различные типы файлов.txt, которые R различает?
ССЫЛКА на оба файла.txt. negwords.txt
работает, litwords.txt
приводит к ошибке.
Я благодарен за любой вклад.
2 ответа
Решено: функцияgetSentimentCount(word.frq, words.list)
только читает.txt (MS-DOS)
,
Тот факт, что R читает только одно слово в nospace
txt нормально: что касается R, то это всего лишь одна символьная строка без разделителя.
У меня нет проблем с чтением других документов:
library(edgar)
wf <- getWordfrquency("R/litwords_space.txt")
neg <- readLines("R/negwords.txt")
wgs <- getSentimentCount(word.frq = wf, words.list = neg)
На данный момент ваш список слов содержит только слова, которые появляются один раз, поэтому таблица частот будет всегда равна единице.
Если вы когда-либо занимаетесь анализом текста и анализом настроений, я настоятельно советую вам перейти к tidytext
пакет.
Colin