Описание тега tidytext
Пакет tidytext предоставляет инструменты для интеллектуального анализа текста с использованием принципов аккуратности данных в R.
R tidytext
Пакет, разработанный Джулией Силге и Дэвидом Робинсоном, предоставляет функции и вспомогательные наборы данных, позволяющие преобразовывать текст в аккуратные форматы и обратно, а также легко переключаться между аккуратными инструментами и существующими пакетами интеллектуального анализа текста. Когда текст находится в аккуратной структуре данных, для эффективной обработки и анализа данных можно использовать инструменты из экосистемы R tidyverse, такие как dplyr.
Репозитории
Виньетки
- Введение в tidytext
- Tidy Term Frequency и обратная частота документов (tf-idf)
- Преобразование в и из матриц документов-терминов и объектов корпуса
- Моделирование аккуратных тем