Статистический тест для нормализованной частоты в R

Я извлек частоту двух слов (может, может) из двух корпусов (Корпус1, Корпус2). Я хочу проверить, существует ли значительная разница между счетами в двух корпусах, но, поскольку корпуса имеют разные размеры, я должен нормализовать эти показатели (например, на количество на 1000 слов).

Любые идеи о том, как я могу сделать это в R? А какой статистический тест вы бы порекомендовали?

Спасибо большое за вашу помощь!

0 ответов

Другие вопросы по тегам