Статистический тест для нормализованной частоты в R
Я извлек частоту двух слов (может, может) из двух корпусов (Корпус1, Корпус2). Я хочу проверить, существует ли значительная разница между счетами в двух корпусах, но, поскольку корпуса имеют разные размеры, я должен нормализовать эти показатели (например, на количество на 1000 слов).
Любые идеи о том, как я могу сделать это в R? А какой статистический тест вы бы порекомендовали?
Спасибо большое за вашу помощь!