Почему параметр random_state используется в алгоритмах NMF и LDA? Каковы преимущества использования случайных тем, генерируемых каждый раз?

Для тематического моделирования,
Почему параметр random_state используется в алгоритмах NMF и LDA?
Каковы преимущества использования случайных тем, генерируемых каждый раз?

1 ответ

Алгоритмы для обоих являются стохастическими - это означает, что они используют случайность как часть оценки хорошего ответа. Это сделано таким образом, чтобы сделать его отслеживаемым, и в случае LDA вся модель является стохастической, обеспечивая в идеале вероятностное распределение (называемое "апостериорным распределением") ответов, но вместо этого предоставляя один вероятный ответ в виде оценить.

Таким образом, ответ заключается в том, что использование случайности в алгоритмах делает чрезвычайно сложную задачу намного проще и выполнимой для расчета менее чем за сто лет.

Если вы собираетесь их использовать, я думаю, вам будет полезно изучить их, узнать что-то о том, как они работают, почему они работают. Использование инструмента, который вы не понимаете, рискованно, так как вы не знаете, что на самом деле означает результат, который дает инструмент. Одним из примеров являются нумераторы слов во всех "темах" с очень низкой вероятностью. Различия в этих вероятностях на самом деле бессмысленны - учитывая другую выборку из апостериорного, вы получите разные вероятности, по-разному ранжированные между словами.

Другие вопросы по тегам