doc2vec: анализ чувствительности / вклад в прогнозирование?
Недавно я запускаю модель doc2vec в смысле Le & Mikolov (2014). Мои тренировочные данные состоят из примерно 10 000 текстов описаний, и я обучаю свой классификатор логистической регрессии по результату ("1"/"0").
Вопрос: Как я могу найти и визуализировать слова (слова или векторы абзаца?), Которые более предсказуемы для "1" или "0"? Другими словами: слова, которые наиболее важны для предсказания.
Я нашел кое-что о "коэффициентах чувствительности" или "анализе чувствительности", но было бы здорово, если бы кто-то мог указать на Git с примерами или упомянуть конкретный подход.
Спасибо за вашу помощь.