Контекстно-зависимая классификация текста (HMM, CRF, ANN или что-то еще)
Моя цель - создать систему классификации текста, которая используется для понимания и, возможно, автоматизации популярного инструмента кодирования, который используется в образовании для кодирования сообщений на форумах учащихся.
Схема кодирования имеет четыре кода (T,E,I,R), и каждому сообщению онлайн-форума может быть назначен только один из них. Эти коды представляют собой этап в цикле обучения студента, и теоретизируется моделью, что обучение учащихся проходит те четыре этапа, которые отражены в их сообщениях. У нас есть 1750 сообщений, которые кодируются людьми-кодерами, и мы хотели бы построить модель, которая может дать представление о том, что определяет каждую из этих фаз (T, E, I и R).
Нашей первоначальной целью было создание "типичного" классификатора, основанного на различных признаках, которые мы считали важными. Однако мы хотели бы как-то включить "контекст потока", поскольку ответы (и их содержание) зависят от предыдущих сообщений. В принципе, я хотел бы как-то принять во внимание класс предыдущего сообщения в обсуждении, а также предыдущее сообщение данного автора. что-то вроде этого:
Сейчас я только начинаю это и исследую различные идеи, как смоделировать эту проблему. Я думал о том, чтобы как-то использовать скрытые модели Маркова для этого, и мне было интересно, я на правильном пути?
Дело в том, что наши состояния не являются неизвестными, учитывая, что это помеченный набор данных, мы знаем эти состояния и хотели бы оценить вероятности переходов и выбросов, а затем использовать их для классификации по "неизвестным данным" (с отложенными сгибами или действительно новыми сообщениями)
Кроме того, у нас есть несколько наблюдений для каждого состояния, и в зависимости от функций, которые мы будем использовать, у нас может быть большое количество функций, извлеченных из текста.
Наконец, каждое состояние зависит от двух предыдущих состояний: 1) состояние предыдущего сообщения в ветке и 2) предыдущее состояние автора. Я не уверен, что это можно как-то смоделировать:)
РЕДАКТИРОВАТЬ: я узнал о условных случайных полей, и на данный момент они, кажется, лучше подходят для такого рода проблем, какие-либо слова о них?:)