Представление текстовых объектов в виде векторов для SVM
Я изучаю задачу Semantic Role Labeling (SRL). Я много читал, и теперь я сталкиваюсь с проблемой того, как представлять текстовые объекты как векторы.
Например, для предложения:
We like Stackru very much
учитывая предикатный глагол: like
Некоторые функции:
the left 1st word: I
the right 1st word: Stackru
the POS tag of the left 1st word: Pronoun
The POS tag of the right 1st word: Adverbial
Как правильно представлять эти функции как векторы?
Если возможно, можете ли вы дать мне несколько советов о том, как нормализовать эти функции, пожалуйста?
Я в основном хочу тренировать данные с помощью этих функций, используя SVM
моделей.
1 ответ
Неважно, какой классификатор вы используете (SVM или нет), функция генерации текста одинакова. Я предлагаю вам взглянуть на это: извлечение бинарных функций
Также эта библиотека сделает вашу жизнь намного проще: http://cogcomp.cs.illinois.edu/page/software_view/LBJ. Учебник находится здесь: http://cogcomp.cs.illinois.edu/page/tutorial.201310