Представление текстовых объектов в виде векторов для SVM

Я изучаю задачу Semantic Role Labeling (SRL). Я много читал, и теперь я сталкиваюсь с проблемой того, как представлять текстовые объекты как векторы.

Например, для предложения:

We like Stackru very much

учитывая предикатный глагол: likeНекоторые функции:

the left 1st word: I
the right 1st word: Stackru
the POS tag of the left 1st word: Pronoun
The POS tag of the right 1st word: Adverbial

Как правильно представлять эти функции как векторы?

Если возможно, можете ли вы дать мне несколько советов о том, как нормализовать эти функции, пожалуйста?

Я в основном хочу тренировать данные с помощью этих функций, используя SVM моделей.

1 ответ

Неважно, какой классификатор вы используете (SVM или нет), функция генерации текста одинакова. Я предлагаю вам взглянуть на это: извлечение бинарных функций

Также эта библиотека сделает вашу жизнь намного проще: http://cogcomp.cs.illinois.edu/page/software_view/LBJ. Учебник находится здесь: http://cogcomp.cs.illinois.edu/page/tutorial.201310

Другие вопросы по тегам