Представление текстовых объектов в виде векторов для SVM

Question

Представление текстовых объектов в виде векторов для SVM

Я изучаю задачу Semantic Role Labeling (SRL). Я много читал, и теперь я сталкиваюсь с проблемой того, как представлять текстовые объекты как векторы.

Например, для предложения:

We like Stackru very much

учитывая предикатный глагол: likeНекоторые функции:

the left 1st word: I
the right 1st word: Stackru
the POS tag of the left 1st word: Pronoun
The POS tag of the right 1st word: Adverbial

Как правильно представлять эти функции как векторы?

Если возможно, можете ли вы дать мне несколько советов о том, как нормализовать эти функции, пожалуйста?

Я в основном хочу тренировать данные с помощью этих функций, используя SVM моделей.

0

machine-learning nlp text-mining feature-selection semantic-analysis

Источник

user844068 01 ноя '14 в 07:40

1 ответ

Другие вопросы по тегам machine-learning nlp text-mining feature-selection semantic-analysis

user1164246 04 ноя '14 в 07:10 2014-11-04 07:10 · Answer 1 · 2014-11-04 07:10

Неважно, какой классификатор вы используете (SVM или нет), функция генерации текста одинакова. Я предлагаю вам взглянуть на это: извлечение бинарных функций

Также эта библиотека сделает вашу жизнь намного проще: http://cogcomp.cs.illinois.edu/page/software_view/LBJ. Учебник находится здесь: http://cogcomp.cs.illinois.edu/page/tutorial.201310