Тренировочные данные CRF для извлечения атрибутов (бренда и т. Д.) ( Python)

Я пытаюсь извлечь атрибут из описания продукта, используя CRF в Python. Изучив доступный контент (исследовательские работы), я обнаружил, что CRF - лучший метод для поиска того же самого.

Но данные обучения для CRF должны быть в определенном формате. У меня есть файл Excel, содержащий описание продукта и марку, но я не могу преобразовать его в форму данных обучения.

Я пытался конвертировать Excel в XML, но это не помогло.

Кроме того, это лучший метод для извлечения атрибутов? Или есть какие-то более подходящие подходы?

Образец входного файла Excel: Образец входного файла Excel

Благодарю.

0 ответов

Другие вопросы по тегам