Как настроить дополнительные столбцы функций в обучающем наборе CRF?
Скажем, я тренируюсь для распознавания именованных сущностей, и мои тренировочные данные выглядят так
The 0 0 O
quick 0 0 O
brown 0 0 O
fox 0 0 O
named ?? 0 O
Mr. 0 ?? O
John 0 0 B-PERS
Doe 0 0 I-PERS
jumped 0 0 O
over 0 0 O
the 0 0 O
slow 0 0 O
rabbit 0 0 O
called ?? 0 O
Mrs. 0 ?? O
Donna. 0 0 B-PERS
Скажем, я хочу, чтобы первый столбец представлял функцию для таких слов, как "именованные" и "названные", которые предшествуют именам. И второй столбец для представления функции, которая указывает местоположение префикса заголовка, например, "Mr", "Dr" или "Phd".
Что я на самом деле вставляю в столбцы дополнительных функций?