CRF++ или CRFSuite
Я начинаю работать с crf++ и crfsuite (оба используют очень похожий формат файла). Я хочу делать вещи, связанные с изображениями (сегментация, распознавание активности и т. Д.). Моя главная проблема - как создать обучающий файл. Кто-нибудь работал с crf и изображениями? Кто-нибудь объяснит мне или даст файл для изучения? Заранее спасибо.
5 ответов
CRFsuite быстрее, чем CRF++, и может работать с огромными данными обучения. Я попробовал их обоих. Они отлично работают с разумным объемом данных, но когда мой набор данных увеличился до более чем 100 000 предложений, CRF++ не смог с этим справиться и внезапно перестал работать. Посмотрите на следующую ссылку
CRFsuite - CRF Benchmark test есть сравнение между многими программами CRF по некоторым критериям
Вероятно, вам следует начать с библиотеки DGM ( https://github.com/Project-10/DGM), которая является лучшим выбором для тех, кто никогда раньше не работал с CRF. Он включает в себя ряд готовых демонстрационных проектов, которые будут классифицировать / сегментировать ваши изображения просто из коробки. Это также хорошо задокументировано.
Я использовал CRF++ раньше, и он работал очень хорошо. Но моя область - обработка естественного языка, и я использую CRF++ для распознавания именованных объектов или POS-тегов. CRF++ легко установить в Linux, но имеет некоторые незначительные проблемы при компиляции в Windows. Вы можете просто следовать его документу для формата данных обучения: каждая строка представляет образец данных, а каждый столбец представляет тип объекта.
Или вы также можете рассмотреть Маллет, который имеет компонент CRF.
Может быть, вы также хотите попробовать компонент CRF в пакете Mallet.
Я только что сталкивался с этим для Windows: http://crfsharp.codeplex.com/