Как лучше всего обращаться с фотографиями, переданными в IFilter?
Я реализую IFilter для индексации форматов изображений. Одной из проблем являются фотографии - многие пользователи имеют тонны фотографий, фотографии огромны, и загрузка текста на них занимает много времени.
Да, иногда люди используют камеры вместо сканеров для оцифровки документов, но потенциальные проблемы IMO намного превышают возможность встречи с документом, оцифрованным фотоаппаратом. Так что моя реализация вообще не будет извлекать текст из фотографий.
Что должен сделать IFilter, если обнаружит, что данный файл является фотоизображением - указать на ошибку или вернуть пустой текст?
1 ответ
Если фильтр Word не обрабатывает отслеженные изменения, он не выдаст ошибку; было бы просто пропустить их. Хотя в вашем случае вы пропускаете целые файлы, это тот же принцип. Это не условие ошибки. Просто не возвращайте текст.