Как бы я замаскировал эту область в моем изображении BW?

Я пытаюсь использовать обработку изображений и оптическое распознавание символов для извлечения данных из тысяч изображений, и я обнаружил, что для определенной области таблицы требуется другой набор фильтров обработки изображений, чтобы быть распознанным тессерактами оптического распознавания текста. Поэтому я подумал, что хорошим подходом было бы замаскировать эту проблемную часть изображения и применить дополнительные установленные фильтры к замаскированной области, но у меня возникли проблемы с поиском способа маскировки этой части изображения. Ниже я привожу пример изображения, представьте, что в таблице Excel нет линий и что "серая" область не серая, а множество мелких черных кластеров пикселей (точек), суженных вместе, так что при уменьшении масштаба она выглядит серой. Изображение черно-белое, поэтому значение пикселя может быть 0 (черное) или 255 (белое). Мне нужно замаскировать "серую" часть таблицы и применить более сильные фильтры к этой области, чтобы я мог убрать шум. Я подумал, может быть, что-то вроде блока 10х10, который сдвигает 5 или 10 пикселей и принимает среднее значение всех значений пикселей в блоке. Затем, используя порог, я мог бы указать, какая область должна быть замаскирована. Проблема в том, что это дорого и займет много времени, также я не уверен, насколько точно это будет. Мне было интересно, есть ли у кого-нибудь другие идеи, я действительно ценю любой вклад. Благодарю.

на что следует обратить внимание: (1) это отсканированные изображения (2) серая точка перемещается в другую область изображения на разных графиках (не совпадают места) (3) плотность черных точек в серой области может немного измениться

Новая идея: (1) суммировать векторы столбцов и использовать порог так, чтобы, если сумма вектора столбцов была меньше некоторого значения, пометить его для маскировки и, если немаскированный вектор столбца находится между двумя масками, маскировать его тоже. Единственное предостережение: иногда серый прямоугольник находится в верхнем правом углу изображения, так что он расширяется только наполовину вниз по изображению, что означает, что порог может их не поймать.

example.png

0 ответов

Другие вопросы по тегам