OpenCV C++/Obj-C: обнаружение листа бумаги / определение квадратов

Я успешно реализовал пример определения квадрата OpenCV в своем тестовом приложении, но теперь мне нужно отфильтровать вывод, потому что он довольно грязный - или мой код неверен?

Я заинтересован в четырех угловых пунктах статьи для уменьшения перекоса (как этот) и дальнейшей обработки...

Ввод, вывод: Ввод, вывод

Исходное изображение:

щелчок

Код:

double angle( cv::Point pt1, cv::Point pt2, cv::Point pt0 ) {
    double dx1 = pt1.x - pt0.x;
    double dy1 = pt1.y - pt0.y;
    double dx2 = pt2.x - pt0.x;
    double dy2 = pt2.y - pt0.y;
    return (dx1*dx2 + dy1*dy2)/sqrt((dx1*dx1 + dy1*dy1)*(dx2*dx2 + dy2*dy2) + 1e-10);
}

- (std::vector<std::vector<cv::Point> >)findSquaresInImage:(cv::Mat)_image
{
    std::vector<std::vector<cv::Point> > squares;
    cv::Mat pyr, timg, gray0(_image.size(), CV_8U), gray;
    int thresh = 50, N = 11;
    cv::pyrDown(_image, pyr, cv::Size(_image.cols/2, _image.rows/2));
    cv::pyrUp(pyr, timg, _image.size());
    std::vector<std::vector<cv::Point> > contours;
    for( int c = 0; c < 3; c++ ) {
        int ch[] = {c, 0};
        mixChannels(&timg, 1, &gray0, 1, ch, 1);
        for( int l = 0; l < N; l++ ) {
            if( l == 0 ) {
                cv::Canny(gray0, gray, 0, thresh, 5);
                cv::dilate(gray, gray, cv::Mat(), cv::Point(-1,-1));
            }
            else {
                gray = gray0 >= (l+1)*255/N;
            }
            cv::findContours(gray, contours, CV_RETR_LIST, CV_CHAIN_APPROX_SIMPLE);
            std::vector<cv::Point> approx;
            for( size_t i = 0; i < contours.size(); i++ )
            {
                cv::approxPolyDP(cv::Mat(contours[i]), approx, arcLength(cv::Mat(contours[i]), true)*0.02, true);
                if( approx.size() == 4 && fabs(contourArea(cv::Mat(approx))) > 1000 && cv::isContourConvex(cv::Mat(approx))) {
                    double maxCosine = 0;

                    for( int j = 2; j < 5; j++ )
                    {
                        double cosine = fabs(angle(approx[j%4], approx[j-2], approx[j-1]));
                        maxCosine = MAX(maxCosine, cosine);
                    }

                    if( maxCosine < 0.3 ) {
                        squares.push_back(approx);
                    }
                }
            }
        }
    }
    return squares;
}

РЕДАКТИРОВАТЬ 17/08/2012:

Чтобы нарисовать обнаруженные квадраты на изображении, используйте этот код:

cv::Mat debugSquares( std::vector<std::vector<cv::Point> > squares, cv::Mat image )
{
    for ( int i = 0; i< squares.size(); i++ ) {
        // draw contour
        cv::drawContours(image, squares, i, cv::Scalar(255,0,0), 1, 8, std::vector<cv::Vec4i>(), 0, cv::Point());

        // draw bounding rect
        cv::Rect rect = boundingRect(cv::Mat(squares[i]));
        cv::rectangle(image, rect.tl(), rect.br(), cv::Scalar(0,255,0), 2, 8, 0);

        // draw rotated rect
        cv::RotatedRect minRect = minAreaRect(cv::Mat(squares[i]));
        cv::Point2f rect_points[4];
        minRect.points( rect_points );
        for ( int j = 0; j < 4; j++ ) {
            cv::line( image, rect_points[j], rect_points[(j+1)%4], cv::Scalar(0,0,255), 1, 8 ); // blue
        }
    }

    return image;
}

5 ответов

Решение

Это повторяющаяся тема в Stackru, и, поскольку я не смог найти подходящую реализацию, я решил принять вызов.

Я внес некоторые изменения в демонстрационную версию квадратов, представленную в OpenCV, и полученный ниже код C++ может обнаружить лист бумаги на изображении:

void find_squares(Mat& image, vector<vector<Point> >& squares)
{
    // blur will enhance edge detection
    Mat blurred(image);
    medianBlur(image, blurred, 9);

    Mat gray0(blurred.size(), CV_8U), gray;
    vector<vector<Point> > contours;

    // find squares in every color plane of the image
    for (int c = 0; c < 3; c++)
    {
        int ch[] = {c, 0};
        mixChannels(&blurred, 1, &gray0, 1, ch, 1);

        // try several threshold levels
        const int threshold_level = 2;
        for (int l = 0; l < threshold_level; l++)
        {
            // Use Canny instead of zero threshold level!
            // Canny helps to catch squares with gradient shading
            if (l == 0)
            {
                Canny(gray0, gray, 10, 20, 3); // 

                // Dilate helps to remove potential holes between edge segments
                dilate(gray, gray, Mat(), Point(-1,-1));
            }
            else
            {
                    gray = gray0 >= (l+1) * 255 / threshold_level;
            }

            // Find contours and store them in a list
            findContours(gray, contours, CV_RETR_LIST, CV_CHAIN_APPROX_SIMPLE);

            // Test contours
            vector<Point> approx;
            for (size_t i = 0; i < contours.size(); i++)
            {
                    // approximate contour with accuracy proportional
                    // to the contour perimeter
                    approxPolyDP(Mat(contours[i]), approx, arcLength(Mat(contours[i]), true)*0.02, true);

                    // Note: absolute value of an area is used because
                    // area may be positive or negative - in accordance with the
                    // contour orientation
                    if (approx.size() == 4 &&
                            fabs(contourArea(Mat(approx))) > 1000 &&
                            isContourConvex(Mat(approx)))
                    {
                            double maxCosine = 0;

                            for (int j = 2; j < 5; j++)
                            {
                                    double cosine = fabs(angle(approx[j%4], approx[j-2], approx[j-1]));
                                    maxCosine = MAX(maxCosine, cosine);
                            }

                            if (maxCosine < 0.3)
                                    squares.push_back(approx);
                    }
            }
        }
    }
}

После выполнения этой процедуры лист бумаги станет самым большим квадратом в vector<vector<Point> >:

обнаружение листа бумаги opencv

Я позволяю вам написать функцию, чтобы найти самый большой квадрат.;)

Если не указано какое-либо другое требование, я просто преобразовал бы ваше цветное изображение в оттенки серого и работал бы только с этим (нет необходимости работать с 3 каналами, уже присутствующий контраст слишком высок). Кроме того, если нет особых проблем с изменением размера, я бы работал с уменьшенной версией ваших изображений, так как они относительно велики, а размер ничего не добавляет к решаемой проблеме. Затем, наконец, ваша проблема решается с помощью медианного фильтра, некоторых основных морфологических инструментов и статистики (в основном для порогового значения Otsu, которое уже сделано для вас).

Вот то, что я получаю с вашим образцом и другим изображением с листом бумаги, который я нашел вокруг:

Медианный фильтр используется для удаления мелких деталей из изображения, теперь серого. Это, возможно, удалит тонкие линии внутри беловатой бумаги, что хорошо, потому что тогда вы закончите с крошечными соединенными компонентами, которые легко выбросить. После медианы примените морфологический градиент (просто dilation - erosion) и оцифровывает результат по Оцу. Морфологический градиент - это хороший способ сохранить сильные края, его следует использовать чаще. Затем, поскольку этот градиент увеличит ширину контура, примените морфологическое истончение. Теперь вы можете отказаться от мелких компонентов.

На данный момент, вот что мы имеем с правым изображением выше (до рисования синего многоугольника), левый не показан, потому что единственный оставшийся компонент - это тот, который описывает статью:

Учитывая примеры, теперь единственной оставшейся проблемой является различие между компонентами, которые выглядят как прямоугольники, и компонентами, которые не похожи. Это вопрос определения соотношения между площадью выпуклой оболочки, содержащей форму, и площадью ее ограничительной рамки; соотношение 0,7 прекрасно работает для этих примеров. Возможно, вам также придется отказаться от компонентов, которые находятся внутри документа, но не в этих примерах, используя этот метод (тем не менее, выполнение этого шага должно быть очень простым, особенно потому, что это можно сделать напрямую через OpenCV).

Для справки вот пример кода в Mathematica:

f = Import["http://thwartedglamour.files.wordpress.com/2010/06/my-coffee-table-1-sa.jpg"]
f = ImageResize[f, ImageDimensions[f][[1]]/4]
g = MedianFilter[ColorConvert[f, "Grayscale"], 2]
h = DeleteSmallComponents[Thinning[
     Binarize[ImageSubtract[Dilation[g, 1], Erosion[g, 1]]]]]
convexvert = ComponentMeasurements[SelectComponents[
     h, {"ConvexArea", "BoundingBoxArea"}, #1 / #2 > 0.7 &], 
     "ConvexVertices"][[All, 2]]
(* To visualize the blue polygons above: *)
Show[f, Graphics[{EdgeForm[{Blue, Thick}], RGBColor[0, 0, 1, 0.5], 
     Polygon @@ convexvert}]]

Если есть более разнообразные ситуации, когда прямоугольник бумаги не так хорошо определен, или подход смешивает его с другими формами - эти ситуации могут возникать по разным причинам, но общей причиной является плохое получение изображения - тогда попробуйте объединить предварительно -процессы обработки с работой, описанной в статье "Обнаружение прямоугольника на основе оконного преобразования Хафа".

Ну, я опоздал.


По вашему изображению, бумага white в то время как фон colored, Итак, лучше обнаружить бумагу Saturation(饱和度) канал в HSV color space, Возьми сначала ссылку на вики HSL_and_HSV. Затем я скопирую большую часть идеи из моего ответа в этом разделе "Определить цветной сегмент" на изображении.


Основные шаги:

  1. Читать в BGR
  2. Преобразовать изображение из bgr в hsv пространство
  3. Порог канал S
  4. Затем найдите максимальный внешний контур (или сделайте Canny, или же HoughLines как вам нравится, я выбираю findContours), приблизительно, чтобы получить углы.

Это мой результат:


Код Python (Python 3.5 + OpenCV 3.3):

#!/usr/bin/python3
# 2017.12.20 10:47:28 CST
# 2017.12.20 11:29:30 CST

import cv2
import numpy as np

##(1) read into  bgr-space
img = cv2.imread("test2.jpg")

##(2) convert to hsv-space, then split the channels
hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)
h,s,v = cv2.split(hsv)

##(3) threshold the S channel using adaptive method(`THRESH_OTSU`) or fixed thresh
th, threshed = cv2.threshold(s, 50, 255, cv2.THRESH_BINARY_INV)

##(4) find all the external contours on the threshed S
_, cnts, _ = cv2.findContours(threshed, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
canvas  = img.copy()
#cv2.drawContours(canvas, cnts, -1, (0,255,0), 1)

## sort and choose the largest contour
cnts = sorted(cnts, key = cv2.contourArea)
cnt = cnts[-1]

## approx the contour, so the get the corner points
arclen = cv2.arcLength(cnt, True)
approx = cv2.approxPolyDP(cnt, 0.02* arclen, True)
cv2.drawContours(canvas, [cnt], -1, (255,0,0), 1, cv2.LINE_AA)
cv2.drawContours(canvas, [approx], -1, (0, 0, 255), 1, cv2.LINE_AA)

## Ok, you can see the result as tag(6)
cv2.imwrite("detected.png", canvas)

Связанные ответы:

  1. Определить цветной сегмент в изображении
  2. Обнаружение краев в OpenCV Android
  3. OpenCV C++ / Obj-C: обнаружение листа бумаги / определение квадратов

Что вам нужно, это четырехугольник вместо повернутого прямоугольника.RotatedRect даст вам неверные результаты. Также вам понадобится перспективная проекция.

В основном, что должно быть сделано:

  • Переберите все сегменты многоугольника и соедините те, которые почти равны.
  • Сортируйте их так, чтобы у вас было 4 самых больших отрезка.
  • Пересечь эти линии, и у вас есть 4 наиболее вероятных угловых точек.
  • Преобразуйте матрицу по перспективе, собранной из угловых точек и соотношению сторон известного объекта.

Я реализовал класс Quadrangle который заботится о преобразовании контура в четырехугольник, а также преобразует его в правильной перспективе.

Смотрите рабочую реализацию здесь: Java OpenCV выравнивание контура

Как только вы обнаружите ограничивающую рамку документа, вы можете выполнить четырехточечное перспективное преобразование, чтобы получить изображение сверху вниз с высоты птичьего полета. Это исправит перекос и изолирует только нужный объект.


Входное изображение:

Обнаруженный текстовый объект

Вид текстового документа сверху вниз

Код

from imutils.perspective import four_point_transform
import cv2
import numpy

# Load image, grayscale, Gaussian blur, Otsu's threshold
image = cv2.imread("1.png")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blur = cv2.GaussianBlur(gray, (7,7), 0)
thresh = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]

# Find contours and sort for largest contour
cnts = cv2.findContours(thresh, cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]
cnts = sorted(cnts, key=cv2.contourArea, reverse=True)
displayCnt = None

for c in cnts:
    # Perform contour approximation
    peri = cv2.arcLength(c, True)
    approx = cv2.approxPolyDP(c, 0.02 * peri, True)
    if len(approx) == 4:
        displayCnt = approx
        break

# Obtain birds' eye view of image
warped = four_point_transform(image, displayCnt.reshape(4, 2))

cv2.imshow("thresh", thresh)
cv2.imshow("warped", warped)
cv2.imshow("image", image)
cv2.waitKey()

Обнаружение листа бумаги - своего рода старая школа. Если вы хотите заняться обнаружением перекоса, лучше сразу же стремиться к обнаружению текстовых строк. При этом вы получите экстремумы слева, справа, сверху и снизу. Откажитесь от любой графики на изображении, если вы не хотите, а затем сделайте некоторую статистику по сегментам текстовой линии, чтобы найти наиболее часто встречающийся угол или, точнее, угол. Вот как вы будете сужаться до хорошего угла наклона. Теперь после этого вы устанавливаете эти параметры для угла наклона и экстремумов, чтобы выровнять и нарезать изображение до того, что требуется.

Что касается текущего требования к изображению, лучше, если вы попробуете CV_RETR_EXTERNAL вместо CV_RETR_LIST.

Другой метод определения ребер - это навести на краю бумаги классификатор случайных лесов, а затем использовать классификатор для получения карты ребер. Это, безусловно, надежный метод, но требует обучения и времени.

Случайные леса будут работать с низкоконтрастными сценариями, например с белой бумагой на грубом белом фоне

Другие вопросы по тегам