Какова структура памяти OpenCV cvMat?
Представь, что у меня есть следующее:
CvMat* mat = cvCreateMat(3,3,CV_16SC3)
Это матрица 3x3 целых чисел канала 3.
Теперь, если вы посмотрите документацию OpenCV, вы найдете следующее в качестве замедления для cvMat:
typedef struct CvMat {
int type;
int step;
int* refcount;
union
{
uchar* ptr;
short* s;
int* i;
float* fl;
double* db;
} data;
union
{
int rows;
int height;
};
union
{
int cols;
int width;
};
} CvMat;
Теперь я хочу поиграться с data.ptr, который является указателем на данные, хранящиеся в cvMat. Однако мне трудно понять, как устроена память. Если у меня есть 3-канальная матрица, как это работает? Для одного канала это просто, потому что это простая матрица MxN, где M - строки, а N - столбцы. Однако для 3 каналов, есть ли 3 из этих MxN матрицы? Может кто-нибудь показать мне, как мне начать инициализацию 3-канальной матрицы через data.ptr и как получить доступ к этим значениям, пожалуйста? Спасибо.
1 ответ
Эта веб-страница является отличным введением в OpenCV 1.1. Я бы порекомендовал использовать последнюю версию Open CV 2.0, которая имеет общую Mat
класс, который обрабатывает изображения, матрицы и т. д. в отличие от OpenCV 1.1.
На приведенной выше веб-странице подробно описаны следующие методы доступа к элементам в многоканальных изображениях:
Косвенный доступ: (Общий, но неэффективный доступ к любому типу изображения)
Для многоканального плавающего (или байтового) изображения:
IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);
CvScalar s;
s=cvGet2D(img,i,j); // get the (i,j) pixel value
printf("B=%f, G=%f, R=%f\n",s.val[0],s.val[1],s.val[2]);
s.val[0]=111;
s.val[1]=111;
s.val[2]=111;
cvSet2D(img,i,j,s); // set the (i,j) pixel value
Прямой доступ: (эффективный доступ, но подвержен ошибкам)
Для многоканального плавающего изображения:
IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);
((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 0]=111; // B
((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 1]=112; // G
((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 2]=113; // R
Прямой доступ с помощью указателя: (Упрощенный и эффективный доступ при ограниченных допущениях)
Для многоканального плавающего изображения (при условии 4-байтового выравнивания):
IplImage* img = cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);
int height = img->height;
int width = img->width;
int step = img->widthStep/sizeof(float);
int channels = img->nChannels;
float * data = (float *)img->imageData;
data[i*step+j*channels+k] = 111;
Прямой доступ с помощью оболочки C++: (простой и эффективный доступ)
Определите оболочку C++ для одноканальных байтовых изображений, многоканальных байтовых изображений и многоканальных плавающих изображений:
template<class T> class Image
{
private:
IplImage* imgp;
public:
Image(IplImage* img=0) {imgp=img;}
~Image(){imgp=0;}
void operator=(IplImage* img) {imgp=img;}
inline T* operator[](const int rowIndx) {
return ((T *)(imgp->imageData + rowIndx*imgp->widthStep));}
};
typedef struct{
unsigned char b,g,r;
} RgbPixel;
typedef struct{
float b,g,r;
} RgbPixelFloat;
typedef Image<RgbPixel> RgbImage;
typedef Image<RgbPixelFloat> RgbImageFloat;
typedef Image<unsigned char> BwImage;
typedef Image<float> BwImageFloat;
Для многоканального плавающего изображения:
IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);
RgbImageFloat imgA(img);
imgA[i][j].b = 111;
imgA[i][j].g = 111;
imgA[i][j].r = 111;