Как вычислить "EMD" для 2 массивов, то есть "гистограммы", используя opencv?
Так как я новичок в opencv, я не знаю, как использовать cv.CalcEMD2
функция с numpy
массивы.
У меня есть два массива:
a=[1,2,3,4,5]
b=[1,2,3,4]
Как я могу перевести numpy array
в CVhistogram
и из Cvhistogram
к параметру функции signature
?
Я хотел бы, чтобы любой, кто ответит на вопрос, объяснил opencv
функционирует через предоставленное решение.
"EMD" == расстояние от землеройной машины.
Обновить:-
Кроме того, будет полезно, если кто-нибудь может сказать мне, как установить cv.CalcEMD2
параметр т.е. "signature"
с помощью numpy
массив!!
Заметка:-
* Для тех, кто может быть заинтересован в этом вопросе, этот ответ нуждается в дополнительном тестировании.
3 ответа
Вы должны определить свои массивы в терминах весов и координат. Если у вас есть два массива a = [1,1,0,0,1] и b = [0,1,0,1], которые представляют одномерные гистограммы, то числовые массивы должны выглядеть следующим образом:
a = [[1 1]
[1 2]
[0 3]
[0 4]
[1 5]]
b = [[0 1]
[1 2]
[0 3]
[1 4]]
Обратите внимание, что количество строк может быть разным. Количество столбцов должно быть размерами + 1. Первый столбец содержит веса, а второй столбец содержит координаты.
Следующим шагом будет преобразование ваших массивов в матрицу CV_32FC1 перед тем, как вы введете массив numpy в качестве сигнатуры для функции CalcEMD2. Код будет выглядеть так:
from cv2 import *
import numpy as np
# Initialize a and b numpy arrays with coordinates and weights
a = np.zeros((5,2))
for i in range(0,5):
a[i][1] = i+1
a[0][0] = 1
a[1][0] = 1
a[2][0] = 0
a[3][0] = 0
a[4][0] = 1
b = np.zeros((4,2))
for i in range(0,4):
b[i][1] = i+1
b[0][0] = 0
b[1][0] = 1
b[2][0] = 0
b[3][0] = 1
# Convert from numpy array to CV_32FC1 Mat
a64 = cv.fromarray(a)
a32 = cv.CreateMat(a64.rows, a64.cols, cv.CV_32FC1)
cv.Convert(a64, a32)
b64 = cv.fromarray(b)
b32 = cv.CreateMat(b64.rows, b64.cols, cv.CV_32FC1)
cv.Convert(b64, b32)
# Calculate Earth Mover's
print cv.CalcEMD2(a32,b32,cv.CV_DIST_L2)
# Wait for key
cv.WaitKey(0)
Обратите внимание, что третий параметр CalcEMD2 - это евклидово расстояние CV_DIST_L2. Другой вариант для третьего параметра - Манхэттенское расстояние CV_DIST_L1.
Я также хотел бы упомянуть, что я написал код для расчета расстояния движка Земли двух двумерных гистограмм в Python. Вы можете найти этот код здесь.
CV.CalcEMD2 ожидает массивы, которые также включают вес для каждого сигнала в соответствии с документацией.
Я бы посоветовал определить ваши массивы с весом 1, например:
a=array([1,1],[2,1],[3,1],[4,1],[5,1])
b=array([1,1],[2,1],[3,1],[4,1])
Я знаю, что ОП хотел измерить Расстояние движителя Земли с помощью OpenCV, но если вы хотите сделать это с помощью Scipy, вы можете использовать следующее (Расстояние Вассерштейна также известно как Расстояние движителя Земли):
from scipy.stats import wasserstein_distance
from scipy.ndimage import imread
import numpy as np
def get_histogram(img):
'''
Get the histogram of an image. For an 8-bit, grayscale image, the
histogram will be a 256 unit vector in which the nth value indicates
the percent of the pixels in the image with the given darkness level.
The histogram's values sum to 1.
'''
h, w = img.shape
hist = [0.0] * 256
for i in range(h):
for j in range(w):
hist[img[i, j]] += 1
return np.array(hist) / (h * w)
a = imread('a.jpg')
b = imread('b.jpg')
a_hist = get_histogram(a)
b_hist = get_histogram(b)
dist = wasserstein_distance(a_hist, b_hist)
print(dist)