Как вычислить "EMD" для 2 массивов, то есть "гистограммы", используя opencv?

Так как я новичок в opencv, я не знаю, как использовать cv.CalcEMD2 функция с numpy массивы.
У меня есть два массива:

a=[1,2,3,4,5]  
b=[1,2,3,4]

Как я могу перевести numpy array в CVhistogram и из Cvhistogram к параметру функции signature?

Я хотел бы, чтобы любой, кто ответит на вопрос, объяснил opencv функционирует через предоставленное решение.

"EMD" == расстояние от землеройной машины.

Обновить:-
Кроме того, будет полезно, если кто-нибудь может сказать мне, как установить cv.CalcEMD2 параметр т.е. "signature" с помощью numpy массив!!

Заметка:-
* Для тех, кто может быть заинтересован в этом вопросе, этот ответ нуждается в дополнительном тестировании.

3 ответа

Решение

Вы должны определить свои массивы в терминах весов и координат. Если у вас есть два массива a = [1,1,0,0,1] и b = [0,1,0,1], которые представляют одномерные гистограммы, то числовые массивы должны выглядеть следующим образом:

a = [[1 1]
     [1 2]
     [0 3]
     [0 4]
     [1 5]]

b = [[0 1]
     [1 2]
     [0 3]
     [1 4]]

Обратите внимание, что количество строк может быть разным. Количество столбцов должно быть размерами + 1. Первый столбец содержит веса, а второй столбец содержит координаты.

Следующим шагом будет преобразование ваших массивов в матрицу CV_32FC1 перед тем, как вы введете массив numpy в качестве сигнатуры для функции CalcEMD2. Код будет выглядеть так:

from cv2 import *
import numpy as np

# Initialize a and b numpy arrays with coordinates and weights
a = np.zeros((5,2))

for i in range(0,5):
    a[i][1] = i+1

a[0][0] = 1
a[1][0] = 1
a[2][0] = 0
a[3][0] = 0
a[4][0] = 1

b = np.zeros((4,2))

for i in range(0,4):
    b[i][1] = i+1

b[0][0] = 0
b[1][0] = 1
b[2][0] = 0
b[3][0] = 1    

# Convert from numpy array to CV_32FC1 Mat
a64 = cv.fromarray(a)
a32 = cv.CreateMat(a64.rows, a64.cols, cv.CV_32FC1)
cv.Convert(a64, a32)

b64 = cv.fromarray(b)
b32 = cv.CreateMat(b64.rows, b64.cols, cv.CV_32FC1)
cv.Convert(b64, b32)

# Calculate Earth Mover's
print cv.CalcEMD2(a32,b32,cv.CV_DIST_L2)

# Wait for key
cv.WaitKey(0)

Обратите внимание, что третий параметр CalcEMD2 - это евклидово расстояние CV_DIST_L2. Другой вариант для третьего параметра - Манхэттенское расстояние CV_DIST_L1.

Я также хотел бы упомянуть, что я написал код для расчета расстояния движка Земли двух двумерных гистограмм в Python. Вы можете найти этот код здесь.

CV.CalcEMD2 ожидает массивы, которые также включают вес для каждого сигнала в соответствии с документацией.

Я бы посоветовал определить ваши массивы с весом 1, например:

a=array([1,1],[2,1],[3,1],[4,1],[5,1])
b=array([1,1],[2,1],[3,1],[4,1])

Я знаю, что ОП хотел измерить Расстояние движителя Земли с помощью OpenCV, но если вы хотите сделать это с помощью Scipy, вы можете использовать следующее (Расстояние Вассерштейна также известно как Расстояние движителя Земли):

from scipy.stats import wasserstein_distance
from scipy.ndimage import imread
import numpy as np

def get_histogram(img):
  '''
  Get the histogram of an image. For an 8-bit, grayscale image, the
  histogram will be a 256 unit vector in which the nth value indicates
  the percent of the pixels in the image with the given darkness level.
  The histogram's values sum to 1.
  '''
  h, w = img.shape
  hist = [0.0] * 256
  for i in range(h):
    for j in range(w):
      hist[img[i, j]] += 1
  return np.array(hist) / (h * w)

a = imread('a.jpg')
b = imread('b.jpg')
a_hist = get_histogram(a)
b_hist = get_histogram(b)
dist = wasserstein_distance(a_hist, b_hist)
print(dist)
Другие вопросы по тегам