Установка элемента массива с ошибкой последовательности при обучении SVM для классификации изображений
Я пытаюсь сделать классификацию изображений с использованием SVM в Python с 1022 изображениями и 1022 метками мультикласса (каждая метка имеет 14 классов).
mypath = 'path'
k = listdir(mypath)
images = np.empty((len(k)-1), dtype=object)
resized_imgs = np.empty((len(k)-1),dtype=object)
for n in range(0, len(k)-1):
images[n] = cv2.imread(join(mypath,k[n]),0) #Reading images in grayscale
resized_imgs[n] = cv2.resize(images[n],(32,32)) #Resizing images
for i in range(0,len(k)-1):
a=resized_imgs[i].mean()
b=resized_imgs[i].std()
t=np.ndarray([32,32])
t.fill(1)
t=t*a
resized_imgs[i]=(resized_imgs[i]-a)/b
X_train = resized_imgs
for i in range(len(k)-1):
X_train[i] = X_train[i].flatten().tolist()
y_train = np.array(y_train)
for i in range(len(k)-1):
y_train[i] = y_train[i].flatten().tolist()
clf=svm.SVC(gamma=0.001)
clf.fit(X_train,y_train)
Теперь для этого я получаю ошибку:
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-469-bfab446776df> in <module>()
----> 1 clf.fit(X_train,y_train[:,0])
C:\Users\user\Anaconda3\lib\site-packages\sklearn\svm\base.py in fit(self, X, y, sample_weight)
148 self._sparse = sparse and not callable(self.kernel)
149
--> 150 X = check_array(X, accept_sparse='csr', dtype=np.float64, order='C')
151 y = self._validate_targets(y)
152
C:\Users\user\Anaconda3\lib\site-packages\sklearn\utils\validation.py in check_array(array, accept_sparse, dtype, order, copy, force_all_finite, ensure_2d, allow_nd, ensure_min_samples, ensure_min_features, warn_on_dtype, estimator)
371 force_all_finite)
372 else:
--> 373 array = np.array(array, dtype=dtype, order=order, copy=copy)
374
375 if ensure_2d:
ValueError: setting an array element with a sequence.
Я не понимаю, как это может быть из-за несоответствия размеров массива X_train, потому что каждый элемент X_train представляет собой список из 1024 нормализованных значений пикселей, а каждый элемент y_train соответствует списку из 14 атрибутов.
Любая помощь будет оценена. Спасибо!
1 ответ
Я понял, где я иду не так. Оказывается, dtype для X_train был типом объекта, поэтому мне пришлось изменить его на float.
Использовал следующий код для того же,
np.array(list(X_train), dtype=np.float)