Размер разреженной матрицы после сброса данных svmlight

У меня есть pd.DataFrame, и я вывожу его в формат svmlight. Исходный pd.DataFrame x_test имеет форму (15, 210), а вектор ответа y_test имеет (15,) форму. Вы можете увидеть dtypes для x_test, y_test (float64 и unit8). После загрузки дампа я получаю только (15, 207) форму (15, 211). Что не так с моим кодом? Вот:

import scipy as sc
datasets.dump_svmlight_file(x_test, y_test, f = '/home/Nick/data/test_tmp.libfm',zero_based=True)
print('DataFrame contains {}'.format(x_test.dtypes.unique()))
print('Target variable has format {}'.format(y_test.dtype)) print('Size of DataFrame {}'.format(x_test.shape)) print('Size of target variable {}'.format(y_test.shape))
temp1 = datasets.load_svmlight_file('/home/Nick/data/test_tmp.libfm')
temp1

Out: 

DataFrame contains [dtype('float64') dtype('uint8')] 
Target variable has format float64 
Size of DataFrame (15, 210) 
Size of target variable (15,)
DataFrame contains [dtype('float64') dtype('uint8')] Target variable has format float64 Size of DataFrame (15, 210) Size of target variable (15,)
Out[100]:
(<15x207 sparse matrix of type '<class 'numpy.float64'>'
    with 114 stored elements in Compressed Sparse Row format>,  array([ 1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,
         1.,  1.]))

0 ответов

Другие вопросы по тегам