Как исправить цвет отображения отображения двухмерных данных Python из TF IDF?
Я пробовал код по этой ссылке построить документ tfidf 2D-график
from sklearn.feature_extraction.text import CountVectorizer,
TfidfTransformer
from sklearn.decomposition import PCA
from sklearn.pipeline import Pipeline
import matplotlib.pyplot as plt
pipeline = Pipeline([
('vect', CountVectorizer()),
('tfidf', TfidfTransformer()),
])
X = pipeline.fit_transform(x_test).todense()
pca = PCA(n_components=2).fit(X)
data2D = pca.transform(X)
plt.scatter(data2D[:,0], data2D[:,1],c=x_test)
plt.show()
Это код работает, если я удаляю c=x_test в последней строке, но цвет такой же, только один цвет, если я добавляю c=x_test
его ошибка сказать ValueError: c of shape (444L,) not acceptable as a color sequence for x with size 444, y with size 444
Как исправить код так, чтобы по цвету было 6 классов или категорий?