Неметрическое многомерное масштабирование с использованием sklearn.manifold.MDS с большими данными не возможно?
Я пытаюсь визуализировать мой набор данных большого размера по двум осям или компонентам, используя неметрическое многомерное масштабирование. Эта функция доступна в библиотеке scikit-learn. Вот мой код:
from sklearn.manifold import MDS
embedding = MDS (n_components=2, metric= False, n_init=2, max_iter=100,
verbose=0, eps=0.001, n_jobs=2, random_state=101
,dissimilarity='euclidean')
#precip=precip[0:100]
precip_transformed = embedding.fit_transform(precip)
precip_transformed
Значения по умолчанию для n_init - 4, max_iter - 300, а n_jobs=None (что означает -1). Это работает вечно, хотя я уменьшил значения по умолчанию и увеличил n_jobs. Это также делает мой ноутбук сбой через некоторое время. Я должен отметить, что мои данные имеют 20000 строк, и когда я сохраняю закомментированную строку кода (всего 100 строк), это работает. Кто-нибудь знает, как я могу сделать эту работу? быстрее или каким-либо способом убедиться, что ноутбук не сломается.