R - CLARA кластеризация параллельно
Можно ли выполнить кластеризацию CLARA (кластеризацию вокруг медоидов, выполняемых путем выборки), используя функции параллельной обработки R? У меня есть около 150000 точек в 8 измерениях, поэтому мне нужно кластеризовать образцы, в противном случае мне не хватит вычислительной мощности в мире для кластеризации этого.
Сейчас я работаю над iMac с одним двухъядерным процессором (2,4 ГГц Intel Core 2 Duo), поэтому я предполагаю, что смогу использовать его для ускорения вычислений. Поскольку точек очень много, мне нужно выполнить много итераций алгоритма кластеризации, чтобы найти оптимальное количество кластеров и оптимальный размер выборки (хотя после пары экспериментов кажется, что даже с такой небольшой выборкой, как 3000, результаты хорошо как с большими образцами). Однако, когда размер выборки приближается к 5000, вычисления замедляются до дней.
Каков наилучший способ сделать это в последней версии R? Я читал, что там уже встроены функции параллельной обработки (foreach, параллельные пакеты). Но функция CLARA является атомарной в том смысле, что действительно трудно изменить ее внутренний код для включения параллельной обработки (ну, по крайней мере, для меня).
Итак, в идеале я хотел бы запускать внутренний код функции CLARA параллельно, а не запускать итерации этой функции с различными параметрами параллельно друг другу.