Как запустить multiprocess Chroma.from_documents() в Langchain
Можем ли мы каким-то образом передать возможность запуска нескольких потоков/процессов при вызове Chroma.from_documents() в Langchain?
Я пытаюсь встроить 980 документов (модель внедрения — mpnet в CUDA), и это занимает вечность. Характеристики: Программное обеспечение: Ubuntu 20.4 (на хосте Win11 WSL2), версия Langchain: 0.0.253, версия pyTorch: 2.0.1+cu118, версия Chroma: 0.4.2, CUDA 11.8. Процессор: Intel i9-13900k с частотой 5,4 ГГц, все 8 P. -ядра и 4,3 ГГц, все остальные 16 ядер E. Графический процессор: графический процессор RTX 4090
2 ответа
Chroma теперь поддерживает несколько потоков , так что это должно быть технически возможно. Почему бы просто не импортировать потоки и не создать несколько загрузчиков?
как-то это разрешилось, я думаю. Мне пришлось удалить хрома/хрома-клиент и переустановить полный пакет цветности. Также это невероятно помогает, если вы встраиваете устройство = cuda