Как запустить multiprocess Chroma.from_documents() в Langchain

Можем ли мы каким-то образом передать возможность запуска нескольких потоков/процессов при вызове Chroma.from_documents() в Langchain?

Я пытаюсь встроить 980 документов (модель внедрения — mpnet в CUDA), и это занимает вечность. Характеристики: Программное обеспечение: Ubuntu 20.4 (на хосте Win11 WSL2), версия Langchain: 0.0.253, версия pyTorch: 2.0.1+cu118, версия Chroma: 0.4.2, CUDA 11.8. Процессор: Intel i9-13900k с частотой 5,4 ГГц, все 8 P. -ядра и 4,3 ГГц, все остальные 16 ядер E. Графический процессор: графический процессор RTX 4090

2 ответа

Chroma теперь поддерживает несколько потоков , так что это должно быть технически возможно. Почему бы просто не импортировать потоки и не создать несколько загрузчиков?

как-то это разрешилось, я думаю. Мне пришлось удалить хрома/хрома-клиент и переустановить полный пакет цветности. Также это невероятно помогает, если вы встраиваете устройство = cuda

Другие вопросы по тегам