Как использовать decapoda-research/llama-7b-hf с тонкой настройкой LoRA в LLaMA.cpp?

Question

В настоящее время после тонкой настройки модели decapoda-research/llama-7b-hf с помощью инструмента https://github.com/zetavg/LLaMA-LoRA-Tuner . Теперь я пытаюсь использовать его в LLaMA.cpp с помощью руководства: https://github.com/ggerganov/llama.cpp/discussions/1166 .

Насколько я знаю, для использования мне нужно преобразовать модель LoRA в GGML. А вот в decapoda-research/llama-7b-hf 33 файла.

Итак, как я могу объединить несколько файлов bin в один и загрузить данные точной настройки?

python pytorch llama llamacpp

Источник

user8707331 09 авг '23 в 17:25

1 ответ

Другие вопросы по тегам python pytorch llama llamacpp

user8019611 18 ноя '23 в 11:34 2023-11-18 11:34 · Answer 1 · 2023-11-18 11:34

Вам нужно будет использовать конвертер «hf в gguf», который доступен в репозитории llama.cpp.

Источник

user8019611 18 ноя '23 в 11:34