Объедините базовую модель с моими адаптерами Peft, чтобы создать новую модель.
Я пытаюсь объединить свои доработанные адаптеры с базовой моделью. С этим
torch.cuda.empty_cache()
del model
pre_trained_model_checkpoint = "databricks/dolly-v2-3b"
trained_model_chekpoint_output_folder = "/content/gdrive/MyDrive/AI/Adapters/myAdapter-dolly-v2-3b/"
base_model = AutoModelForCausalLM.from_pretrained(pre_trained_model_checkpoint,
trust_remote_code=True,
device_map="auto"
)
model_to_merge = PeftModel.from_pretrained(base_model,trained_model_chekpoint_output_folder)
del base_model
torch.cuda.empty_cache()
merged_model = model_to_merge.merge_and_unload()
tokenizer = AutoTokenizer.from_pretrained(trained_model_chekpoint_output_folder)
Затем
merged_model.save_pretrained('path')
Размер сгенерированной модели примерно вдвое больше.(от 5,6 ГБ до 11 ГБ) Моя тонкая настройка в основном добавляет информацию о наборе данных из 200 примеров в формате Alpaca.
Что я делаю не так?