Чат-бот, использующий CSV-файл
Я пытаюсь создать чат-бота, используя службу ботов Azure и открытый искусственный интеллект Azure. Источником данных являются несколько файлов csv. Я могу создавать встраивание, используя расширение цветности langchain. Но при запросе встраивания я не получаю правильного ответа.
но если я использую create_csv_agent из langchain, я получаю желаемый ответ. Есть ли способ использовать встраивание CSV и использовать его? Основная причина, по которой мы не можем использовать csv_agent, заключается в том, что в настоящее время для POC у нас есть источник в виде файла csv, но позже источник может быть в формате файла CSV, xls или pdf. Мы пытаемся создать универсальный процесс внедрения, способный обрабатывать все возможные сценарии.
Есть ли что-то особенное, что необходимо сделать для процесса встраивания или процесса получения файлов CSV?
Любой указатель на это был бы очень полезен.
Заранее спасибо.
1 ответ
LOADER_MAPPING = {
".csv": (CSVLoader, {}),
".pdf": (PyMuPDFLoader, {}),
".txt": (TextLoader, {"encoding": "utf8"}),
}
loader_class, loader_args = LOADER_MAPPING[ext]
loader = loader_class(file_path, **loader_args)
loader.load()
from langchain.embeddings import HuggingFaceEmbeddings
embeddings = HuggingFaceEmbeddings(model_name='all-MiniLM-L6-v2')