Чат-бот, использующий CSV-файл

Я пытаюсь создать чат-бота, используя службу ботов Azure и открытый искусственный интеллект Azure. Источником данных являются несколько файлов csv. Я могу создавать встраивание, используя расширение цветности langchain. Но при запросе встраивания я не получаю правильного ответа.

но если я использую create_csv_agent из langchain, я получаю желаемый ответ. Есть ли способ использовать встраивание CSV и использовать его? Основная причина, по которой мы не можем использовать csv_agent, заключается в том, что в настоящее время для POC у нас есть источник в виде файла csv, но позже источник может быть в формате файла CSV, xls или pdf. Мы пытаемся создать универсальный процесс внедрения, способный обрабатывать все возможные сценарии.

Есть ли что-то особенное, что необходимо сделать для процесса встраивания или процесса получения файлов CSV?

Любой указатель на это был бы очень полезен.

Заранее спасибо.

1 ответ

      LOADER_MAPPING = {
    ".csv": (CSVLoader, {}),        
    ".pdf": (PyMuPDFLoader, {}),
    ".txt": (TextLoader, {"encoding": "utf8"}),
} 
   
loader_class, loader_args = LOADER_MAPPING[ext]
loader = loader_class(file_path, **loader_args)
loader.load()

from langchain.embeddings import HuggingFaceEmbeddings
embeddings = HuggingFaceEmbeddings(model_name='all-MiniLM-L6-v2')
Другие вопросы по тегам