Каковы последствия наличия вопросов и ответов в источниках при использовании шаблона RAG с использованием Azure OpenAI?
Все,
Мы используем шаблон openai RAG для извлечения источников из документа и отправки их в openai для получения ответов. Мы используем когнитивный поиск Azure в качестве векторной базы данных.
мы создаем файл Json из исходного PDF-файла. Наш клиент также предоставил список ожидаемых вопросов и ответов.
Мы проиндексировали PDF-файл JSON вместе с вопросами и ответами.
В ходе нашего тестирования мы получаем ожидаемые результаты вместе с контентом как в формате pdf json, так и в вопросах и ответах.
Вопросы
каковы последствия этого подхода?
мы вносим какую-то предвзятость?
Есть лучший способ сделать это ?
Спасибо, Нэн.