Как выполнить запрос llama-index, когда метаданные включены в документы
При добавлении метаданных с помощью каждого из перечисленных здесь методов запрос не возвращает правильный узел. Без метаданных все работает нормально.
добавлениеdocument.metadata = {'filename': '<doc_file_name>', 'id': '<doc_id>', 'subject': '<doc_subject>'}
, делает запрос больше не работающим. Без передачи метаданных извлечение из запроса проходит нормально, а результат соответствует ожиданиям. Пробовал также проверить черезexcluded_embed_metadata_keys
и/илиexcluded_llm_metadata_keys
, но ничего не изменилось.
Я использую OpenAI Complete_model="gpt-3.5-turbo" и embed_model="text-embedding-ada-002" и QdrantVectorStore.
1 ответ
Решение: измените синтаксис документа в следующем формате. Он не будет отправлять метаданные в llm для ответа на запрос.
metadata_keys = list(metadata.keys()) # Your case ["filename", "id", "subject"]
doc = Document(id_=document_id, text=content, metadata=metadata, excluded_llm_metadata_keys=metadata_keys)
index.insert(doc)
Ссылка: https://gpt-index.readthedocs.io/en/v0.6.38/how_to/customization/custom_documents.html .