Описание тега information-retrieval
Информационный поиск - это область исследования, связанная с поиском документов, информации или метаданных из набора неструктурированных или частично структурированных данных.
Поиск информации - это область исследования, связанная с поиском документов, информации или метаданных из набора неструктурированных или частично структурированных данных.
Обычно он состоит из 3 частей:
- Сканирование: определение документов, в которых мы хотим выполнить поиск, когда наша коллекция документов четко не определена, что особенно важно для поисковых систем.
- Индексирование: анализ и инвертирование документов в индекс, статический автономный процесс или набор инкрементных обновлений для часто меняющихся коллекций документов.
- Поиск: получение документов, наиболее релевантных заданному запросу. Этот шаг требует, чтобы мы ранжировали документы с помощью функций оценки, которые измеряют, насколько документы актуальны для каждого запроса.