Описание тега information-retrieval

Информационный поиск - это область исследования, связанная с поиском документов, информации или метаданных из набора неструктурированных или частично структурированных данных.

Поиск информации - это область исследования, связанная с поиском документов, информации или метаданных из набора неструктурированных или частично структурированных данных.

Обычно он состоит из 3 частей:

  1. Сканирование: определение документов, в которых мы хотим выполнить поиск, когда наша коллекция документов четко не определена, что особенно важно для поисковых систем.
  2. Индексирование: анализ и инвертирование документов в индекс, статический автономный процесс или набор инкрементных обновлений для часто меняющихся коллекций документов.
  3. Поиск: получение документов, наиболее релевантных заданному запросу. Этот шаг требует, чтобы мы ранжировали документы с помощью функций оценки, которые измеряют, насколько документы актуальны для каждого запроса.