Где я могу найти корпус запросов поисковых систем?

Я заинтересован в том, чтобы обучить систему ответов на вопросы поверх пользовательских поисковых запросов, но, похоже, такие данные пока недоступны. Существуют ли какие-либо исследовательские центры или отраслевые лаборатории, которые собрали корпус запросов поисковых систем?

3 ответа

Решение

Есть несколько наборов данных, как это:

Yahoo Weboscope: - http://webscope.sandbox.yahoo.com/catalog.php?datatype=l

Наборы данных Яндекса: - https://www.kaggle.com/c/yandex-personalized-web-search-challenge/data Часть проблемы Kaggle. Вы можете зарегистрироваться и скачать.

Есть также AOL Query Logs и MSN Query Logs, которые были опубликованы как часть общих задач за последние 10 лет. Я не уверен, что они все еще публичны. Однако вы можете исследовать немного.

Наборы данных Weboscope/Kaggle имеют определенные ограничения. Я хотел бы предложить наборы данных TREC, такие как этот набор данных за 2009 год

Тебе стоит попробовать Ответить Сократу

Я надеюсь, что это помогает.

Другие вопросы по тегам