Есть ли поисковая система, которая даст прямой ответ?

Некоторое время я размышлял об этом, и я не понимаю, почему Google еще не пробовал - или, может быть, они пробовали, и я просто не знаю об этом.

Есть ли поисковая система, в которую вы можете ввести вопрос, в который вы получите один ответ, а не список результатов, которые вам затем придется просмотреть самостоятельно, чтобы найти то, что вы хотите узнать?

Например, вот как я бы спроектировал систему:

Пользовательский ввод: "Куда вы идете, чтобы проверить ваши глаза?"

Система вывода: "Оптика. Уверенность: 95% "

Это будет рассчитываться следующим образом:

  1. Входные данные анализируются с естественного языка в простую строку поиска, в данном случае, вероятно, что-то вроде "глазного тестирования". Термин "Куда вы идете" также будет интерпретироваться системой и использоваться при сравнении результатов.
  2. Строка поиска будет введена в поисковую систему.
  3. Затем система будет сравнивать содержание результатов, чтобы найти подходящие слова или фразы, принимая к сведению, что задает вопрос (т.е. что, где, кто, как и т. Д.)
  4. Как только подходящий ответ определен, система отображает его пользователю вместе с показателем того, насколько верным является ответ.

Из-за разрозненного характера Интернета правильный ответ может появиться несколько раз, особенно для простых вопросов. В этом конкретном примере системе было бы не слишком сложно распознать, что это слово постоянно появляется в результатах и ​​что это почти наверняка искомый ответ.

Для более сложных вопросов будет показана более низкая достоверность и, возможно, несколько результатов с разными уровнями достоверности. Пользователю также будет предложена возможность увидеть источники, по которым система рассчитывает результаты.

Суть этой системы в том, что она упрощает поиск. Много раз, когда мы используем поисковую систему, мы просто ищем что-то действительно простое или тривиальное. Возвращение длинного списка результатов не кажется наиболее эффективным способом ответа на вопрос, хотя ответ почти наверняка скрыт в этих результатах.

Просто посмотрите на результаты Google по вышеуказанному вопросу, чтобы понять мою точку зрения: http://www.google.co.uk/webhp?sourceid=chrome-instant&ie=UTF-8&ion=1&nord=1#sclient=psy&hl=en&safe. = выкл & норд = 1 & сайта =webhp& источник = л.с. & Q = Где%20do%20you%20go%20to%20get%20your%20eyes%20tested%3F& водн =& AQI =& акл =& OQ =& АТС = 1 & Fp=72566eb257565894& Fp=72566eb257565894& ион = 1

Полученные результаты не сразу отвечают на вопрос - они должны быть просмотрены пользователем, прежде чем ответ, который они действительно хотят, найден. Поисковые системы - отличные каталоги. Они действительно хороши для того, чтобы дать вам больше информации о предмете или сказать, где найти услугу, но они не так хороши, чтобы отвечать на прямые вопросы.

Существует много аспектов, которые необходимо учитывать при создании системы, например, при расчете результатов необходимо учитывать точность веб-сайта.

Хотя система должна хорошо работать для простых вопросов, может оказаться довольно сложной задачей заставить ее работать для более сложных. Например, распространенные заблуждения должны рассматриваться как особый случай. Если система находит доказательства того, что вопрос пользователя имеет общее неправильное представление в качестве ответа, она должна либо указать на это при предоставлении ответа, либо даже просто игнорировать наиболее распространенный ответ в пользу ответа, предоставленного веб-сайтом, который указывает, что он это распространенное заблуждение. Все это должно быть взвешено путем сравнения точности и качества противоречивых источников.

Это интересный вопрос, который потребует много исследований, но, безусловно, стоило бы времени и усилий? Это не всегда будет правильно, но это сделает простые запросы намного быстрее для пользователя.

5 ответов

Решение

Такая система называется системой автоматического ответа на вопросы (QA) или поисковой системой на естественном языке. Его не следует путать с социальной службой ответов на вопросы, где ответы производят люди. QA является хорошо изученной областью, о чем свидетельствует почти десятилетие публикаций треков TREC QA, но это одна из наиболее сложных задач в области обработки естественного языка (NLP), потому что она требует широкого спектра знаний (анализ, поиск). извлечение информации, релевантность, умозаключение). Это может объяснить, почему на сегодняшний день существует относительно мало свободно доступных онлайн-систем, большинство из которых больше похожи на демоверсии. Некоторые включают в себя:

Основные поисковые системы проявили интерес к технологии ответа на вопросы. В интервью 1 июня 2011 года Эрик Шмидт сказал, что новая стратегия поиска Google заключается в предоставлении ответов, а не просто ссылок. "Мы можем буквально вычислить правильный ответ, - сказал Шмидт, ссылаясь на достижения в области технологий искусственного интеллекта" ( источник).

Мэтью Гольцбах, руководитель отдела продуктов для Google Enterprise , заявил, что "Ответ на вопрос - это будущее корпоративного поиска". Yahoo также прогнозирует, что будущее поиска связано с тем, что пользователи получают ответы в режиме реального времени вместо ссылок. Эти крупные игроки постепенно внедряют технологию QA в качестве дополнения к другим видам результатов поиска, как видно из "коротких ответов" Google.

В то время как IBM Watson, играющая в Jeopardy, много сделала для популяризации машин, отвечающих на вопросы (или ответы), многие реальные проблемы остаются в общей форме ответов на вопросы.

См. Также связанный вопрос о системах обеспечения качества с открытым исходным кодом.

Обновить:

  • 2013/03/14: Google и Bing Search Execs обсуждают, как поиск развивается до разговорного ответа на вопрос ( AllThingsD)

Вольфрам Альфа

http://www.wolframalpha.com/

Wolfram Alpha (в стиле Wolfram|Alpha) - это механизм ответов, разработанный Wolfram Research. Это онлайн-сервис, который отвечает на фактические запросы напрямую, вычисляя ответ из структурированных данных, а не предоставляя список документов или веб-страниц, которые могут содержать ответ, как это сделала бы поисковая система.[4] Это было объявлено в марте 2009 года Стивеном Вольфрамом, и было обнародовано 15 мая 2009 года.[1] Он был признан самым популярным компьютерным новшеством 2009 года по версии Popular Science. [5] [6]

http://en.wikipedia.org/wiki/Wolfram_Alpha

Вы пробовали вольфрамальфу?

Посмотрите на это: http://www.wolframalpha.com/input/?i=who+is+the+president+of+brasil%3F

Powerset, приобретенный Microsoft, также пытается ответить на вопрос. Они называют свой продукт "поисковой системой на естественном языке", где вы можете ввести такой вопрос, как "В каком штате США самый высокий подоходный налог?" и искать по вопросу вместо использования ключевых слов.

Спросите Дживса, теперь Ask.com, раньше делал это. Почему никто больше так не делает, кроме Вольфрама

  1. Ответ на вопрос (QA) далек от решенной проблемы.
  2. Существуют строгие системы ответов на вопросы, но они требуют полного анализа как вопроса, так и данных, и, следовательно, требуют огромных вычислительных мощностей и памяти, даже по сравнению с масштабом Google, для получения какого-либо покрытия.
  3. Большинство веб-данных слишком шумные для обработки; сначала вы должны определить, поддерживает ли он язык, который вы поддерживаете (или перевести его, как это сделали некоторые исследователи; найдите "ответ на многоязычный вопрос"), затем попытаться обнаружить шум, а затем проанализировать. Вы теряете больше покрытия.
  4. Интернет меняется молниеносно. Вы теряете еще больше освещения.
  5. Пользователи привыкли к поиску по ключевым словам, так что это намного экономичнее.
Другие вопросы по тегам