Как отобразить субъективные данные в семантической сети?
Я искал проект freebase для хранения данных. Кажется, это отличное место для хранения конкретных, объективных данных, таких как имена, места и даты. Это хорошее место для хранения субъективных данных, таких как мнения или оценки? Существуют ли другие / лучше открытые данные, хранилище семантических данных или стратегия для хранения и запроса такого рода информации?
Кроме того, поскольку это субъективно, я могу быть уверен, что другие не согласятся с моим мнением. Как я могу хранить мнения других, чтобы мнение зрителей могло быть лучше представлено?
Является ли freebase подходящим местом для хранения данных такого типа?
Например: рейтинг ресторана или рейтинг фильма. Рейтинг фильма, вероятно, будет менее чувствительным ко времени, чем рейтинг ресторана. Любая неидентифицирующая информация о человеке, который ввел данные, будет интересна для определения других факторов и отношений.
4 ответа
Семантическая паутина в большей или меньшей степени является вариантом логики первого порядка, поэтому важной частью является четкое понимание того, что "означает" каждый из ваших предикатов. Эта идея очень проста, но применима к широкому спектру смысловых представлений - т.е. она лежит в основе сущностной модели баз данных.
Не должно быть проблем с представлением информации, которую вы упомянули в представлении семантической сети. Просто убедитесь, что у вас есть четкое определение того, что обозначает каждый из ваших предикатов, чтобы значение не менялось с течением времени, и в результате вы получали непоследовательное представление.
Книга Джинезерета старая, но хорошая, если вы хотите прочитать об этом более подробно. Я думаю, что многие люди, которые работали в Семантической паутине, были вовлечены в проект Cyc Дугласа Лената, который постепенно со временем перешел на логическое представление значений.
http://www.amazon.com/Logical-Foundations-Artificial-Intelligence-Genesereth/dp/0934613311
Сайт для Cyc:
Я считаю, что проектирование / выбор форматов данных очень сложно без понимания вопросов, которые я буду задавать, используя эти данные. С какой целью вы ожидаете, что данные будут использоваться для? Придумайте несколько вариантов использования, которые могут помочь при поиске.
Хранение атрибутивных данных - это открытая тема для исследований, в ходе которой разрабатывается (в том числе) сообщество Intelligence: очевидно, что этим пользователям необходимо отслеживать, откуда взялась информация и кто ее добавил по пути, как для проверки ее надежности, так и для делать такие вещи, как отслеживать, была ли секретная информация включена случайно. Это может быть хорошим местом для поиска.
Данные - это данные. То, что вы хотите сделать, - это пометить данные такими, какие они есть, мнением или оценкой. Я полагаю, что "факт", который можно сделать из таких данных, заключается в том, что большинство людей x
субъективное мнение по поводу указанной темы.