Какова связь между RDF, RDFa, микроформатами и микроданными
Я провел немало исследований, но не могу понять точную связь между 3. Кроме того, теперь, когда W3C официально признал RDFa, вы бы порекомендовали его по микроданным, учитывая, что он соответствует функциям микроданных и многим другим?
3 ответа
Очень кратко:
- Микроформаты Способ использования html-страниц как удобочитаемого документа и машиночитаемых данных без повторения (например, вставка CSV в элемент head).
- RDF Модель данных, разработанная для Интернета. Без схемы, использует URL-адреса для имен типов и отношений.
- RDFa Способ кодирования (записи) RDF в html, следуя стилю микроформатов (т. Е. Сводя к минимуму повторение). Работает, добавив несколько атрибутов в HTML.
- Микроданные Альтернатива RDFa, использующая разные атрибуты и другую модель данных.
Менее кратко, RDF произошел от попыток сделать данные "webby". Был даже плагин для просмотра MCF предшественника RDF (от любопытства Apple). Модель данных была разработана таким образом, чтобы вы могли написать то, что вы хотите, без предварительной договоренности о том, как именовать столбцы или ключевые значения со всеми остальными в сети. RDF был стандартно написан (сериализован) с использованием XML (хотя доступны и другие, более приятные форматы).
Так что в этом мире у вас может быть читабельная домашняя страница (me.html
) и домашняя страница данных (me.rdf
) для машин выкопать. Эти машины не поймут смысл <p>I live in <a href="http://example.com/Chicago">Chicago</a></p>
, но они могут быть в состоянии использовать :me ex:livesIn <http://example.com/Chicago>
если они смотрят вверх "в жизни".
Микроформаты также пытаются сделать данные "сетевыми", или, возможно, это должна быть сеть "data-y". Понимание здесь заключается в том, что на веб-страницах много данных между прозой. Если у вас есть несколько подсказок, машина может решить, что этот фрагмент HTML выше - это в основном адрес. Эти подсказки являются микроформатами. Обычно они используют соглашения вокруг имен классов html, чтобы указать, что контент - это больше, чем текст.
Таким образом, микроформатам не нужна отдельная веб-страница для машин. Но микроформаты охватывают только несколько типов данных (адреса, дружеские ссылки, местоположение...) из-за того, как они работают. Каждый из них является определенной конвенцией, которую необходимо согласовать. При неосторожном обращении они тоже могут плохо смешиваться.
RDFa - это попытка получить как гибкость RDF, так и простоту микроформатов. Микроданные были ответом на RDFa, но с другой моделью данных (грубо говоря, это массивы и хэши, а не реляционная модель). В отличие от микроформатов, ни один из них не определяет, какая информация предоставляется, как она кодируется.
Чтобы завершить то, что не хватает, у нас теперь есть schema.org, который является инициативой крупных поисковых систем (Google, Bing, Yahoo, Yandex) для индексации веб-данных. schema.org координирует эти значения, так что поисковая система знает, что, скажем, события имеют местоположения. Микроданные изначально использовались schema.org, но теперь поддерживаются как микроданные, так и RDFa.
Я бы проигнорировал микроформаты в эти дни и пошел бы на schema.org. Мой личный вкус - кодировка RDFa, но она или микроданные должны работать нормально.
Я предлагаю вообще игнорировать семантическую сеть. Поисковые системы не будут отправлять вам больше посетителей из-за этого. Вместо этого они будут использовать идеально организованные данные, чтобы предоставить ответ, не отправляя вам посетителей вообще.
Сегодня вы можете увидеть проблему со следующим примером "окна фильма": https://www.google.com/search?q=The+Godfather
Отображаются рейтинги IMDb и Гнилые помидоры. Фрагмент Википедии, а также. Приятно для пользователей, плохо для этих сайтов. Или как часто вы посещали IMDb в прошлом и сегодня?
И не забывай. Отображаемые данные не только от IMDb или гнилых томатов. Даты, режиссеры, награды, музыка, изображения и т. Д. Были собраны с других сайтов. Например, поисковая система может легко найти в своей базе данных "Крестный отец" + "Директор", и если 99 из 100 веб-сайтов содержат имя "Фрэнсис Форд Коппола", то легко проверить ответ без какого-либо ручного взаимодействия.
Наконец, поисковые системы могут создавать собственный контент, не платя и не упоминая авторов. А с семантической классификацией вам будет легче.
Все три являются попыткой сделать веб-контент более семантическим.
РДФА столкнулся со многими препятствиями для входа; он разделял ту же растущую боль (и), которую испытывал xml (rdfa на основе xml) в первые годы работы в сети, только, вероятно, более значительный, потому что было привлечено меньше разработчиков.
я не знаю достаточно о rdfa, чтобы рекомендовать это по микроданным. Я склонен к микроданным, потому что Google, Yahoo!, и Microsoft (теперь Bing) собрались вместе и создали их. rdfa разрабатывался, и предложение по микроформатам было сделано. Более того, микроформаты уже были в массовом производстве и потреблении в Интернете. поэтому большая тройка решила вступить в сговор и придумала микроданные. я немного измотан, я думаю, потому что я не понимаю, почему микроформаты были выброшены. звучит как куча дыма и зеркал.
поэтому я рекомендую микроформаты по всем. они оооочень легкие. и так круто что вы можете достичь с помощью микроданных, чего не можете сделать с микроформатами?
это сказало.... я выбрал бы микроданные по rdfa, потому что они столь же легки. и атрибуты данных намного превосходят HTML-классы. на самом деле, может быть, это большой бонус? данные-атрибуты? Как и ваши исследования, я долго и усердно искал причины, стоящие за микроданными, но все, что я могу найти, - это обычные посты о печеньках.