YQL - CDATA ]]> ошибка при выборе данных с использованием YQL
Пытаюсь очистить данные с totalfilm.com с помощью YQL, но получаю странную ошибку:
"Символьная последовательность"]]>"не должна появляться в контенте, если только она не используется для обозначения конца раздела CDATA".
select * from html where url="www.totalfilm.com"
1 ответ
Решение
Как отмечалось в комментариях, может потребоваться некоторая путаница, чтобы сломанный XHTML работал так, как вам хотелось бы.
Вот быстрая, очень грубая открытая таблица данных для вас, которая удаляет любые <![CDATA[
а также ]]>
со страницы (X)HTML (а также Tidys it) перед применением необязательного выражения XPath, как в обычном html
стол, чтобы получить данные, которые вам нужны.
Вы можете использовать его как:
use "https://github.com/salathe/yql-tables/raw/examples/data/nocdata.xml" as html;
select * from html where url="www.totalfilm.com"