YQL - CDATA ]]> ошибка при выборе данных с использованием YQL

Пытаюсь очистить данные с totalfilm.com с помощью YQL, но получаю странную ошибку:

"Символьная последовательность"]]>"не должна появляться в контенте, если только она не используется для обозначения конца раздела CDATA".

select * from html where url="www.totalfilm.com"

ссылка на сайт

1 ответ

Решение

Как отмечалось в комментариях, может потребоваться некоторая путаница, чтобы сломанный XHTML работал так, как вам хотелось бы.

Вот быстрая, очень грубая открытая таблица данных для вас, которая удаляет любые <![CDATA[ а также ]]> со страницы (X)HTML (а также Tidys it) перед применением необязательного выражения XPath, как в обычном html стол, чтобы получить данные, которые вам нужны.

Вы можете использовать его как:

use "https://github.com/salathe/yql-tables/raw/examples/data/nocdata.xml" as html;
select * from html where url="www.totalfilm.com"
Другие вопросы по тегам