Как выбрать селективный HTML-контент в моем веб-просмотре в Android?

В настоящее время я пытаюсь импортировать выборочный заголовок из HTML-контента в моем веб-представлении. Я смотрю на множество вариантов, таких как анализ JSON или любой хак подойдет. Мне было интересно, если у кого-то был опыт с этим или краткая идея о том, как это сделать? Вот мой пример: Это мой HTML-файл:

<div><h1><span class = "headline"> Some depressing title </span> <span class = "source" > ABCD </span> </h1> <br/> <span class = "body"> crappy body content which I do not need </span></div>

Я просто хочу получить "заголовок" и "источник" из этого HTML в моем веб-просмотре, ничего больше (не тело). Как мне определить параметр для их получения? Любые подсказки о том, как это сделать?

Спасибо!

1 ответ

Шаг 1: получить исходный код HTML из вашего WebView - посмотрите на этот вопрос. Вы в основном создаете интерфейс JS, который извлекает ваш источник HTML в строку Java.

Шаг 2. Используйте анализатор HTML (например, JSOUP), чтобы проанализировать строку JAVA в формате, который вы можете легко обработать.

Шаг 3: Используйте парсер для извлечения вашей соответствующей информации. Здесь вы можете использовать getElementsByTag('span') чтобы получить все ваши промежутки, затем отфильтровать по классу; или вы могли бы напрямую использовать getElementsByClass('healine') а также getElementsByClass('source'),

В общем, вы можете получить исходный код HTML и проанализировать DOM во всех случаях.

Редактировать: если вы не хотите использовать парсер, вы можете извлечь свою информацию, используя поиск по исходной строке HTML (поиск правильных классов, а затем поиск индексов символов '<' и '>' для анализа информации. Этот способ сложнее, менее эффективен и менее гибок, но это можно сделать.

Другие вопросы по тегам