Как визуально создать гибридный запрос для программной экстракции

Я занимаюсь разработкой приложения, которое получает различные входные данные с интернет-страниц, в то время как каждый фрагмент информации поступает из другого места (mashup). Я хотел бы создать строительный блок гибридного приложения (фрагменты) через визуальный инструмент. Знаете ли вы что-нибудь подобное, что может быть использовано для такого проекта? (Уже сделан контроль, пример кода, статья и т. Д.) Предпочтительной средой разработки является.NET - но не обязательно.

1 ответ

ИМО основной задачей будет извлечение соответствующей информации из каждого канала в семантической форме. Википедия описывает коллажи как:

Существует много типов гибридных приложений, таких как потребительские гибридные приложения, гибридные приложения данных и корпоративные гибридные приложения. Наиболее распространенный тип коллажей - это коллажи, предназначенные для широкой публики.

Мешапы данных объединяют похожие типы мультимедиа и информации из нескольких источников в одном представлении. Одним из примеров является AlertMap, который объединяет данные из более чем 200 источников, связанных с суровыми погодными условиями, угрозами биологической опасности и сейсмической информацией, и отображает их на карте мира; Другая карта - Чикагская криминальная карта, которая показывает уровень преступности и место преступления в Чикаго.

Классический мэшап - преступление в Чикаго - работает, потому что ключевая информация, такая как даты и геолокации, доступна семантически. Другие типы общей информации - это лица, организации и доменные идентификаторы.

Когда вы определили их, вы можете рассмотреть инструменты на основе RDF, которые разрабатывает семантическая сеть. Обратите внимание, что правительства начинают передавать свои данные в RDF, поэтому я бы посчитал это ключевой технологией

Если ваши веб-страницы не содержат семантической информации сразу, вам, вероятно, придется создавать скребки экрана и парсеры HTML. Это не очень гламурно, нет специальных инструментов и, как правило, просто тяжелая работа.

Другие вопросы по тегам