GTFS Major против незначительного обновления

Мы ежедневно загружаем новые данные GTFS (в основном это файлы в формате CSV) из нескольких источников, чтобы узнать, было ли обновлено обновление. Прямо сейчас мы просто проверяем, отличаются ли сами почтовые индексы, и обновляем, если они отличаются.

Дело в том, что в некоторых источниках GTFS меняется каждый день. Это проблема для нас, так как это вызывает обновление автономных данных на многих устройствах.

В большинстве случаев обновление незначительное (изменено имя остановки, разные идентификаторы, но содержимое одинаковое и т. Д.). Я хочу отличить основное обновление (изменение расписания, новый маршрут) от второстепенного. Инструменты Diff сами по себе бесполезны, поскольку каждая GTFS может иметь одинаковый контент, но с разными идентификаторами и / или порядком в CSV.

У кого-нибудь была такая же проблема? Есть ли инструмент, который может помочь?

0 ответов

Другие вопросы по тегам