Безопасно ли объединять данные для почтовых индексов в разных демографических наборах?
Моя команда работает с демографическими данными из разных источников данных (некоторые платные источники и некоторые бесплатные источники данных доступны онлайн). Каждый из этих источников данных поставляется с файлом формы и некоторыми атрибутами, связанными с каждой демографической областью, и может быть определен в разные периоды времени. Однако, когда мы показываем эти атрибуты нашим конечным пользователям, мы хотели абстрагировать концепцию нескольких источников данных и показывать почтовые индексы в виде единой демографической единицы. Мы планировали объединить атрибуты всех источников данных в один источник данных и указать это на один из файлов форм (В настоящее время мы готовы рассмотреть прошлые проблемы, связанные с гранулярностью или точностью определения полигона в этих источниках данных). Однако следует ли нам беспокоиться о том, что почтовый индекс для фактической географической области может быть непоследовательным для демографических источников данных, взятых по разным отрезкам во времени? Например, ZipCode 12345 использовался для сопоставления с областью в состоянии A до 2010 года, но указывает на область в штате B для всех наборов данных после 2010 года?
1 ответ
Этот вопрос был перекрестно опубликован на gis.stackexchange, и на него были даны ответы (ссылка https://gis.stackexchange.com/questions/182790/is-it-safe-to-combine-data-for-zipcodes-across-different-demographic-sets)
Существует опасение, что мы можем искажать данные, предполагая, что почтовый индекс всегда отображается в одну и ту же физическую область, и, следовательно, было бы нецелесообразно объединять источники данных без запуска какого-либо инструмента, который может отображать данные на основе физических областей. а не названия почтового индекса