Подходы для кластеризации пространственно-геодезической широты и долготы в R - Follow-Up

Мои являются продолжением вопроса и ответа в Подходах для пространственной геодезической широты и долготы, кластеризованной в R с геодезической или большим круговым расстоянием.

Я хотел бы лучше понять:

Вопрос № 1: Если все значения широты / долготы находятся в одном городе, необходимо ли использовать fossil или же distHaversine(...) сначала рассчитать большие расстояния круга?

  • или в пределах одного города нормально ли запускать кластеризацию на самих значениях lat / long?

Вопрос № 2: Джолвард предполагает, что:

Стоит отметить, что эти методы требуют, чтобы все точки входили в некоторый кластер. Если вы просто спросите, какие точки расположены близко друг к другу, и допустите, что некоторые города не входят ни в один кластер, вы получите совсем другие результаты.

В моем случае я хотел бы спросить, просто спросите "какие точки находятся близко друг к другу", не навязывая каждую точку в кластер. Как я могу это сделать?

Вопрос № 3: Чтобы включить одну или две факторные переменные в кластеризацию (в дополнение к широте / долготе), это так же просто, как включить те факторные переменные в df, на которых выполняется кластеризация?

Пожалуйста подтвердите. Спасибо!

1 ответ

"В пределах одного города нормально ли запускать кластеризацию на самих значениях lat/long?"

Да, пока ваш город находится на экваторе, где градус долготы равен расстоянию широты.

Я стою очень близко к северному полюсу. Один градус долготы составляет 1/360 от окружности круга вокруг полюса от меня. Кто-то в десяти градусах к востоку от меня может быть всего в десяти футах. Кто-то один градус к югу от меня в нескольких милях. Алгоритм кластеризации, основанный на длине широты, мог бы думать, что парень, находящийся за много миль от меня, был ближе ко мне, чем парень, которого я могу помахать на десять градусов восточнее меня.

Решение для небольших областей, чтобы избавить от необходимости вычислять эллипсоидальные расстояния большого круга, состоит в том, чтобы проецировать на систему координат, которая является почти достаточно декартовой, чтобы вы могли использовать теорему Пифагора для расстояния без слишком большой ошибки. Обычно вы используете преобразование зон UTM, которое, по сути, представляет собой систему координат, которая выводит свой экватор через область изучения.

spTransform функция в sp а также rgdal разберусь за это.

Другие вопросы по тегам