Какое влияние оказывают системы координат на расположение кластеров?
Мне было интересно узнать, если у меня есть набор данных с географической координатой (long, lat, alt), я могу сделать кластеризацию на основе этих значений?. Что если эти значения будут преобразованы в декартовы координаты (X,Y,Z) или в радианы, будут ли какие-либо различия в кластеризации? Должен ли результат такого подхода быть одинаковым (собирать близлежащие точки вместе)?
В целом, я хочу знать влияние разных систем координат одних и тех же точек на кластеризацию.
1 ответ
Это зависит от алгоритмов, которые вы используете.
Некоторые инструменты кластеризации, такие как ELKI, поддерживают геодезические расстояния, поэтому они могут отлично работать с широтой и долготой.
Попробуйте сначала выбрать меру расстояния, которую вы хотите использовать, а не алгоритм или кластеризацию. Выберите расстояние, чтобы оно имело смысл для вашего приложения, а не потому, что вы знаете, как написать код для него.