Нормализация (масштабирование объектов) набора данных облака точек
У меня есть набор данных облака точек, где отдельные данные представлены N * 3, где N - количество точек. Точно так же у меня есть "M" количество облаков точек в наборе данных. Диапазон этих точечных облаков сильно различается. У некоторых есть очень большие значения (например, в терминах 10^6 для всех N точек), в то время как у некоторых есть очень маленькие значения (например, в терминах 10^1 для всех N точек). Я хочу нормализовать каждое облако точек. Как мне это сделать?
Q1. Должен ли я нормализовать (min-max) каждое облако точек (отдельное облако точек N*3) отдельно по измерениям x, y, z, выбрав min и max только из этого облака точек. В этом сценарии для всех "M" облаков точек мы имеем разные min-max. То же самое сделано для выходного облака точек. Пожалуйста, просмотрите изображение для лучшего понимания
Q2. Или я должен нормализовать (min-max) все облака точек по размеру x, y, z, выбрав min и max (из M * N *3 в столбцах x, y, z) только из всего этого набора данных. В этом сценарии для всех "m" облаков точек мы имеем одинаковые минимальные и максимальные значения. Пожалуйста, просмотрите изображение для лучшего понимания
1 ответ
Вы должны использовать вариант 1.
Смысл нормализации заключается в стандартизации входов в вашу сеть - в случае нормализации min-max это отобразит ваши 3 функции (я полагаю, xyz
) к интервалу [0,1].
Вариант 2 нежелателен, так как вместо этого стандартизирует нормализацию. Поскольку центроиды ваших облаков точек очень изменчивы, это увеличит сложность входной дискриминации для вашей модели.
Вы также можете рассмотреть возможность стандартизации с использованием переменного стандартного отклонения.