Действительно ли реалистична стандартизация обучающих данных для модели, предназначенной для прогнозирования потоковых данных?

Я пытаюсь предсказать действия (например, бег, сидение, ходьба) на основе непотоковых данных с помощью сверточной нейронной сети. Стандартизация или нормализация обучающих и тестовых данных значительно улучшает прогностическую эффективность сети по сравнению с ее отсутствием стандартизации или нормализации. Все идет нормально.

Тем не менее, я подумал о том, чтобы сделать мой подход применимым и для потоковой передачи данных. Но, исходя из теории, я не могу себе представить, что стандартизация или нормализация потоковых данных работает. Потому что для стандартизации вам нужно знать среднее значение и стандартное отклонение, которые могут меняться с каждой новой входящей точкой данных. Для нормализации вам необходимо знать минимальное и максимальное значение ваших данных, которое также может меняться с каждой новой входящей точкой данных. Поскольку это так, не имеет смысла даже стандартизировать или нормализовать обучающие данные, потому что это будет означать создание другого распределения для обучающих и невидимых данных.

Я не совсем уверен, что я что-то пропустил здесь. Но есть ли обходной путь для потоковой передачи данных, чтобы можно было применить стандартизацию или нормализацию?

0 ответов