Регрессия или классификация? Как определить размер выборки?
У меня есть группа экземпляров с n функций (числовые) каждый. Я пересэмплирую свои функции каждые X временных шагов, поэтому у каждого экземпляра есть набор функций в момент времени t1:tn. Переменная ответа продолжения (например, в диапазоне 50:100) измеряется только каждые X*z раз. (например, выборка каждую минуту, ответ только каждые 30) Функции могут меняться со временем. Как и ответ.
Теперь в любой момент времени T я хочу отобразить новый экземпляр в диапазон ответа.
В случае, если я еще не потерял вас:-) Считаете ли вы это регрессией или проблемой классификации нескольких классов (с дискретным диапазоном ответов)? В любом случае, есть ли эмпирическое правило, сколько экземпляров мне понадобится? Если экземпляры не соответствуют одному и тому же распределению (например, разные ответы для одного и того же набора значений функций, могу ли я использовать кластеризацию для фильтрации / анализа этого?)