Достаточно ли этого набора данных для обучения и тестирования модели классификации?
Мой учебный набор данных содержит всего 2 класса с 40 функциями.
В случае 1 класс 1 имеет 35 образцов, а класс 2 имеет 700 образцов.
В случае 2 класс 1 имеет 65 образцов, а класс 2 имеет то же значение, что и выше.
Достаточно ли моего учебного набора данных для построения модели с использованием классификатора SVM или некоторых других классификаторов?
Я использую WEKA. Варианты тестирования - 10-кратная перекрестная проверка и %66, и я получаю очень хорошие результаты.
1 ответ
Вы удовлетворены результатом, а значит, у вас достаточно данных. Трудно сказать, сколько данных вам нужно, это зависит от того, какую именно проблему вы решаете, какой уровень шума в ваших данных, какие функции и т. Д.
Я описал это здесь во второй части: /questions/14248063/ml-dostatochno-vozmozhnostej/14248068#14248068