Достаточно ли этого набора данных для обучения и тестирования модели классификации?

Мой учебный набор данных содержит всего 2 класса с 40 функциями.

В случае 1 класс 1 имеет 35 образцов, а класс 2 имеет 700 образцов.

В случае 2 класс 1 имеет 65 образцов, а класс 2 имеет то же значение, что и выше.

Достаточно ли моего учебного набора данных для построения модели с использованием классификатора SVM или некоторых других классификаторов?

Я использую WEKA. Варианты тестирования - 10-кратная перекрестная проверка и %66, и я получаю очень хорошие результаты.

1 ответ

Вы удовлетворены результатом, а значит, у вас достаточно данных. Трудно сказать, сколько данных вам нужно, это зависит от того, какую именно проблему вы решаете, какой уровень шума в ваших данных, какие функции и т. Д.

Я описал это здесь во второй части: /questions/14248063/ml-dostatochno-vozmozhnostej/14248068#14248068

Другие вопросы по тегам