Размер набора данных для алгоритма рекомендации
Я работаю над созданием системы рекомендаций, используя weka. То, что я читал о наборе данных в интернете до сих пор, это должно иметь больше данных для рекомендации, чтобы быть хорошим. Интересно, что, если я пытаюсь рекомендовать что-то, о чем у нас не может быть большого количества данных. Например, если вы хотите создать систему рекомендаций парка или больницы для определенного города. Это не будет иметь более 100 записей. Так нормально ли это делать с небольшими наборами данных?
1 ответ
Как сообщается в этом посте, есть несколько руководств или практических правил, которые можно использовать для подготовки достаточных данных для модели. Некоторые из советов здесь включены:
- По крайней мере, в шесть раз больше функций в качестве учебных случаев
- Как минимум в три раза больше функций в классе
Обратите внимание, что это только практические правила, которых может быть или не быть достаточно в зависимости от сложности ваших данных. Исходя из рекомендаций, изложенных в этой статье, 100 случаев может быть достаточно, но, как заявил Раманан Р., больше случаев, вероятно, будет лучше.
Надеюсь это поможет!