Общее количество гипотез в пространстве версий
У меня есть сомнения в машинном обучении..
Каков размер пространства версий перед просмотром любых обучающих примеров. Предположим, у меня есть 10 атрибутов, и я использую соединение ограничений в качестве представления. Атрибуты имеют два значения, каждое из которых "да" или "нет".
1 ответ
Если у вас есть K классов, то пространство версий - это просто число возможных разбиений всех возможных значений атрибута на K непересекающихся подмножеств.
В твоем случае:
- 10 атрибутов
- 2 возможных значения на атрибут
- Есть 2^10=1024 возможных баллов
- Есть K^1024 возможных гипотез (вы можете думать о них, как о маркировке каждой точки одним из значений K).
Например, для двоичного случая K=2 у нас есть 2^1024 гипотез в пространстве версий.
Если вы рассматриваете только подмножество возможных гипотез (накладывая некоторые ограничения на их представление), то это число будет меньше, но анализ фактического числа потребует углубления в детали того, насколько "выразительными" являются ваши ограниченные гипотезы.