Общее количество гипотез в пространстве версий

У меня есть сомнения в машинном обучении..

Каков размер пространства версий перед просмотром любых обучающих примеров. Предположим, у меня есть 10 атрибутов, и я использую соединение ограничений в качестве представления. Атрибуты имеют два значения, каждое из которых "да" или "нет".

1 ответ

Если у вас есть K классов, то пространство версий - это просто число возможных разбиений всех возможных значений атрибута на K непересекающихся подмножеств.

В твоем случае:

  • 10 атрибутов
  • 2 возможных значения на атрибут
  • Есть 2^10=1024 возможных баллов
  • Есть K^1024 возможных гипотез (вы можете думать о них, как о маркировке каждой точки одним из значений K).

Например, для двоичного случая K=2 у нас есть 2^1024 гипотез в пространстве версий.

Если вы рассматриваете только подмножество возможных гипотез (накладывая некоторые ограничения на их представление), то это число будет меньше, но анализ фактического числа потребует углубления в детали того, насколько "выразительными" являются ваши ограниченные гипотезы.

Другие вопросы по тегам