В классификации почему граница Решения является свойством гипотезы, а не обучающей совокупности?

Я начал смотреть ML-ролики Эндрю Нг на Coursera. В уроке по классификации (в третьем видео) он сказал следующие строки

"Еще раз, граница решения - это свойство не обучающего набора, а гипотезы и параметров.

Но как только у вас есть параметры тета, это то, что определяет границы решения."

Мои вопросы:

  1. В чем разница между тренировочным набором и гипотезой?

  2. Почему граница принятия решения является свойством гипотезы, а не обучающей совокупности?

1 ответ

Решение

Вы можете думать об этом так:

Для любого заданного набора параметров существует уникальная граница принятия решения. Следовательно, параметры однозначно определяют границу решения.

С другой стороны, учитывая данные обучения, нет единой границы принятия решения. Вы можете выбрать в основном бесконечное множество различных границ решений, которые соответствуют любому набору данных. Следовательно, данные не могут однозначно определять границу решения, и, следовательно, граница не может быть свойством данных.

С другой стороны, как он отмечает, вы можете использовать тренировочные данные для выбора параметров, что затем дает вам границу. Но есть много способов сделать это.

Другие вопросы по тегам