Классификатор ID3 для классификации набора данных рукописных цифр MNIST

Я реализую алгоритм ID3 (дерево решений) для нескольких меток, чтобы классифицировать набор данных рукописных цифр MNIST, который содержит 28*28 пикселей со значениями 0-255, где 0 представляет фон, а 255 представляет передний план.

Я пытаюсь найти набор атрибутов, которые позволят мне получить низкий уровень ошибок. В настоящее время я использую порог 0 для каждого пикселя, и я получаю 11% ошибок.

Я хотел бы, чтобы предложения или идеи улучшали частоту появления ошибок, устанавливая новый набор атрибутов (я думал об обнаружении кривых и линий на изображении, однако я не могу найти способ сделать это в JAVA).

Благодарю.

0 ответов

Мы обнаружили, что разделение изображения на кадры (от 4 до 8) помогло улучшить прогнозируемый%. Кроме того, мы добавили такие функции, как линии, кривые и тому подобное.

Другие вопросы по тегам