Классификатор ID3 для классификации набора данных рукописных цифр MNIST
Я реализую алгоритм ID3 (дерево решений) для нескольких меток, чтобы классифицировать набор данных рукописных цифр MNIST, который содержит 28*28 пикселей со значениями 0-255, где 0 представляет фон, а 255 представляет передний план.
Я пытаюсь найти набор атрибутов, которые позволят мне получить низкий уровень ошибок. В настоящее время я использую порог 0 для каждого пикселя, и я получаю 11% ошибок.
Я хотел бы, чтобы предложения или идеи улучшали частоту появления ошибок, устанавливая новый набор атрибутов (я думал об обнаружении кривых и линий на изображении, однако я не могу найти способ сделать это в JAVA).
Благодарю.
0 ответов
Мы обнаружили, что разделение изображения на кадры (от 4 до 8) помогло улучшить прогнозируемый%. Кроме того, мы добавили такие функции, как линии, кривые и тому подобное.