онлайн-обучение кодировщику меток и классификатору случайного леса
У меня есть очень большой набор данных, который нужно использовать для классификации, я выбрал данные, но это не гарантирует, что у меня будут целые метки в моем выводе. Как я могу выбрать свои данные, чтобы покрыть все ярлыки? Кроме того, я хотел сохранить те и те, которые я использовал в этом процессе, чтобы использовать их для постепенного обучения. Я искал об использовании я узнал, что
set_warm
функция используется только для добавления дополнительных оценок без обновления весов. а также
partial_fit
не поддерживает использование случайного леса. Итак, мой второй вопрос: как обновить
label encoder
и
RandomForestClassifier
для обучения других наборов данных, которые могут иметь другие метки и больше точек данных?