Параметры промышленного производства для моделей машинного обучения
Я начал свою магистерскую диссертацию для пищевой компании. Они начинают с нескольких ингредиентов, смешивают их, нагревают и так далее, пока, наконец, не получат конфеты. Но есть проблема. Для производства одной и той же конфеты машины, управляемые ПЛК, не всегда работают гладко и не дают одинакового результата. Они считают, что это фрукт как ингредиент, который не всегда на 100% одинаков (вязкость и т. Д.). Они измеряют характеристики ингредиентов, прежде чем они будут использованы для производства. Они также измеряют все параметры процесса (давление, температура, шкала Брикса и т. Д.). Все это хранится. Теперь моя задача - изучить эти данные с помощью моделей машинного обучения, чтобы получить больше информации. Теперь я сталкиваюсь с некоторыми проблемами. Первая проблема заключается в том, что у меня нет классификации. Нет такой вещи как "хорошая конфета" и "плохая конфета". Вторая проблема в том, что у меня действительно нет выходных параметров. У меня есть значение Brix, но это все. Последний вопрос: ингредиенты - это входные характеристики для моей модели, но особенности процесса - это тоже входные данные? Или я должен просто оставить это позади?
Огромное спасибо за помощь!
1 ответ
Первая проблема заключается в том, что у меня нет классификации. Нет такой вещи как "хорошая конфета" и "плохая конфета".
Как компания решает, что достаточно или нет? Вам нужно определить критерии, которые они используют для маркировки конфет как "плохих" или "хороших". Если у вас нет ярлыков, вам, возможно, придется искать неконтролируемые методы обучения, такие как кластерный анализ или факторный анализ.
Вторая проблема в том, что у меня действительно нет выходных параметров. У меня есть значение Brix, но это все.
В зависимости от вашей задачи вам придется подумать о том, каковы ваши целевые значения. Для классификации это будет этикетка конфеты. Следовательно, "плохая" или "хорошая" конфета. Для проблем регрессии вам понадобится что-то непрерывное (например, значение Брикса, если это соответствует вашей цели). Для обучения без учителя вам не нужна выходная переменная.
Последний вопрос: ингредиенты - это входные характеристики для моей модели, но особенности процесса - это тоже входные данные? Или я должен просто оставить это позади?
Вы должны посмотреть на все переменные, которые у вас есть, и решить, какие из них содержат ценную информацию, является ли конфетка "хорошей" или "плохой". Это конкретные знания предметной области, которые вам нужно собрать. Вы можете спросить людей в компании. Они должны быть в состоянии сказать вам, что важно или нет. Вы также можете посмотреть статистику по всем параметрам. Параметры, которые связаны с качеством конфеты должны быть определены. Параметрами, которые не сильно отличаются (например, температура всегда постоянна), можно пренебречь.