Случайный лес как лучший подход к этой проблеме?
Я изучаю ML и хочу попрактиковаться в построении модели для прогнозирования доходности фондового рынка на следующий день, например, на основе цены и объема предыдущих дней.
Текущие значения у меня на каждый день:
M = [[Price at day-1, price at day 0, return at day+1]
[Volume at day-1, volume at day 0, return at day+1]]
Я хотел бы найти правила, которые определяют диапазоны цены в день 1 и цены в день 0, чтобы предсказать цену в день +1 следующим образом:
If price is below 500 for day-1 AND price is above 200 at day 0
The average return at day+1 is 1.05 (5%)
или же
If price is below 500 for day-1 AND price is above 200 at day 0
AND If volume is above 200 for day-1 AND volume is below 800 at day 0
The average return at day+1 is 1.09 (9%)
Я не ищу каких-либо решений, но просто для общей стратегии, как подойти к этой проблеме.
Является ли ML полезным здесь вообще, или лучше использовать цикл for, перебирающий все значения, чтобы найти правила? Я рассматриваю случайный лес, это было бы жизнеспособным вариантом?
1 ответ
Да. Случайные леса могут быть использованы для регрессии.
Они будут иметь тенденцию прогнозировать среднее значение из-за агрегации лесов. Обычные деревья решений могут быть немного более "решающими".