Случайный лес как лучший подход к этой проблеме?

Я изучаю ML и хочу попрактиковаться в построении модели для прогнозирования доходности фондового рынка на следующий день, например, на основе цены и объема предыдущих дней.

Текущие значения у меня на каждый день:

M = [[Price at day-1, price at day 0, return at day+1]
     [Volume at day-1, volume at day 0, return at day+1]]

Я хотел бы найти правила, которые определяют диапазоны цены в день 1 и цены в день 0, чтобы предсказать цену в день +1 следующим образом:

If price is below 500 for day-1 AND price is above 200 at day 0
The average return at day+1 is 1.05 (5%)

или же

If price is below 500 for day-1 AND price is above 200 at day 0
AND If volume is above 200 for day-1 AND volume is below 800 at day 0
The average return at day+1 is 1.09 (9%)

Я не ищу каких-либо решений, но просто для общей стратегии, как подойти к этой проблеме.

Является ли ML полезным здесь вообще, или лучше использовать цикл for, перебирающий все значения, чтобы найти правила? Я рассматриваю случайный лес, это было бы жизнеспособным вариантом?

1 ответ

Да. Случайные леса могут быть использованы для регрессии.

Они будут иметь тенденцию прогнозировать среднее значение из-за агрегации лесов. Обычные деревья решений могут быть немного более "решающими".

Другие вопросы по тегам