Используйте уже проделанные вычисления с умом

Если у меня есть dask dataframe df. Теперь я применяю некоторые вычисления на нем.

Математически,

df1 = f1 (df)

df2 = f2 (df1)

df3 = f3 (df1)

Теперь, если я бегу, df2.compute()теперь, после этого, если я бегу df1.compute(), Как я могу остановить dask от пересчета результата df1?

Принимая другой случай, если я бегу df3.compute(), затем df2.compute(), Как я могу сказать dask использовать уже вычисленное значение df1 (который вычисляется в df3.compute()) в беге df2.compute()?

1 ответ

Ты можешь использовать dask.persist создать dask-фрейм данных с вычисленным подграфом или вычислением.

Если вы используете локальный планировщик, вы должны взглянуть на dask.cache.Cache

from dask.cache import Cache
cache = Cache(4e9).register()
Другие вопросы по тегам