Нужна ясность в копировании dask.dataframe
Может ли pandas.DataFrame.copy API быть точно имитирован в dask.DataFrame, используя следующий код?
from copy import copy
df2 = copy(df)
Это простая копия или глубокая копия? Как я могу сделать другой тип копии?
Или мне обязательно нужно сделать следующее?
df2 = dask.from_delayed(pandas.DataFrame.copy(df.to_delayed(),deep=True))
2-ой фрагмент кода полностью решит мою проблему, или есть некоторые предостережения?
1 ответ
Решение
Начиная с 2018-07-01, фреймы данных Dask не поддерживают изменяемые операции, поэтому копирование не требуется.