Как удалить столбцы с NA, используя CUDF?
Панды:
data = data.dropna(axis = 'columns')
Я пытаюсь сделать что-то подобное, используя фрейм данных cudf, но API не предлагают эту функцию.
Мое решение - преобразовать в pandas df, выполнить указанную выше команду, а затем повторно преобразовать в cudf. Есть ли лучшее решение?
0 ответов
Cu DF теперь поддерживает столбцы dropna
, поэтому будет работать следующее:
import cudf
df = cudf.DataFrame({'a':[0,1,None], 'b':[None,0,2], 'c':[1,2,3]})
print(df)
a b c
0 0 null 1
1 1 0 2
2 null 2 3
df.dropna(axis='columns')
c
0 1
1 2
2 3
Until dropna
is implemented, you can check the null_count
of each column and drop the ones with null_count>0
.