Как удалить столбцы с NA, используя CUDF?

Панды:

data = data.dropna(axis = 'columns')

Я пытаюсь сделать что-то подобное, используя фрейм данных cudf, но API не предлагают эту функцию.

Мое решение - преобразовать в pandas df, выполнить указанную выше команду, а затем повторно преобразовать в cudf. Есть ли лучшее решение?

0 ответов

Cu DF теперь поддерживает столбцы dropna, поэтому будет работать следующее:

import cudf
​
df = cudf.DataFrame({'a':[0,1,None], 'b':[None,0,2], 'c':[1,2,3]})
print(df)
      a     b  c
0     0  null  1
1     1     0  2
2  null     2  3
df.dropna(axis='columns')
    c
0   1
1   2
2   3

Until dropna is implemented, you can check the null_count of each column and drop the ones with null_count>0.

Другие вопросы по тегам