Как выбрать столбцы для загрузки в Kedro CSVLocalDataSet?

У меня есть csv файл, который выглядит как

a,b,c,d
1,2,3,4
5,6,7,8

и я хочу загрузить его как Кедро CSVLocalDataSet, но я не хочу читать весь файл. Мне нужно всего несколько столбцов (скажем,a а также b например).

Есть ли способ указать список столбцов для чтения / загрузки?

1 ответ

Решение

CSVLocalDataSet использует pandas.read_csv, который принимает параметр usecols. Его можно легко проксировать, используяload_args параметр набора данных (все наборы данных поддерживают передачу дополнительных параметров через load_args а также save_args):

my_cool_data:
  type: CSVLocalDataSet
  filepath: data/path.csv
  load_args: 
    usecols: ['a', 'b']

Также обратите внимание, что те же параметры будут работать для любого набора данных на основе панд.

Другие вопросы по тегам