Как создать фрейм данных dask из строки данных, разделенной символами табуляции и новой строки

Question

Мои данные представлены в виде строки, разделенной символом \ (для столбцов) и символом новой строки \n для строк.

ID\Product\quantity\n1\xx\2

Похоже, Dask.array.from_array() поддерживает только массив в качестве входных данных.

Хотя я могу преобразовать приведенный выше текст в np.array, используя

np.array([i.split("\t") for i in data[1].split("\n")])

Интересно, есть ли что-то эквивалентное, чтобы напрямую преобразовать строку в массив dask или массив данных?

python dask dask-distributed dask-delayed dask-ml

Источник

user10947912 22 янв '19 в 03:25

1 ответ

Другие вопросы по тегам python dask dask-distributed dask-delayed dask-ml

user616616 20 фев '19 в 01:26 2019-02-20 01:26 · Answer 1 · 2019-02-20 01:26

Вы можете хотеть функцию dask.dataframe.read_csv

import dask.dataframe as dd
df = dd.read_csv('filename.*.csv', sep='\t')

Источник

user616616 20 фев '19 в 01:26