Как создать фрейм данных dask из строки данных, разделенной символами табуляции и новой строки
Мои данные представлены в виде строки, разделенной символом \ (для столбцов) и символом новой строки \n для строк.
ID\Product\quantity\n1\xx\2
Похоже, Dask.array.from_array() поддерживает только массив в качестве входных данных.
Хотя я могу преобразовать приведенный выше текст в np.array, используя
np.array([i.split("\t") for i in data[1].split("\n")])
Интересно, есть ли что-то эквивалентное, чтобы напрямую преобразовать строку в массив dask или массив данных?
1 ответ
Вы можете хотеть функцию dask.dataframe.read_csv
import dask.dataframe as dd
df = dd.read_csv('filename.*.csv', sep='\t')