python pandas csv_read помещает всю строку в первую ячейку строки
Я играю со знаменитыми титаническими данными. У меня есть данные csv с разделением запятой. И данные выглядят так:
passengerId,survived,pclass,name,sex,age,sibSp,parch,ticket,fare,cabin,embarked
1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S
2,1,1,"Cumings, Mrs. John Bradley (Florence Briggs Thayer)",female,38,1,0,PC 17599,71.2833,C85,C
Я пытаюсь использовать pandas.csv_read
но это не работает.
Мой код:
import pandas as pd
titanic = pd.read_csv('titanic.csv')
print(titanic.head(10))
Я попробовал пару комбинаций с аргументами метода csv_read: sep = ',', decimal = ',', delimiter = ','
и все же я получил тот же результат:
passengerId survived ... cabin embarked
0 1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/... NaN ... NaN NaN
1 2,1,1,"Cumings, Mrs. John Bradley (Florence Br... NaN ... NaN NaN
2 3,1,3,"Heikkinen, Miss. Laina",female,26,0,0,S... NaN ... NaN NaN
Я попытался найти в других вопросах stackru, но не смог найти ответа. Спасибо за помощь.
1 ответ
Похоже, проблема в том, что в столбцах есть запятые.
Параметр quotechar может вам помочь, поскольку он скажет пандам игнорировать запятые между указанным символом (")
titanic = pd.read_csv('titanic.csv', quotechar='"', sep=",")