KeyError: 'column_name'

Я пишу код Python, он должен прочитать значения столбцов, но я получаю сообщение об ошибке KeyError: column_name. Может кто-нибудь, пожалуйста, скажите мне, как решить эту проблему.

import numpy as np
from sklearn.cluster import KMeans
import pandas as pd


### For the purposes of this example, we store feature data from our
### dataframe `df`, in the `f1` and `f2` arrays. We combine this into
### a feature matrix `X` before entering it into the algorithm.

df = pd.read_csv(r'C:\Users\Desktop\data.csv')

print (df)

#df = pd.read_csv(csv_file)

"""
saved_column = df.Distance_Feature
saved_column = df.Speeding_Feature

print(saved_column)
"""

f1 = df['Distance_Feature'].tolist()
f2 = df['Speeding_Feature'].tolist()

print(f1)
print(f2)

X=np.matrix(zip(f1,f2))

print(X)

kmeans = KMeans(n_clusters=2).fit(X)

Кто-нибудь может мне помочь, пожалуйста.

1 ответ

Asumming 'C:\Users\Desktop\data.csv' содержит следующие данные

Distance_Feature Speeding_Feature
1   2
3   4
5   6
 ...

+ Изменить

df = pd.read_csv(r'C:\Users\Desktop\data.csv')

в

    df = pd.read_csv("data.txt",names=["Distance_Feature","Speeding_Feature"],sep= "\s+|\t+|\s+\t+|\t+\s+",header=1) 
    # Here it is assumed white space separator, if another separator is used change `sep`.
Другие вопросы по тегам