Python3 панд лок, не найден. (KeyError)
Есть дф,
Remarks Unnamed: 13 Unnamed: 14 Unnamed: 15
0 ttttttt 3 3.333 =10000/(10000-(h2+i2)*100)
1 ttttttt 3 3.300
2 ttttttt 3 3.333
и карги
kwargs = {'Unnamed: 13': '3',
'Unnamed: 15': ''}
с этим проблем нет
print(df[(df["Unnamed: 13"] == "3") & (df["Unnamed: 15"] == "")])
и результат
Remarks Unnamed: 13 Unnamed: 14 Unnamed: 15 _id \
1 ttttttt 3 3.300 5ae21c969268ff4118df7f8b
2 ttttttt 3 3.333 5ae21c969268ff4118df7f8c
Я сделал это выражение.
find_key_and_val =str(' & '.join(["(df["+"\""+key+"\"" + "] == " + "\"" + val + "\")" for key, val in kwargs.items()]))
печать (find_key_and_val)
(df["Unnamed: 13"] == "3") & (df["Unnamed: 15"] == "")
Затем я применил это.
print(df[find_key_and_val])
Это приведет к следующей ошибке:
Traceback (most recent call last):
File "C:\Users\tlsdy\AppData\Local\Programs\Python\Python36\lib\site-packages\pandas\core\indexes\base.py", line 2525, in get_loc
return self._engine.get_loc(key)
File "pandas\_libs\index.pyx", line 117, in pandas._libs.index.IndexEngine.get_loc
File "pandas\_libs\index.pyx", line 139, in pandas._libs.index.IndexEngine.get_loc
File "pandas\_libs\hashtable_class_helper.pxi", line 1265, in pandas._libs.hashtable.PyObjectHashTable.get_item
File "pandas\_libs\hashtable_class_helper.pxi", line 1273, in pandas._libs.hashtable.PyObjectHashTable.get_item
KeyError: '(df["Unnamed: 13"] == "3") & (df["Unnamed: 15"] == "")'
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "D:/python_project_ab/amazon/property.py", line 201, in <module>
print(df[find_key_and_val])
File "C:\Users\tlsdy\AppData\Local\Programs\Python\Python36\lib\site-packages\pandas\core\frame.py", line 2139, in __getitem__
return self._getitem_column(key)
File "C:\Users\tlsdy\AppData\Local\Programs\Python\Python36\lib\site-packages\pandas\core\frame.py", line 2146, in _getitem_column
return self._get_item_cache(key)
File "C:\Users\tlsdy\AppData\Local\Programs\Python\Python36\lib\site-packages\pandas\core\generic.py", line 1842, in _get_item_cache
values = self._data.get(item)
File "C:\Users\tlsdy\AppData\Local\Programs\Python\Python36\lib\site-packages\pandas\core\internals.py", line 3843, in get
loc = self.items.get_loc(item)
File "C:\Users\tlsdy\AppData\Local\Programs\Python\Python36\lib\site-packages\pandas\core\indexes\base.py", line 2527, in get_loc
return self._engine.get_loc(self._maybe_cast_indexer(key))
File "pandas\_libs\index.pyx", line 117, in pandas._libs.index.IndexEngine.get_loc
File "pandas\_libs\index.pyx", line 139, in pandas._libs.index.IndexEngine.get_loc
File "pandas\_libs\hashtable_class_helper.pxi", line 1265, in pandas._libs.hashtable.PyObjectHashTable.get_item
File "pandas\_libs\hashtable_class_helper.pxi", line 1273, in pandas._libs.hashtable.PyObjectHashTable.get_item
KeyError: '(df["Unnamed: 13"] == "3") & (df["Unnamed: 15"] == "")'
KeyError: '(df ["Безымянный: 13"] == "3") & (df["Безымянный: 15"] == "")'
Что я должен делать?
большое спасибо
1 ответ
Вы пытаетесь заставить Pandas выполнить сложную операцию, включающую в себя серию срезов данных, но на самом деле это просто строка символов.
Это выражение представляет собой серию операций срезов на фрейме данных:
print(df[(df["Unnamed: 13"] == "3") & (df["Unnamed: 15"] == "")])
Пока это выражение представляет собой набор символов:
str(' & '.join(["(df["+"\""+key+"\"" + "] == " + "\"" + val + "\")" for key, val in kwargs.items()]))
Ваш фрейм данных буквально ищет ключ с меткой "(df[" Безымянный: 13"] == "3") & (df[" Безымянный: 15"] == "")", который не существует, Компилятор не собирается сталкиваться с этой промежуточной программой и думать: "О, он имеет в виду код, который он хочет выполнить". Это просто будет восприниматься как строка, как и любая другая.
Если вы хотите выполнить строку как команду, вы можете использовать метод eval(). Например:
import pandas as pd
data = [
['ttttttt', 3, 3.333, 10.0],
['ttttttt', 3, 3.300, ""],
['ttttttt', 3, 3.333, ""],
]
df = pd.DataFrame(data, columns=['Remarks', 'Unnamed: 13', 'Unnamed: 14', 'Unnamed: 15'])
string_query = """df[(df['Unnamed: 13'] == 3) & (df["Unnamed: 15"] == "")]"""
print(eval(string_query))
выход:
Remarks Unnamed: 13 Unnamed: 14 Unnamed: 15
1 ttttttt 3 3.300
2 ttttttt 3 3.333