Сравнивая два источника данных панды и питона
У меня есть небольшой скрипт, который загружается в один и тот же CSV-файл дважды
Затем он перебирает одну и сравнивает ее со всеми записями другой. Так как они изначально читаются из одного и того же источника, я должен получить соотношение совпадений 100%. но я не
Есть идеи, почему это может быть?
import pandas as pd
_new = pd.read_csv('02 dump/reputation.csv', sep=';', float_precision='round_trip')
_data = pd.read_csv('00 data/reputation.csv', sep=';', float_precision='round_trip')
def confupdate():
print("MATCHED")
def confnew():
print("NOT MATCHED")
for a,b in zip(_new['LAT'].values, _new['LON'].values):
print(a, b)
if a in _data['LAT'].values and b in _data.columns.values:
confupdate()
if a not in _data['LAT'].values or b not in _data.columns.values:
confnew()
1 ответ
columns
Свойство DataFrame фактически представляет собой список столбцов. Вы проверяете, присутствует ли широта и долгота в столбцах, а не содержимое самого фрейма.