Как вычесть строки между двумя разными фреймами данных и заменить исходное значение?
У меня есть два фрейма данных, показанные ниже. Как я могу заменить данные Bank1, вычитая 10 на 3 и 55 на 2?
import pandas as pd
data = [['Bank1', 10, 55], ['Bank2', 15,65], ['Bank3', 14,54]]
df1 = pd.DataFrame(data, columns = ['BankName', 'Value1','Value2'])
df2 = pd.DataFrame([[3, 2]], columns = ['Value1','Value2'])
Желаемый результат (заменять только значения в Bank1):
2 ответа
Решение
Первое решение - создать в
df22
к
Bankname
для выравнивания по
df1
для правильного вычитания строки:
df.set_index('BankName').sub(df2.set_index([['Bank1']]), fill_value=0)
df.set_index('BankName').sub(df2.set_index([['Bank2']]), fill_value=0)
Вам нужно создать новый столбец для
df2
с, преобразовать в
index
в обоих
DataFrame
s, поэтому можно вычесть по этой строке:
df22 = df2.assign(BankName = 'Bank1').set_index('BankName')
df = df1.set_index('BankName').sub(df22, fill_value=0).reset_index()
print (df)
BankName Value1 Value2
0 Bank1 7.0 53.0
1 Bank2 15.0 65.0
2 Bank3 14.0 54.0
Вычесть на
Bank2
:
df22 = df2.assign(BankName = 'Bank2').set_index('BankName')
df = df1.set_index('BankName').sub(df22, fill_value=0).reset_index()
print (df)
BankName Value1 Value2
0 Bank1 10.0 55.0
1 Bank2 12.0 63.0
2 Bank3 14.0 54.0
Другое решение с фильтром по
BankName
:
m = df1['BankName']=='Bank1'
df1.loc[m, df2.columns] = df1.loc[m, df2.columns].sub(df2.iloc[0])
print (df1)
BankName Value1 Value2
0 Bank1 7 53
1 Bank2 15 65
2 Bank3 14 54
m = df1['BankName']=='Bank2'
df1.loc[m, df2.columns] = df1.loc[m, df2.columns].sub(df2.iloc[0])
попробуйте, используя sub
+ combine_first
df1.sub(df2).combine_first(df1)
BankName Value1 Value2
0 Bank1 7.0 53.0
1 Bank2 15.0 65.0
2 Bank3 14.0 54.0