Как получить поэлементное пересечение из двух серий в питон-пандах
У меня вопрос к питонам пандам. У меня есть две Серии, и у каждой Серии есть элементы строки следующим образом: Для упрощения я объединил две Серии в DataFrame.
import pandas as pd
import numpy as np
my_df = pd.DataFrame([['ab', 'bz', 'b'], ['cd', 'ct', 'c'], ['ef', 'ka', np.nan]], columns=['sr_1', 'sr_2', 'intersection'])
Есть идеи для этого?
1 ответ
Решение
Вот что вы можете сделать:
import pandas as pd
import numpy as np
df1 = pd.DataFrame({'sr1' : ['ab','cd','ef'] ,
'sr2' : ['bz','ct','ka',]})
df1['intersection'] = df1.apply(lambda x: set(x.sr1) & set(x.sr2), axis=1)
df1['intersection'] = df1.intersection.apply(lambda x: list(x)[0] if len(x)>0 else np.nan)
Выход: