Python: производительность для манипуляции с данными в Pandas относительно datetime.strptime
Что касается производительности Python:
Для следующего кода:
for index, row in df.iterrows():
old_date = row['olddate']
df.loc[index, 'date'] = datetime.strptime(old_date, "%d/%m/%Y").strftime("%Y%m%d")
Я могу получить производительность во время выполнения с помощью лямбда-выражений (примерно в 10 раз):
df['date'] = df.apply(lambda x: datetime.strptime(x['olddate'], "%d/%m/%Y").strftime("%Y%m%d"), axis=1)
Согласно https://github.com/sversh/pycon2017-optimizing-pandas я могу ожидать дальнейшей оптимизации, если использую map
функция: map(function, arguments)
Как можно было бы применить strptime
к map
функционировать?