Python: производительность для манипуляции с данными в Pandas относительно datetime.strptime

Что касается производительности Python:

Для следующего кода:

for index, row in df.iterrows():
    old_date = row['olddate']
    df.loc[index, 'date'] = datetime.strptime(old_date, "%d/%m/%Y").strftime("%Y%m%d")

Я могу получить производительность во время выполнения с помощью лямбда-выражений (примерно в 10 раз):

df['date'] = df.apply(lambda x: datetime.strptime(x['olddate'], "%d/%m/%Y").strftime("%Y%m%d"), axis=1)

Согласно https://github.com/sversh/pycon2017-optimizing-pandas я могу ожидать дальнейшей оптимизации, если использую map функция: map(function, arguments)

Как можно было бы применить strptime к map функционировать?

0 ответов

Другие вопросы по тегам