Оптимизация работы с панелями данных с помощью qcut
Я пытаюсь преобразовать столбцы данных в сгруппированные данные. Это использует панды qcut:
# Get first column to quartile
firstCol = df.columns.get_loc(411.447817504) # Get column num of first wavelength
# We need the list of column titles.
cols = df.columns
# We loop through our 1100 columns to apply quartiling
for colLoc in range(0,1100):
# Print what column is being processed
print(f'Column {colLoc}')
column_name = cols[firstCol+colLoc]
# Generate and apply quartiling
df[column_name] = pd.qcut(df[column_name].astype('float'), 4, ['q1','q2','q3','q4'])
Есть ли способ ускорить этот процесс? Возможно, используя массивы np и копируя их в df одновременно?