Опишите функцию в модуле Python Pandas
Я пытаюсь создать сводную статистику по доходности акций Apple и Alphabet. У меня уже есть файл Excel со всей информацией и (маленьким) кодом ниже:
import pandas as pd
Data = pd.read_excel('Exercise1_DataPython.xlsx')
example_series = Data.describe()
print (example_series)
Однако, когда я запускаю это, он возвращает "count, unique, top и freq" вместо "mean, min, max и т. Д.". Может кто-нибудь объяснить мне, как решить эту проблему? И как я могу получить среднее, минимальное, максимальное и т. Д. Только для одного конкретного столбца?
Спасибо!
1 ответ
Использовать include
параметр:
df = pd.DataFrame({ 'object': ['a', 'b', 'c'],
'numeric': [1, 2, 3],
'categorical': pd.Categorical(['d','e','f'])
})
df.describe(include='all')
Выход:
categorical numeric object
count 3 3.0 3
unique 3 NaN 3
top f NaN c
freq 1 NaN 1
mean NaN 2.0 NaN
std NaN 1.0 NaN
min NaN 1.0 NaN
25% NaN 1.5 NaN
50% NaN 2.0 NaN
75% NaN 2.5 NaN
max NaN 3.0 NaN