Пользовательские индикаторы ошибок Seaborn factor plot
Я хотел бы построить множитель в seaborn, но вручную предоставить столбцы ошибок вместо того, чтобы seaborn вычислял их.
У меня есть пандас dataframe, который выглядит примерно так:
model output feature mean std
0 first two a 9.00 2.00
1 first one b 0.00 0.00
2 first one c 0.00 0.00
3 first two d 0.60 0.05
...
77 third four a 0.30 0.02
78 third four b 0.30 0.02
79 third four c 0.10 0.01
и я вывожу сюжет, который выглядит примерно так:
Я использую команды seaborn для генерации сюжета:
g = sns.factorplot(data=pltdf, x='feature', y='mean', kind='bar',
col='output', col_wrap=2, sharey=False, hue='model')
g.set_xticklabels(rotation=90)
Тем не менее, я не могу понять, как заставить seaborn использовать столбец 'std' в качестве строки ошибок. К сожалению, было бы довольно много времени пересчитать выходные данные для рассматриваемого кадра данных.
Это немного похоже на это q: Графики ошибок на графике с использованием фрейма данных Seaborn FacetGrid
За исключением того, что я не могу понять, как заставить его работать с функцией matplotlib.pyplot.bar.
Есть ли способ сделать это с помощью Seaborn factorplot
или же FacetGrid
в сочетании с матплотлибом?
Спасибо!
1 ответ
Вы могли бы сделать что-то вроде
import seaborn as sns
import matplotlib.pyplot as plt
from scipy.stats import sem
tips = sns.load_dataset("tips")
tip_sumstats = (tips.groupby(["day", "sex", "smoker"])
.total_bill
.agg(["mean", sem])
.reset_index())
def errplot(x, y, yerr, **kwargs):
ax = plt.gca()
data = kwargs.pop("data")
data.plot(x=x, y=y, yerr=yerr, kind="bar", ax=ax, **kwargs)
g = sns.FacetGrid(tip_sumstats, col="sex", row="smoker")
g.map_dataframe(errplot, "day", "mean", "sem")
Вот еще один подход:
import matplotlib.pyplot as plt
import numpy as np
plt.plot(np.asarray([[0, 0], [1, 1]]).T, np.asarray([[0.3, 0.4], [0.01 , 0.02]]).T)
plt.show()
Значения x соответствуют категориальным значениям гистограммы (0 - первая категория и так далее). Значения y показывают верхний и нижний пределы планок погрешностей. Оба массива должны быть транспонированы, чтобы matplotlib отображал их правильно. Я просто считаю, что это более читабельно.