Пользовательские индикаторы ошибок Seaborn factor plot

Я хотел бы построить множитель в seaborn, но вручную предоставить столбцы ошибок вместо того, чтобы seaborn вычислял их.

У меня есть пандас dataframe, который выглядит примерно так:

     model output feature  mean   std
0    first    two       a  9.00  2.00
1    first    one       b  0.00  0.00
2    first    one       c  0.00  0.00
3    first    two       d  0.60  0.05
...
77   third   four       a  0.30  0.02
78   third   four       b  0.30  0.02
79   third   four       c  0.10  0.01

и я вывожу сюжет, который выглядит примерно так:морские бары

Я использую команды seaborn для генерации сюжета:

g = sns.factorplot(data=pltdf, x='feature', y='mean', kind='bar',
                   col='output', col_wrap=2, sharey=False, hue='model')
g.set_xticklabels(rotation=90)

Тем не менее, я не могу понять, как заставить seaborn использовать столбец 'std' в качестве строки ошибок. К сожалению, было бы довольно много времени пересчитать выходные данные для рассматриваемого кадра данных.

Это немного похоже на это q: Графики ошибок на графике с использованием фрейма данных Seaborn FacetGrid

За исключением того, что я не могу понять, как заставить его работать с функцией matplotlib.pyplot.bar.

Есть ли способ сделать это с помощью Seaborn factorplot или же FacetGrid в сочетании с матплотлибом?

Спасибо!

1 ответ

Решение

Вы могли бы сделать что-то вроде

import seaborn as sns
import matplotlib.pyplot as plt
from scipy.stats import sem
tips = sns.load_dataset("tips")

tip_sumstats = (tips.groupby(["day", "sex", "smoker"])
                     .total_bill
                     .agg(["mean", sem])
                     .reset_index())

def errplot(x, y, yerr, **kwargs):
    ax = plt.gca()
    data = kwargs.pop("data")
    data.plot(x=x, y=y, yerr=yerr, kind="bar", ax=ax, **kwargs)

g = sns.FacetGrid(tip_sumstats, col="sex", row="smoker")
g.map_dataframe(errplot, "day", "mean", "sem")

введите описание изображения здесь

Вот еще один подход:

import matplotlib.pyplot as plt
import numpy as np

plt.plot(np.asarray([[0, 0], [1, 1]]).T, np.asarray([[0.3, 0.4], [0.01 , 0.02]]).T)
plt.show()

Значения x соответствуют категориальным значениям гистограммы (0 - первая категория и так далее). Значения y показывают верхний и нижний пределы планок погрешностей. Оба массива должны быть транспонированы, чтобы matplotlib отображал их правильно. Я просто считаю, что это более читабельно.

Другие вопросы по тегам