Pyplot Stacked гистограмма - количество вхождений в столбце

Я пытаюсь представить данные, собранные из журналов брандмауэра, в гистограмме, чтобы у меня был один столбец для каждой даты в файле, а также количество вхождений в определенном столбце, сложенном в столбце.

Я рассмотрел несколько примеров здесь, но все они, кажется, основаны на том факте, что я буду знать, какие значения есть в конкретном столбце - и что я пытаюсь достичь здесь, это способ представления гистограммы без необходимости знать все возможные поля.

В примере я использовал протокол в качестве столбца:

#!/usr/bin/python

import pandas as pd
import numpy as np
import glob
import matplotlib.pyplot as plt

csvs = glob.glob("*log-export.csv")
dfs = [pd.read_csv(csv, sep="\xff", engine="python") for csv in csvs]

df_merged = pd.concat(dfs).fillna("")

data = df_merged[['date', 'proto']]
np_data = np.array(data)

plt.hist(np_data, stacked=True)
plt.show()

Но это показывает следующую диаграмму:

гистограмма

и я хотел бы сделать что-то вроде этого:

сложены

Есть предложения как этого добиться?

1 ответ

Решение

Настроить
Я должен был составить данные, потому что вы не предоставили никаких.

df = pd.DataFrame(dict(
    Date=pd.date_range(end=pd.to_datetime('now'), periods=100, freq='H'),
    Proto=np.random.choice('UDP TCP ICMP'.split(), 100, p=(.3, .5, .2))
))

Решение
использование pd.crosstab затем сюжет

pd.crosstab(df.Date.dt.date, df.Proto).plot.bar(stacked=True)

Другие вопросы по тегам