Таблица - Сегментирование данных на 3 раздела
У меня есть данные о розничных продажах за несколько месяцев, и я собираюсь провести общий анализ любого потенциального подъема продаж.
Как я могу сгруппировать или сегментировать данные, чтобы легче было ограничить целевые диапазоны дат.
Например, если у меня есть данные за 3 месяца и я хочу группировать каждый месяц в своем собственном разделе, как мне это сделать?
Спасибо кафе
2 ответа
Вы можете использовать любое измерение даты / даты и времени двумя способами:
- Усеченная дата (синяя)
- Партия (зеленая)
подробнее о том, как его настроить, вы найдете здесь. Если вы будете использовать часть даты на уровне месяца, все данные будут разбиты на группы, состоящие только из записей этого конкретного месяца. Это позволяет вам добавить другие измерения ниже месяца, чтобы углубиться в анализ.
Если вы хотите создать довольно нестандартные диапазоны дат (например, с 03.09 по 23.09), вы можете использовать наборы. Просто перейдите к следующему дню, выберите интересующий вас диапазон и создайте новый набор. Если вы хотите сравнить несколько разных наборов, используйте вычисляемое поле, чтобы создать единое измерение, которое будет группировать данные на основе информации, к которой принадлежит один набор данных.
IF [Set 1] THEN 'Name of first set'
ELSEIF [Set 2] THEN 'Name of second set'
ELSE 'Other'
END
Я предлагаю создать вычисляемое поле, которое сделает эту группировку за вас. Я привел пример с использованием произвольного набора данных, содержащего даты, чтобы имитировать сценарий, который ОП упомянул в комментариях.
+-----------+-------------+-------+
| Date | Hour of Day | Count |
+-----------+-------------+-------+
| 9/20/2016 | 6 | 100 |
| 9/21/2016 | 7 | 23 |
| 9/22/2016 | 15 | 58 |
| 9/23/2016 | 13 | 78 |
| 9/24/2016 | 3 | 32 |
| 9/25/2016 | 12 | 54 |
| 9/26/2016 | 0 | 32 |
| 9/27/2016 | 23 | 11 |
| 9/28/2016 | 11 | 10 |
+-----------+-------------+-------+
Я загружаю этот набор данных в таблицу. Я создаю вычисляемое поле под названием "Группировка дат" по следующей формуле. [Дата] в этой формуле - это дата из моего набора данных. Вы можете отключить это с любым названием вашего поля даты.
IF DATEDIFF('day', DATEPARSE("MM-dd-yyyy",'09-22-2016'), [Date]) < 1 THEN 'Before 9/22'
ELSE (IF DATEDIFF('day', DATEPARSE("MM-dd-yyyy",'09-25-2016'), [Date]) < 1 THEN '9/22 - 9/25'
ELSE 'After 9/25'
END)
END
Это создает новый столбец, как показано ниже (я скопировал это из источника данных в таблице)
+-----------+---------------+-------+-------------+-------------------+
| Date | Date Grouping | Count | Hour of Day | Number of Records |
+-----------+---------------+-------+-------------+-------------------+
| 9/20/2016 | Before 9/22 | 100 | 6 | 1 |
| 9/21/2016 | Before 9/22 | 23 | 7 | 1 |
| 9/22/2016 | Before 9/22 | 58 | 15 | 1 |
| 9/23/2016 | 9/22 - 9/25 | 78 | 13 | 1 |
| 9/24/2016 | 9/22 - 9/25 | 32 | 3 | 1 |
| 9/25/2016 | 9/22 - 9/25 | 54 | 12 | 1 |
| 9/26/2016 | After 9/25 | 32 | 0 | 1 |
| 9/27/2016 | After 9/25 | 11 | 23 | 1 |
| 9/28/2016 | After 9/25 | 10 | 11 | 1 |
+-----------+---------------+-------+-------------+-------------------+
Это вычисленное поле теперь можно добавить к цвету / размеру, чтобы создать группировку на диаграмме, как показано ниже.
Плотная связь на полигоне
Поскольку вы упомянули свои диапазоны в комментариях, я отредактировал вычисленный запрос поля, чтобы создать жесткую границу вместо открытой. [Дата] в этой формуле - это дата из моего набора данных. Вы можете отключить это с любым названием вашего поля даты.
IF (DATEDIFF('day', DATEPARSE("MM-dd-yyyy",'05-08-2016'), [Date]) > 0 AND DATEDIFF('day', DATEPARSE("MM-dd-yyyy",'06-13-2016'), [Date]) < 0) THEN '5/9 - 6/12'
ELSE (IF (DATEDIFF('day', DATEPARSE("MM-dd-yyyy",'06-12-2016'), [Date]) > 0 AND DATEDIFF('day', DATEPARSE("MM-dd-yyyy",'07-18-2016'), [Date]) < 0) THEN '6/13 - 7/17'
ELSE (IF (DATEDIFF('day', DATEPARSE("MM-dd-yyyy",'07-17-2016'), [Date]) > 0 AND DATEDIFF('day', DATEPARSE("MM-dd-yyyy",'08-22-2016'), [Date]) < 0) THEN '7/18 - 8/21'
ELSE 'Out of Range' END) END) END
Таблица ввода (даты были изменены в соответствии с указанным диапазоном дат)
+-----------+-------------+-------+
| Date | Hour of Day | Count |
+-----------+-------------+-------+
| 5/9/2016 | 6 | 100 |
| 5/10/2016 | 7 | 23 |
| 5/11/2016 | 15 | 58 |
| 6/12/2016 | 13 | 78 |
| 6/13/2016 | 3 | 32 |
| 6/14/2016 | 12 | 54 |
| 7/17/2016 | 0 | 32 |
| 7/18/2016 | 23 | 11 |
| 7/19/2016 | 11 | 10 |
| 8/21/2016 | 23 | 11 |
| 4/9/2016 | 15 | 58 |
| 8/22/2016 | 13 | 78 |
+-----------+-------------+-------+
После добавления рассчитанного поля "Диапазон"