Как выбрать столбцы данных в DataFrame

Я получаю результаты опроса из Lime Survey через его API (Remote Control):

И мне удается поместить его в DataFrame. Но это только 1 столбец на строку:

Данные выглядят так.

То, что я хочу сделать, это получить средние данные по вопросам и категориям. Из приведенного ниже примера: q10[wor1], q10[wor2], .,., Q10 [WOR7] дать 7 вопросов, которые являются частью категории Q10.

Как сначала выбрать все данные для wor1, wor2, ..., wor7, отдельно, чтобы я мог делать статистику по каждому из этих отдельных вопросов.

Тогда как мне выбрать все данные для q10*, чтобы я мог делать статистику для всей группы?

Даже не пытаясь отделить категорию от вопроса, я не смог выбрать только все данные "q10 [wor1]".

1 ответ

Решение

Проверьте jq - https://stedolan.github.io/jq/

Вы можете передать свой df ['response'] json в jq, извлечь необходимое поле и создать его в виде отдельного столбца df.

И тогда вы можете получить среднее значение столбцов из DF.

Другие вопросы по тегам