Синтаксис SPSS или Python: сколько существует различных значений y для каждого значения x?
У меня есть две переменные, для которых нет дубликатов между ними, или для х. у есть дубликаты, так как у него есть только 4 варианта:
- Анонимный идентификатор провайдера (переменная x)
- Тип провайдера (переменная y) ... только 4 варианта (семейный доктор, ревматолог, хирург, терапевт)
Я хочу узнать, сколько раз один уникальный идентификатор поставщика (x) связан с другим типом поставщика (y).
Например, ID 101 поставщика, в одной записи перечислил семейного врача, а в другой - ревматолога.
Перечислите значения y, которые связаны с каждым значением x
Синтаксис SPSS, через GUI или даже в Python высоко ценится.
Дайте мне знать, если любая другая информация поможет.
1 ответ
Один из способов сделать то, что я думаю, вы спрашиваете, это использовать CASESTOVARS
чтобы сгладить файл данных таким образом, чтобы каждая строка представляла собой уникальный идентификатор, а затем различные типы поставщиков находились в отдельных переменных (широкоформатный формат).
Вот быстрый пример.
DATA LIST FREE / ID Provider (2F1.0).
BEGIN DATA
1 1
1 2
1 3
2 1
3 2
3 3
END DATA.
DATASET NAME Sim.
SORT CASES BY ID Provider.
CASESTOVARS /ID = ID /VIND ROOT=Prov_ /COUNT NProviders /INDEX = Provider.
Если вы делаете LIST ALL.
тогда результаты для этого примера:
ID NProviders Prov_1 Prov_2 Prov_3
1 3 1 1 1
2 1 1 0 0
3 2 0 1 1
NProviders
Переменная перечисляет, сколько отдельных провайдеров имеет каждый отдельный идентификатор, и фиктивные переменные Prov_1
в Prov_3
перечислите конкретные типы.