Синтаксис SPSS или Python: сколько существует различных значений y для каждого значения x?

У меня есть две переменные, для которых нет дубликатов между ними, или для х. у есть дубликаты, так как у него есть только 4 варианта:

  1. Анонимный идентификатор провайдера (переменная x)
  2. Тип провайдера (переменная y) ... только 4 варианта (семейный доктор, ревматолог, хирург, терапевт)

Я хочу узнать, сколько раз один уникальный идентификатор поставщика (x) связан с другим типом поставщика (y).

Например, ID 101 поставщика, в одной записи перечислил семейного врача, а в другой - ревматолога.

Перечислите значения y, которые связаны с каждым значением x

Синтаксис SPSS, через GUI или даже в Python высоко ценится.

Дайте мне знать, если любая другая информация поможет.

1 ответ

Один из способов сделать то, что я думаю, вы спрашиваете, это использовать CASESTOVARS чтобы сгладить файл данных таким образом, чтобы каждая строка представляла собой уникальный идентификатор, а затем различные типы поставщиков находились в отдельных переменных (широкоформатный формат).

Вот быстрый пример.

DATA LIST FREE / ID Provider (2F1.0).
BEGIN DATA
1 1
1 2
1 3
2 1
3 2
3 3
END DATA.
DATASET NAME Sim.

SORT CASES BY ID Provider.
CASESTOVARS /ID = ID /VIND ROOT=Prov_ /COUNT NProviders /INDEX = Provider.

Если вы делаете LIST ALL. тогда результаты для этого примера:

ID NProviders Prov_1 Prov_2 Prov_3 

 1       3       1      1      1 
 2       1       1      0      0 
 3       2       0      1      1

NProviders Переменная перечисляет, сколько отдельных провайдеров имеет каждый отдельный идентификатор, и фиктивные переменные Prov_1 в Prov_3 перечислите конкретные типы.

Другие вопросы по тегам