Читать метки значений Stata из отдельного файла в R
У меня есть набор данных Stata (файл.dta), который содержит одну переменную, RGA (это MWE, у меня на самом деле есть тонны переменных). Эта переменная принимает 3 факторных значения: 1, 2 и 3. Эти факторы относятся к значимым вещам (так называемые "метки значений"), и связь между факторами и их метками значений находится в отдельном.txt Stata-подобном файле, полностью воспроизведено здесь:
. label define RGA_l
1 "meaning of 1"
2 "meaning of 2"
3 "meaning of 3"
. label values RGA RGA_l
Я загружаю мой файл.dta в R через haven
пакет. Я хотел бы иметь легкий доступ к меткам значений RGA в R, в частности, чтобы иметь возможность быстро сопоставлять значения RGA с их метками значений для получения удобочитаемого результата. Как я могу прочитать этот отдельный файл.txt в R таким образом, чтобы я мог сопоставить его с моим набором данных?
1 ответ
Я не знаю точно, какой тип столбца haven
импортировано (попробуйте использовать str()
на вашем датафрейме) но вот как вы создаете факторы в R. factor
Функция несколько сбивает с толку, потому что факторы на самом деле не имеют меток сами по себе, они имеют только уровни, но аргумент все еще называется labels
,
set.seed(100)
df <- data.frame(RGA_1 = sample.int(3, 10, replace = TRUE))
df$RGA_1 <- factor(df$RGA_1, labels = c("meaning1", "meaning2", "meaning3"))
df
#> RGA_1
#> 1 meaning1
#> 2 meaning1
#> 3 meaning2
#> 4 meaning1
#> 5 meaning2
#> 6 meaning2
#> 7 meaning3
#> 8 meaning2
#> 9 meaning2
#> 10 meaning1
Создано в 2018-05-30 пакетом представлением (v0.2.0).