Читать метки значений Stata из отдельного файла в R

У меня есть набор данных Stata (файл.dta), который содержит одну переменную, RGA (это MWE, у меня на самом деле есть тонны переменных). Эта переменная принимает 3 факторных значения: 1, 2 и 3. Эти факторы относятся к значимым вещам (так называемые "метки значений"), и связь между факторами и их метками значений находится в отдельном.txt Stata-подобном файле, полностью воспроизведено здесь:

    . label define RGA_l
        1 "meaning of 1"
        2 "meaning of 2"
        3 "meaning of 3"

    . label values RGA RGA_l

Я загружаю мой файл.dta в R через haven пакет. Я хотел бы иметь легкий доступ к меткам значений RGA в R, в частности, чтобы иметь возможность быстро сопоставлять значения RGA с их метками значений для получения удобочитаемого результата. Как я могу прочитать этот отдельный файл.txt в R таким образом, чтобы я мог сопоставить его с моим набором данных?

1 ответ

Я не знаю точно, какой тип столбца haven импортировано (попробуйте использовать str() на вашем датафрейме) но вот как вы создаете факторы в R. factor Функция несколько сбивает с толку, потому что факторы на самом деле не имеют меток сами по себе, они имеют только уровни, но аргумент все еще называется labels,

set.seed(100)
df <- data.frame(RGA_1 = sample.int(3, 10, replace = TRUE))

df$RGA_1 <- factor(df$RGA_1, labels = c("meaning1", "meaning2", "meaning3"))
df
#>       RGA_1
#> 1  meaning1
#> 2  meaning1
#> 3  meaning2
#> 4  meaning1
#> 5  meaning2
#> 6  meaning2
#> 7  meaning3
#> 8  meaning2
#> 9  meaning2
#> 10 meaning1

Создано в 2018-05-30 пакетом представлением (v0.2.0).

Другие вопросы по тегам