Скачать 10-к для каждой корпорации, группировать по коду SIC
Я использую библиотеку EDGAR в R для загрузки всех 10-K 2005 года. Приведенный ниже код предложит "да" загрузить 10-K для каждого CIK в моем цикле. (Х / т Вэйхуан Вонгу, чтобы помочь мне с этим.)
install.packages("edgar")
library(edgar)
report <- getMasterIndex(2005)
x <- capture.output(dput(edgar::getFilings))
x <- gsub("choice <- .*", "cat(paste(msg3, '\n')); choice <- 'yes'", x)
x <- gsub("^function", "my_getFilings <- function", x)
writeLines(x, con = tmp <- tempfile())
source(tmp)
for(CIK in c(789019, 777676, 849399)){
my_getFilings(2005, CIK, '10-K')
}
list.files(file.path(getwd(), "Edgar filings"))
Я скачал этот маппер и загрузил его в R. Он дает мне SIC отрасль # для каждого кода CIK.
CIK <- read.csv("cik-ticker.csv")
Как я могу расширить свой код, чтобы искать 10-K для каждого CIK в этом списке, группируя их по коду SIC? Я пытался определить CIK и SIC и создать матрицу, но не был уверен, как сделать мои измерения динамическими для числа # кодов SIC, которые я получу.