Разбор текстового файла, содержащего несколько разделов в R
У меня есть текстовый файл, содержащий 130 таблиц, разделенных разделителем ' DLM'
, Я пытался использовать пакет reader
в R и определил разделитель по умолчанию следующим образом, но он все равно читает весь файл.
reader::reader("Path_to_file.txt", def= "\\' DLM'", one.byte = FALSE)
Можно ли проанализировать файл и прочитать только те строки, которые относятся к имени таблицы? Например, если я укажу "B2", могу ли я читать только строки таблицы B2? Я не могу обойти проблему разделителя в читателе. Любая помощь приветствуется!
Примерный набор данных:
'A1',2018,10,'655033655206 1',,,81,
'A1',2019,4,'655033655206 1',,,63,
'A1',2011,1,'655034655045 1',.03486,.05829,52,
' DLM','B2',2011,1,'5BON AQUA TP',361239,161,,,0,
'B2',2001,1,'5BON AQUA TN',361240,161,22.7,4.97,0,
'B2',2002,1,'5CON FIRE TN',363240,161,22.7,4.97,0,
' DLM','C1','CGDF09',
'C1','W XYZ',
'C1','A BCD',
1 ответ
Решение
Может быть, попробуйте удалить разделитель, а затем проверить, какая строка начинается с 'B2'
? Вы можете использовать эту функцию из stringi
пакет:
stri_startswith_fixed(c("A1,1,2,3","B2,3,4,5","C2,3,,5"), "B2")
# [1] FALSE TRUE FALSE