Стандарт CSV относительно конца ряда
Я пишу парсер CSV и хочу, чтобы он соответствовал этим стандартам. Говорится:
- Каждая запись расположена на отдельной строке, разделенной разрывом строки (CRLF)
Как я должен обрабатывать строки, заканчивающиеся только CR
из LF
персонаж? Должен ли я рассматривать их как литералы и переходить к полю, интерпретировать как конец строки. Или, может быть, даб файл поврежден?
Я думаю, что наиболее гибким решением было бы принять любой тип конца строки, но я пытаюсь выяснить, что говорят стандарты.
Что вы думаете об этом?
1 ответ
Вы, конечно, не должны воспринимать их как искаженные, потому что в Linux, Windows и Mac, например, могут быть разные окончания строк.
Лучше поддержать их всех.
Кроме того, поля могут содержать новые строки, если они правильно указаны в кавычках. Так что вам нужно проверить это тоже.
Например:
123,"test on 2
lines",456
является допустимой строкой CSV.