Стандарт CSV относительно конца ряда

Я пишу парсер CSV и хочу, чтобы он соответствовал этим стандартам. Говорится:

  1. Каждая запись расположена на отдельной строке, разделенной разрывом строки (CRLF)

Как я должен обрабатывать строки, заканчивающиеся только CR из LF персонаж? Должен ли я рассматривать их как литералы и переходить к полю, интерпретировать как конец строки. Или, может быть, даб файл поврежден?

Я думаю, что наиболее гибким решением было бы принять любой тип конца строки, но я пытаюсь выяснить, что говорят стандарты.

Что вы думаете об этом?

1 ответ

Решение

Вы, конечно, не должны воспринимать их как искаженные, потому что в Linux, Windows и Mac, например, могут быть разные окончания строк.

Лучше поддержать их всех.

Кроме того, поля могут содержать новые строки, если они правильно указаны в кавычках. Так что вам нужно проверить это тоже.

Например:

123,"test on 2 
lines",456

является допустимой строкой CSV.

Другие вопросы по тегам