XDocument Недопустимые символы при загрузке - '\v', шестнадцатеричное значение 0x0B, является недопустимым символом

Я загружаю некоторый контент XML из API Adobe Connect. Я загружаю содержимое в XDocument и читаю все элементы sco, чтобы сохранить их в базе данных. Однако один из вызовов API содержит недопустимый символ, который дает исключение:

System.Xml.XmlException: '', hexadecimal value 0x0B, is an invalid character. Line 2, position 6495.
at System.Xml.XmlTextReaderImpl.Throw(Exception e)
at System.Xml.XmlTextReaderImpl.Throw(String res, String[] args)
at System.Xml.XmlTextReaderImpl.ParseText(Int32& startPos, Int32& endPos, Int32& outOrChars)
at System.Xml.XmlTextReaderImpl.ParseText()
at System.Xml.XmlTextReaderImpl.ParseElementContent()
at System.Xml.XmlTextReaderImpl.Read()
at System.Xml.Linq.XContainer.ReadContentFrom(XmlReader r)
at System.Xml.Linq.XContainer.ReadContentFrom(XmlReader r, LoadOptions o)
at System.Xml.Linq.XDocument.Load(XmlReader reader, LoadOptions options)
at System.Xml.Linq.XDocument.Load(XmlReader reader)
at ACRS.DataRefresherApp.Program.GetFolderContents(Folder parentFolder, AcrsDbContext db) in xxx:line 164

Вот пример XML, поступающего из Adobe Connect API. Примечание: этот пример не содержит недопустимый символ.

<?xml version="1.0"?>
<results>
    <status code="ok"/>
    <scos>
        <sco is-folder="1" duration="" display-seq="0" icon="folder" type="folder" folder-id="xx" source-sco-id="" sco-id="xx">
            <name>Shared Templates</name>
            <url-path>/f1101964883/</url-path>
            <date-created>2010-09-16T15:21:15.993+10:00</date-created>
            <date-modified>2013-12-11T22:31:05.130+11:00</date-modified>
            <is-seminar>false</is-seminar>
        </sco>
        .....
    </scos>
</results>

Вот код, который я использую для чтения / загрузки данных XML.

Stream responseStream = response.GetResponseStream();
XmlReader xmlReader = XmlReader.Create(responseStream, new XmlReaderSettings() { CheckCharacters = false });
var xmlResponse = XDocument.Load(xmlReader);
var folders = xmlResponse.Elements("results").Elements("scos").Elements("sco").ToList();

Исключение возникает, когда XDocument пытается загрузить данные из xmlReader.

var xmlResponse = XDocument.Load(xmlReader);

Я понимаю, что мне не нужно использовать XmlReader и я могу загрузить XDocument напрямую из потока. Тем не менее, я включил XmlReader в ответ на это сообщение в блоге Пола Селлеса.

Я уже читал эту тему: Как предотвратить System.Xml.XmlException: недопустимый символ в данной кодировке

Однако это не решает мою проблему. Очевидно, стандарты XML заставляют читателя по умолчанию использовать декларированную кодировку документа после прочтения документа. В случае с моим документом, где не делается никаких заявлений, по умолчанию должно использоваться UTF-8. Смотрите этот ответ.

0 ответов

Другие вопросы по тегам