Описание тега byte-order-mark
Метка порядка байтов (BOM) - это символ Unicode, используемый для обозначения порядка байтов в текстовом файле или потоке. Поскольку спецификация представляет собой U+FEFF, она дает понять, являются ли байты старшего порядка первыми (поток начинается с FE.FF) или вторыми (поток начинается с FF.FE).
0
ответов
Как конвертировать двунаправленную строку в визуальный порядок wstring?
Например у меня есть эта строка: std::wstring s = L"123"; s.push_back(0x202e); s.append(L"abc"); Вот 0x202e является UTF-16 меткой RLO (переопределение справа налево). Из-за этого выглядит строка после печати: cba123, Я хочу спросить, есть ли какая-…
26 авг '13 в 13:47
1
ответ
Почему спецификация вызывает предупреждение "заголовки уже отправлены"?
Обратите внимание, что это не дубликат. На кажущиеся дубликаты можно ответить "Просто сохраните без спецификации!" Мой вопрос, однако, почему? Если я непреднамеренно сохраняю файл PHP с помощью спецификации и пытаюсь отправить заголовок изнутри PHP,…
19 май '14 в 10:14
1
ответ
Используется ли спецификация для 2-байтовых текстовых файлов Unicode?
Я знаю, что спецификация используется для файлов UTF-8, но как насчет текстовых файлов, где каждый символ состоит из 2 байтов, я должен также добавить к ним метку порядка байтов?
08 окт '12 в 14:48
1
ответ
Добавляет ли SQL Server метку порядка байтов при приведении к XML?
У меня есть этот метод C#, который предназначен для игнорирования метки порядка байтов при сериализации в XML: public static string SerializeAsXml(this object dataToSerialize) { if (dataToSerialize == null) return null; using (var stringwriter = new…
20 ноя '18 в 08:59
1
ответ
Удаление BOM из CSV в gzip в Python
Я использую следующий код, чтобы распаковать и сохранить файл CSV: with gzip.open(filename_gz) as f: file = open(filename, "w"); output = csv.writer(file, delimiter = ',') output.writerows(csv.reader(f, dialect='excel', delimiter = ';')) Кажется, вс…
03 янв '14 в 08:59
7
ответов
Преобразование UTF-8 с спецификацией в UTF-8 без спецификации в Python
Два вопроса здесь. У меня есть набор файлов, которые обычно UTF-8 с спецификацией. Я хотел бы преобразовать их (в идеале на месте) в UTF-8 без спецификации. Это похоже на codecs.StreamRecoder(stream, encode, decode, Reader, Writer, errors) бы справи…
17 янв '12 в 16:37
0
ответов
Дополнительный знак вопроса в запросе XML. Это знак порядка байтов?
Я звоню в некоторые службы SAAJ. Служба SAAG получает XML с добавленным дополнительным знаком вопроса. Почему в отправленном xml есть дополнительный знак вопроса? Получено SOAP-сообщение: ?<?xml version="1.0" encoding="utf-8"?> Ошибка: <fau…
09 апр '15 в 05:58
2
ответа
Есть ли в Apache FileUtils способ учета спецификаций при добавлении в файл UTF-16?
У меня есть большой набор данных, который содержит испанские и английские символы, которые я буферизирую и передаю в файл. Первое нажатие делает отлично и записывает новый файл спецификации UTF-16BE \w. Когда я пытаюсь добавить следующий набор данны…
30 мар '16 в 20:44
2
ответа
Разбор и удаление BOM/Preamble из XML через файловую систему
Я обрабатываю файлы XBRL и натолкнулся на кучу из них, у которых в начале стоит метка порядка байтов (BOM). Если я удаляю его вручную, я могу обработать файл без каких-либо проблем. У меня было несколько неудачных попыток удалить спецификацию с нача…
26 фев '19 в 08:29
4
ответа
Удалить спецификацию из строки с помощью Perl
У меня следующая проблема: я читаю из текстового файла UTF-8 (и я говорю Perl, что я делаю это с помощью ":encoding(utf-8)"). Файл выглядит так в шестнадцатеричной программе просмотра: EF BB BF 43 6F 6E 66 65 72 65 6E 63 65 Это переводится как "Конф…
24 июн '14 в 15:01
2
ответа
Как добавить спецификацию для всех файлов UTF-8 в проекте?
Текущая кодировка UTF-8, и я хочу добавить спецификацию для всех файлов Контекст: инструментарий сертификации приложений для Windows 8 выдает следующую ошибку, если спецификация не добавлена: Файл C:\x\y\z.js неправильно закодирован в UTF-8. Повторн…
05 мар '13 в 11:05
2
ответа
Python запросы, CSV, Sha256 и BOM
Я собираю набор CSV для спортсменов, используя Requests и Python 2.7. Эти файлы создаются сервером отчетов MSFT и называются iso-8859-1, сообщает Requests. Поскольку я имею дело с тысячами каждую ночь, я хочу вычислить файлы и сравнить с предыдущим …
05 окт '14 в 13:37
1
ответ
Ruby strptime не работает при чтении файла
У меня есть следующий код: require 'date' f = File.open(filepath) f.each_with_index do |line, i| a, b = line.split("\t") d = DateTime.strptime(a, '%m/%d/%Y %I:%M %p') puts "#{a} --- #{b}" break unless i < 100 end И я получаю следующую ошибку: c_r…
05 июн '14 в 15:41
3
ответа
Проблема CakePHP "Не удается изменить информацию заголовка" НЕ является пробелом
Вот ошибка: Warning (2): Cannot modify header information - headers already sent by (output started at /usr/share/php/cake/basics.php:111) [CORE/cake/libs/controller/controller.php, line 640] $status = "Location: http://mydomain.com/blog/index" head…
22 июн '11 в 15:55
3
ответа
Как игнорировать пробельные символы Unicode, закодированные в UTF-8?
У меня есть CSV-файл со следующей информацией: id name age height weight 1 x 12 11 124 2 y 13 23 432 3 z 14 43 1435 Он хранится в файле с именем Workbook2.csv. Я использую следующий код: ipFile = csv.DictReader(open('Workbook2.csv', 'rU')) dict = {}…
11 дек '17 в 21:05
1
ответ
Удалить спецификацию из html-файлов - 1000 файлов / Могу ли я удалить с помощью regex или apache?
У меня есть тысячи HTML-файлов, все с BOM в начале. Когда страница загружается в браузере, она отображает китайские буквы. Мой вопрос - есть ли способ удалить спецификацию из начала моих html-файлов, используя поиск и замену регулярным выражением в …
04 фев '15 в 15:00
1
ответ
Напишите файл C++ со стандартным потоком в UCS-2 LE без кодировки BOM
Когда я вывожу файл со стандартным потоком, он показывает кодировку ASCII\ANSI в Notepad++, что я считаю нормальным, но мне это нужно в UCS-2 LE без спецификации. Я не знаю, что мне следует изменить в этом коде - вы можете помочь? Это формат файла с…
24 дек '10 в 21:19
6
ответов
Как решить "session_regenerate_id(): Невозможно восстановить идентификатор сессии - заголовки уже отправлены"
Поскольку я переместил приложение yii на другой общий хост и приложение запускалось...index.php? R =site/login с учетными данными для входа, я получил предупреждение: session_regenerate_id(): Cannot regenerate session id - headers already sent actio…
07 окт '13 в 15:45
1
ответ
Работа с файлами utf-8 в Eclipse
Вполне прямой вопрос. Есть ли способ настроить Eclipse для работы с текстовыми файлами, закодированными с utf-8 с и без спецификации? До сих пор я использовал eclipse с кодировкой utf-8, и она работает, но когда я пытаюсь редактировать файл, созданн…
25 май '10 в 14:28
2
ответа
XML - данные на корневом уровне недействительны
У меня есть XSD-файл, который закодирован в UTF-8, и любой текстовый редактор, через который я его запускаю, не показывает никаких символов в начале файла, но когда я поднимаю его в отладчике Visual Studio, я ясно вижу пустой коробка перед файлом. Я…
14 ноя '08 в 21:14