Является ли файл append атомарным в UNIX?
В целом, что мы можем принять как должное, когда добавляем файл в UNIX из нескольких процессов? Можно ли потерять данные (один процесс перезаписывает изменения другого)? Возможно ли искажение данных? (Например, каждый процесс добавляет одну строку на каждое добавление к файлу журнала, возможно ли, что две строки искажаются?) Если добавление не является атомарным в вышеприведенном смысле, то каков наилучший способ обеспечения взаимного исключения?
4 ответа
Запись, размер которой меньше PIPE_BUF, должна быть атомарной. Это должно быть не менее 512 байт, хотя оно может быть и больше (похоже, для linux установлено значение 4096).
Это предполагает, что вы говорите обо всех полностью POSIX-совместимых компонентах. Например, это не так в NFS.
Но при условии, что вы записываете в файл журнала, который вы открыли в режиме "O_APPEND", и сохраняете свои строки (включая новую строку) в байтах "PIPE_BUF", у вас должно быть возможность иметь несколько устройств записи в файл журнала без проблем с повреждением. Любые прерывания будут поступать до или после записи, а не посередине. Если вы хотите, чтобы целостность файла пережила перезагрузку, вам также необходимо позвонить fsync(2)
после каждой записи, но это ужасно для производительности.
Уточнение: прочитайте комментарии и ответ Оз Соломона. Я не уверен что O_APPEND
должен иметь это PIPE_BUF
размер атомности. Вполне возможно, что именно так реализован Linux write()
или это может быть связано с размерами блоков базовой файловой системы.
Изменить: Обновлен в августе 2017 года с последними результатами Windows.
Я собираюсь дать вам ответ со ссылками на тестовый код и результаты в качестве автора предложенного Boost.AFIO, который реализует асинхронную файловую систему и библиотеку файлового ввода / вывода C++.
Во-первых, O_APPEND или эквивалентный FILE_APPEND_DATA в Windows означает, что приращения максимального экстента файла ("длины" файла) являются атомарными при одновременной записи. Это гарантируется POSIX, и Linux, FreeBSD, OS X и Windows все реализуют это правильно. Samba также реализует это правильно, NFS до v5 нет, так как ему не хватает возможности форматирования проводов для атомарного добавления. Таким образом, если вы откроете свой файл только для добавления, одновременные записи не будут разрываться по отношению друг к другу на любой основной ОС, если не задействована NFS.
Однако при одновременном чтении в атомарные добавления могут возникать разрывные записи в зависимости от ОС, системы хранения и флагов, с которыми вы открывали файл - приращение максимального экстента файла является атомарным, но видимость записей относительно операций чтения может или не может быть атомным. Вот краткое резюме по флагам, ОС и системе регистрации:
Нет O_DIRECT / FILE_FLAG_NO_BUFFERING:
Microsoft Windows 10 с NTFS: атомарность обновления = 1 байт до и включительно 10.0.10240, с 10.0.14393 не менее 1 МБ, возможно, бесконечное (*).
Linux 4.2.6 с ext4: атомарность обновления = 1 байт
FreeBSD 10.2 с ZFS: атомарность обновления = не менее 1 МБ, возможно, бесконечна (*)
O_DIRECT / FILE_FLAG_NO_BUFFERING:
Microsoft Windows 10 с NTFS: обновлять атомарность = до и включительно с 10.0.10240 до 4096 байт, только если страница выровнена, в противном случае 512 байт, если FILE_FLAG_WRITE_THROUGH выключен, иначе 64 байта. Обратите внимание, что эта атомарность, вероятно, является особенностью PCIe DMA, а не предназначена для. Начиная с 10.0.14393, по крайней мере, 1 МБ, вероятно, бесконечна (*).
Linux 4.2.6 с ext4: атомарность обновления = не менее 1 МБ, возможно, бесконечность (*). Обратите внимание, что более ранние версии Linux с ext4 определенно не превышали 4096 байт, XFS, конечно, раньше имела пользовательскую блокировку, но, похоже, недавний Linux наконец исправил это.
FreeBSD 10.2 с ZFS: атомарность обновления = не менее 1 МБ, возможно, бесконечна (*)
Вы можете увидеть необработанные результаты эмпирических испытаний по адресу https://github.com/ned14/afio/tree/master/programs/fs-probe. Обратите внимание, что мы тестируем разрывы только на 512 байтов, поэтому я не могу сказать, разорвется ли частичное обновление сектора 512 байт во время цикла чтения-изменения-записи.
Таким образом, чтобы ответить на вопрос OP, записи O_APPEND не будут мешать друг другу, но чтение одновременно с записями O_APPEND, вероятно, будет видеть разрыв записи в Linux с ext4, если не включен O_DIRECT, после чего ваши записи O_APPEND должны быть кратны размеру сектора.
(*) "Вероятно, бесконечное" проистекает из этих пунктов в спецификации POSIX:
Все следующие функции должны быть атомарными по отношению друг к другу в эффектах, указанных в POSIX.1-2008, когда они работают с обычными файлами или символическими ссылками... [много функций] ... read() ... write() ... Если два потока каждый вызывают одну из этих функций, каждый вызов должен видеть все указанные эффекты другого вызова, или ни одного из них. [Источник]
а также
Записи могут быть сериализованы относительно других операций чтения и записи. Если read () файловых данных может быть доказано (любым способом) после write () данных, это должно отражать этот write(), даже если вызовы выполняются разными процессами. [Источник]
но наоборот:
Этот том POSIX.1-2008 не определяет поведение одновременной записи в файл из нескольких процессов. Приложения должны использовать некоторую форму управления параллелизмом. [Источник]
Я написал скрипт для эмпирического тестирования максимального атомарного размера приложения. Сценарий, написанный на bash, порождает несколько рабочих процессов, каждый из которых записывает подписи рабочих в один и тот же файл. Затем он читает файл в поисках перекрывающихся или поврежденных подписей. Вы можете увидеть исходный текст сценария в этом посте.
Фактический максимальный атомарный размер дополнения зависит не только от ОС, но и от файловой системы.
В Linux+ext3 размер равен 4096, а в Windows+NTFS - 1024. Дополнительные размеры см. В комментариях ниже.
Вот что говорится в стандарте: http://www.opengroup.org/onlinepubs/009695399/functions/pwrite.html.
Если
O_APPEND
устанавливается флаг флагов состояния файла, смещение файла должно быть установлено до конца файла перед каждой записью, и между изменением смещения файла и операцией записи не должно происходить никакой промежуточной операции модификации файла.