Ошибка отложенной записи в кластерной файловой системе Windows 2003

Я пытаюсь решить постоянную проблему ввода-вывода, когда мы пытаемся читать или записывать в Windows 2003 Clustered Fileshare. Это происходит регулярно и, кажется, вызвано движением. Мы пишем через объект.NET FileStream.

В основном мы пишем с Windows 2003 Server, на котором запущен IIS, в общий файловый кластер Windows 2003. При записи в общую папку сервер IIS часто получает две ошибки. Один из них - всплывающее окно приложения из Windows, другой - предупреждение от MRxSmb. Оба говорят одно и то же:

[Ошибка отложенной записи] Windows не удалось сохранить все данные для файла \Device\LanmanRedirector. Данные были потеряны. Эта ошибка может быть вызвана отказом вашего компьютера или сетевого подключения. Пожалуйста, попробуйте сохранить этот файл здесь.

При чтении мы также получаем ошибки, которые являются ошибками System.IO.IOException: "Указанное сетевое имя больше не доступно".

У нас есть другие серверы, которые записывают все больше и больше файлов в этот кластер общего ресурса без проблем. Проблема исходит только от одной группы серверов. Так что это не похоже на запись больших файлов. Мы применили все исправления, упомянутые в статьях онлайн, посвященных этой проблеме, и все же это продолжается.

Наша сетевая команда запустила Network Monitor и не увидела потери пакетов, насколько я понимаю, но поскольку я не присутствовал на этом тесте, я не могу сказать это наверняка.

Есть идеи, где проверить? У меня нет возможностей исследовать или проводить тесты. Я предполагаю, что проблема в какой-то мере связана с сетью, но так как это происходит только тогда, когда эти серверы подключаются к этому кластеру обмена файлами, я не уверен, что это может быть за проблема.

Эта проблема очень специфична и потенциально связана с оборудованием, но любая помощь, которую вы можете оказать, будет полезна.

Эрик Сиппл

3 ответа

У меня похожие проблемы:

  • запись на компьютер, который также является частью кластера NLB Windows 2003 R2, иногда приводит к "Отложенной записи не удалось" или "истекло время ожидания семафора" или "указанное сетевое имя больше не доступно"
  • это воспроизводимо для тех же файлов, даже после перезагрузки всех задействованных машин
  • если я переименую проблемные файлы (некоторые из которых довольно маленькие), проблема остается
  • если я записываю файлы в другое место (физический диск) на той же машине, проблема остается
  • Я удалил все антивирусные программы, проблема остается
  • Я сбросил стек tcp-ip, проблема временно исчезла, но через некоторое время проблема возвращается для тех же файлов

Частично решена проблема: я удалил (не остановил) хост из кластера NLB. Задача решена.

Кажется, что-то нужно делать с записью в общий ресурс на сервере, который также является частью кластера балансировки сетевой нагрузки

Я еще не нашел других людей, публикующих проблемы записи файлов, связанных с кластером NLB. Тем не менее, я нашел много постов, жалующихся на подобные проблемы, ни одна из которых, кажется, не была решена.

Энн

Я слышал, что AutoDisconnect вызывает аналогичные проблемы (даже если устройство не находится в режиме ожидания). Вы можете попробовать отключить это на сервере.

Я видел, как другие люди сообщали об ошибке "отложенная запись не удалась". Одной из рекомендаций было отрегулировать размер кеша, есть утилита от sysinternals ( http://technet.microsoft.com/en-us/sysinternals/bb897561.aspx), которая позволит вам это сделать.

Другие вопросы по тегам