Вычисление прогресса (бар) с помощью GZipStream

Я читаю файл.gz из какого-то медленного источника (например, FTP-сервера) и сейчас обрабатываю полученные данные. Выглядит примерно так:

FtpWebResponse response = ftpclientRequest.GetResponse() as FtpWebResponse;
using (Stream ftpStream = response.GetResponseStream())
using (GZipStream unzipped = new GZipStream(ftpStream, CompressionMode.Decompress))
using (StreamReader linereader = new StreamReader(unzipped))
{
  String l;
  while ((l = linereader.ReadLine()) != null)
  {
    ...
  }
}

Моя проблема показывает точный индикатор выполнения. Заранее я могу получить сжатый размер файла.gz, но я не знаю, насколько большой контент будет распакован. Читая файл построчно, я хорошо знаю, сколько несжатых байтов я прочитал, но я не знаю, как это связано с размером сжатого файла.

Итак, есть ли способ получить от GZipStream, как далеко указатель файла продвигается в сжатый файл? Мне нужна только текущая позиция, размер файла gz, который я могу получить перед чтением файла.

4 ответа

Решение

Вы можете подключить поток, который подсчитывает, сколько байтов прочитал GZipStream.

  public class ProgressStream : Stream
  {
    public long BytesRead { get; set; }
    Stream _baseStream;
    public ProgressStream(Stream s)
    {
      _baseStream = s;
    }
    public override bool CanRead
    {
      get { return _baseStream.CanRead; }
    }
    public override bool CanSeek
    {
      get { return false; }
    }
    public override bool CanWrite
    {
      get { return false; }
    }
    public override void Flush()
    {
      _baseStream.Flush();
    }
    public override long Length
    {
      get { throw new NotImplementedException(); }
    }
    public override long Position
    {
      get
      {
        throw new NotImplementedException();
      }
      set
      {
        throw new NotImplementedException();
      }
    }
    public override int Read(byte[] buffer, int offset, int count)
    {
      int rc = _baseStream.Read(buffer, offset, count);
      BytesRead += rc;
      return rc;
    }
    public override long Seek(long offset, SeekOrigin origin)
    {
      throw new NotImplementedException();
    }
    public override void SetLength(long value)
    {
      throw new NotImplementedException();
    }
    public override void Write(byte[] buffer, int offset, int count)
    {
      throw new NotImplementedException();
    }
  }

// usage
FtpWebResponse response = ftpclientRequest.GetResponse() as FtpWebResponse;
using (Stream ftpStream = response.GetResponseStream())
using (ProgressStream progressStream = new ProgressStream(ftpstream))
using (GZipStream unzipped = new GZipStream(progressStream, CompressionMode.Decompress))
using (StreamReader linereader = new StreamReader(unzipped))
{
  String l;
  while ((l = linereader.ReadLine()) != null)
  {
    progressStream.BytesRead(); // does contain the # of bytes read from FTP so far.
  }
}

В качестве прокси для распаковки прогресса вы можете попытаться получить информацию о ходе загрузки файла из основного потока, используя:

var percentageProgress = ftpStream.Position / (double)ftpWebResponse.ContentLength;

или же

var percentageProgress = ftpStream.Position / (double)ftpStream.Length;

Он работает с FileStream и должен работать с GetResponseStream() при условии, что он реализует свойство Position, а FTP-сервер возвращает информацию о длине загружаемого файла: http://msdn.microsoft.com/en-us/library/system.net.ftpwebresponse.contentlength(v=vs.110).aspx

Я предлагаю вам взглянуть на следующий код:

public static readonly byte[] symbols = new byte[8 * 1024];

public static void Decompress(FileInfo inFile, FileInfo outFile)
{
    using (var inStream = inFile.OpenRead())
    {
        using (var zipStream = new GZipStream(inStream, CompressionMode.Decompress))
        {
            using (var outStream = outFile.OpenWrite())
            {
                var total = 0;
                do
                {
                    var async = zipStream.BeginRead(symbols, 0, symbols.Length, null, null);
                    total = zipStream.EndRead(async);
                    if (total != 0)
                    {
                        // Report progress. Read total bytes (8K) from the zipped file.
                        outStream.Write(symbols, 0, total);
                    }
                } while (total != 0);
            }
        }
    }
}

Я пересмотрел свой код и провел несколько тестов. ИМХО Дарин прав. Однако я думаю, что можно прочитать только заголовок (размер?) Сжатого потока и узнать размер результирующего файла. (WinRar "знает", каков размер разархивированного файла, без разархивирования всего архива zip. Он считывает эту информацию из заголовка архива.) Если вы найдете размер файла, полученный в результате, этот код поможет вам сообщить точный прогресс.

public static readonly byte[] symbols = new byte[8 * 1024];

public static void Decompress(FileInfo inFile, FileInfo outFile, double size, Action<double> progress)
{
    var percents = new List<double>(100);

    using (var inStream = inFile.OpenRead())
    {
        using (var zipStream = new GZipStream(inStream, CompressionMode.Decompress))
        {
            using (var outStream = outFile.OpenWrite())
            {
                var current = 0;

                var total = 0;
                while ((total = zipStream.Read(symbols, 0, symbols.Length)) != 0)
                {
                    outStream.Write(symbols, 0, total);
                    current += total;

                    var p = Math.Round(((double)current / size), 2) * 100;
                    if (!percents.Contains(p))
                    {
                        if (progress != null)
                        {
                            progress(p);
                        }
                        percents.Add(p);
                    }
                }
            }
        }
    }
}

Надеюсь, это поможет.

Другие вопросы по тегам