Python и 16-битный PGM

У меня есть 16-битные изображения PGM, которые я пытаюсь прочитать на Python. Кажется (?) Вроде PIL не поддерживает этот формат?

import Image
im = Image.open('test.pgm')
im.show()

Примерно показывает изображение, но это не правильно. Повсюду есть темные полосы, и сообщается, что img mode=L, Я думаю, что это связано с ранним вопросом о 16-битных файлах TIFF. Является ли 16-битным редким, что PIL просто не поддерживает его? Любой совет, как я могу читать 16-битные файлы PGM в Python, используя PIL или другую стандартную библиотеку, или самодельный код?

3 ответа

Решение

Нижеследующее зависит только от загруженности образа, который может быть 8-битным или 16-битным необработанным PGM/PPM. Я также показываю несколько разных способов просмотра изображения. Тот, который использует PIL (import Image) требует, чтобы данные сначала были преобразованы в 8-битные.

#!/usr/bin/python2 -u

from __future__ import print_function
import sys, numpy

def read_pnm_from_stream( fd ):
   pnm = type('pnm',(object,),{}) ## create an empty container
   pnm.header = fd.readline()
   pnm.magic = pnm.header.split()[0]
   pnm.maxsample = 1 if ( pnm.magic == 'P4' ) else 0
   while ( len(pnm.header.split()) < 3+(1,0)[pnm.maxsample] ): s = fd.readline() ; pnm.header += s if ( len(s) and s[0] != '#' ) else ''
   pnm.width, pnm.height = [int(item) for item in pnm.header.split()[1:3]]
   pnm.samples = 3 if ( pnm.magic == 'P6' ) else 1
   if ( pnm.maxsample == 0 ): pnm.maxsample = int(pnm.header.split()[3])
   pnm.pixels = numpy.fromfile( fd, count=pnm.width*pnm.height*pnm.samples, dtype='u1' if pnm.maxsample < 256 else '>u2' )
   pnm.pixels = pnm.pixels.reshape(pnm.height,pnm.width) if pnm.samples==1 else pnm.pixels.reshape(pnm.height,pnm.width,pnm.samples)
   return pnm

if __name__ == '__main__':

## read image
 # src = read_pnm_from_stream( open(filename) )
   src = read_pnm_from_stream( sys.stdin )
 # print("src.header="+src.header.strip(), file=sys.stderr )
 # print("src.pixels="+repr(src.pixels), file=sys.stderr )

## write image
   dst=src
   dst.pixels = numpy.array([ dst.maxsample-i for i in src.pixels ],dtype=dst.pixels.dtype) ## example image processing
 # print("dst shape: "+str(dst.pixels.shape), file=sys.stderr )
   sys.stdout.write(("P5" if dst.samples==1 else "P6")+"\n"+str(dst.width)+" "+str(dst.height)+"\n"+str(dst.maxsample)+"\n");
   dst.pixels.tofile( sys.stdout ) ## seems to work, I'm not sure how it decides about endianness

## view using Image
   import Image
   viewable = dst.pixels if dst.pixels.dtype == numpy.dtype('u1') else numpy.array([ x>>8 for x in dst.pixels],dtype='u1')
   Image.fromarray(viewable).show()

## view using scipy
   import scipy.misc
   scipy.misc.toimage(dst.pixels).show()

Примечания по использованию

  • В конце концов я понял, "как он решает проблему порядка байтов" - он на самом деле хранит образ в памяти как big-endian (а не как нативный). Эта схема может замедлить любую нетривиальную обработку изображений - хотя другие проблемы с производительностью в Python могут отодвинуть эту проблему до тривиальности (см. Ниже).

  • Я задал вопрос, связанный с проблемой порядка байтов здесь. Я также столкнулся с некоторой интересной путаницей, связанной с порядком байтов, потому что я тестировал, предварительно обработав изображение с помощью pnmdepth 65535 что не очень хорошо (само по себе) для проверки порядка байтов, так как младшие и старшие байты могут оказаться одинаковыми (я не сразу заметил, потому что print(array) выводит десятичную). Я должен был также применить pnmgamma чтобы избежать путаницы.

  • Поскольку Python такой медленный, numpy пытается быть хитрым и умным в отношении того, как применяются определенные операции (см. трансляцию). Первое практическое правило для эффективности с numpy пусть NumPy обрабатывает итерацию для вас (или, другими словами , не пишите свой собственный for петли). Забавная вещь в приведенном выше коде состоит в том, что он выполняет только частично это правило при выполнении "обработки изображений в качестве примера", и, следовательно, производительность этой строки сильно зависит от параметров, которые были заданы reshape,

  • Следующий большой numpy Загадка Endianness: Почему newbyteorder() кажется, чтобы вернуть массив, когда он задокументирован, чтобы вернуть dtype, Это актуально, если вы хотите конвертировать в native endian с помощью dst.pixels=dst.pixels.byteswap(True).newbyteorder(),

  • Подсказки по портированию на Python 3: двоичный ввод с текстовым заголовком ASCII, читаемый из stdin

Вам нужен режим "L;16"; Однако похоже, что PIL имеет режим "L" жестко запрограммирован в File.c при загрузке PGM. Вам нужно написать свой собственный декодер, если вы хотите читать 16-битный PGM.

Тем не менее, поддержка 16-битных изображений все еще кажется слабой:

>>> im = Image.fromstring('I;16', (16, 16), '\xCA\xFE' * 256, 'raw', 'I;16') 
>>> im.getcolors()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib/python2.6/dist-packages/PIL/Image.py", line 866, in getcolors
    return self.im.getcolors(maxcolors)
ValueError: image has wrong mode

Я думаю, что PIL способен читать изображения с 16 битами, но на самом деле их хранение и манипулирование ими все еще являются экспериментальными.

>>> im = Image.fromstring('L', (16, 16), '\xCA\xFE' * 256, 'raw', 'L;16') 
>>> im
<Image.Image image mode=L size=16x16 at 0x27B4440>
>>> im.getcolors()
[(256, 254)]

Видите, это просто интерпретировать 0xCAFE значение как 0xFE, что не совсем правильно.

Вот общий читатель PNM/ PAM на основе NumPy и недокументированная функция в PyPNG.

def read_pnm( filename, endian='>' ):
   fd = open(filename,'rb')
   format, width, height, samples, maxval = png.read_pnm_header( fd )
   pixels = numpy.fromfile( fd, dtype='u1' if maxval < 256 else endian+'u2' )
   return pixels.reshape(height,width,samples)

Конечно, написание этого формата изображения обычно не требует помощи библиотеки...

Другие вопросы по тегам