Как преобразовать изображение из типа DynamicImage в изображение arr cs e? Использование JuicyPixels и HIP-библиотек
Я использую библиотеку обработки изображений JuicyPixels, чтобы получить изображение и преобразовать его в матричный тип. Я хочу изменить разрешение изображения до указанного пользователем размера, чтобы передать его в нейронную сеть.
Моя программа до сих пор считывает изображение и преобразует изображение в матрицу Data.Matrix. Тип изображения идет отDynamicImage -> Image Pixel8 ->[[Int]] -> Matrix Int
Я пробовал использовать функцию изменения размера из библиотеки Haskell Image Processing (HIP), но она принимает и выводит тип Image arr cs e
которые я не знаю, как обрабатывать.
Вот мой код:
import Codec.Picture
import Codec.Picture.Types
import Control.Arrow
import Data.Ratio
import Data.Monoid
import Graphics.Image.Processing
import qualified Graphics.Image as I
import qualified Data.Matrix as M
import System.FilePath.Posix (splitExtension)
-- take image input with the filepath given as a DynamicImage type
to2DMatrix :: FilePath -> String -> (Int, Int) -> IO ()
to2DMatrix fp = do
image <- readImage fp
case image of
Left _ -> putStrLn $ "Sorry, not a supported codec for " ++ fp
Right dynimg -> do
-- convert dynamic image to greyscale and then to a 2d matrix
let rle = twoDToMatrix $ pixelToInt $ greyscaleImage $ changeResolution dynimg
let (name, _) = splitExtension fp
writeFile (name ++ ".txt") (show rle)
Right _ -> putStrLn "Unhandled file type"
changeResolution :: DynamicImage -> String -> (Int, Int) -> DynamicImage
changeResolution border (dim1, dim2) img = I.resize border (dim1, dim2) img
-- convert DynamicImage to a Pixel8 image
greyscaleImage :: DynamicImage -> Image Pixel8
greyscaleImage = convertRGB8 >>> pixelMap greyscalePixel
-- convert PixelsRGB8 image to Pixel8 image
greyscalePixel :: PixelRGB8 -> Pixel8
greyscalePixel (PixelRGB8 r g b) = round (wr + wg + wb)
where wr = toRational r * (3 % 10)
wg = toRational g * (59 % 100)
wb = toRational b * (11 % 100)
-- convert Pixel8 image to a 2-d matrix of integers
pixelToInt :: Image Pixel8 -> [[Int]]
pixelToInt =
map reverse . reverse . snd . pixelFold -- because of the direction pixelFold works in, and the direction
(\(lastY, ps:pss) x y p -> -- you add things to lists, reverse and map reverse are necessary
if y == lastY -- to make the output not mirrored horizontaly and vertically
then (y, (fromIntegral p:ps):pss)
else (y, [fromIntegral p]:ps:pss))
(0,[[]])
-- converts list of lists to Data.Matrix type Matrix
twoDToMatrix :: [[Int]] -> M.Matrix Int
twoDToMatrix lists = M.fromLists lists
РЕДАКТИРОВАТЬ:
изменена программа для удаленияchangeResolution
функцию, поскольку я понял, что могу просто преобразовать изображение в оттенки серого, используя convert
функция или с помощью readImageY
. Вот обновленный код:
to2DMatrix :: FilePath -> Border(Interface.Pixel I.Y Word8) -> (Int, Int) -> IO ()
to2DMatrix fp bor (dim1, dim2)= do
eimg <- I.readImageExact VS fp
case eimg of
Left _ -> putStrLn $ "Sorry, not a supported codec for " ++ fp
Right img -> do
let imgGray :: Interface.Image VS I.Y Word8
imgGray = convert (img)
let new_res :: Interface.Image VS I.Y Word8
new_res = I.resize imgGray bor (dim1, dim2)
let rle = twoDToMatrix $ pixelToInt $ toJPImageY8 new_res
let (name, _) = splitExtension fp
writeFile (name ++ ".txt") (show rle)
Я получаю следующую ошибку. Как вы конвертируете изarr
к VS
?
Couldn't match expected type ‘Interface.Image VS I.Y Word8’
with actual type ‘Interface.Image arr0 I.Y Word8
-> Interface.Image arr0 I.Y Word8’
• In the expression: resize imgGray bor (dim1, dim2)
In an equation for ‘new_res’:
new_res = resize imgGray bor (dim1, dim2)
In the expression:
do let imgGray :: Interface.Image VS I.Y Word8
imgGray = convert (img)
let new_res :: Interface.Image VS I.Y Word8
new_res = resize imgGray bor ...
let rle = twoDToMatrix $ pixelToInt $ toJPImageY8 new_res
let (name, _) = splitExtension fp
....
|
34 | new_res = I.resize imgGray bor (dim1, dim2)
| ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
1 ответ
В resize
функция в библиотеке Haskell Image Processing (HIP) используетImage arr cs e
type, поэтому мне было легче читать изображение с помощью библиотеки HIP, а не с помощью JuicyPixels.
Типы идут от Image VS Y Double
-> Image VS Y Word8
-> Pixel8
-> [[Int]]
-> Matrix Int
.
Еще одно преимущество использования HIP заключается в том, что мы можем читать изображение в оттенках серого. Pixel Y
вместо того, чтобы делать преобразования позже. Вот код с изменениями:
import Codec.Picture
import Codec.Picture.Types
import Graphics.Image.Processing
import qualified Graphics.Image as I
import qualified Graphics.Image.Interface as Interface
import Graphics.Image.ColorSpace
import Data.Word (Word8)
import qualified Data.Matrix as M
to2DMatrix :: FilePath -> (Int, Int) -> IO (Maybe (M.Matrix Int))
to2DMatrix fp (dim1, dim2)= do
eimg <- I.readImageY VS fp
let new_res :: Interface.Image VS I.Y Word8
new_res = I.resize Bilinear Edge (dim1, dim2) $ Interface.map conv eimg
let rle = twoDToMatrix $ pixelToInt $ toJPImageY8 new_res
return $ Just (rle)
conv :: Interface.Pixel I.Y Double -> Interface.Pixel I.Y Word8
conv d = fmap Interface.toWord8 d
pixelToInt :: Image Pixel8 -> [[Int]]
pixelToInt =
map reverse . reverse . snd . pixelFold
(\(lastY, ps:pss) x y p ->
if y == lastY
then (y, (fromIntegral p:ps):pss)
else (y, [fromIntegral p]:ps:pss))
(0,[[]])
twoDToMatrix :: [[Int]] -> M.Matrix Int
twoDToMatrix lists = M.fromLists lists
conv
преобразует каждый пиксель из Double
к toWord8
. Изображение должно иметьWord8
точность для toJPImageY8
функция.