Python читать текстовый файл как двоичный файл?

Я пытался построить программу шифрования в Python 2.7. Он будет читать двоичный файл из файла, а затем использовать ключ для его шифрования. Однако я быстро столкнулся с проблемой. Такие файлы, как файлы изображений и исполняемые файлы читаются как шестнадцатеричные значения. Тем не менее, текстовые файлы не используют open(). Даже если я бегу

file=open("myfile.txt", "rb")

из =file.read()

это все еще выходит как просто текст. Я на Windows 7, а не Linux, который я думаю, может иметь значение. Можно ли как-то прочитать двоичный файл из ЛЮБОГО файла (включая текстовые файлы), а не только изображения и исполняемые файлы?

3 ответа

Даже при чтении файла с флагом 'rb', если ваш файл имеет байт '\x41', он будет напечатан как буква 'A' в консоли. Если вы хотите шестнадцатеричные значения, закодируйте содержимое файла как шестнадцатеричное, что означает:

content = open('text.txt', 'rb').read()
hex = content.encode('hex')

Ваш двоичный файл выглядит как текст, потому что он, вероятно, был закодирован в 8-битной кодировке, когда он был сохранен (ASCII или Latin-1 и т. Д.). Кроме того, Python 2 ужасен тем фактом, что байты и (текстовые) символы используются взаимозаменяемо... т.е. много раз строка представляет собой просто массив байтов ASCII.

Вам следует поискать различия между кодировкой текста Python 2 и 3, и вы быстро поймете, почему могут возникнуть аномалии, с которыми вы столкнулись.

Ваши "двоичные" нетекстовые файлы на самом деле не отличаются от текстовых; они просто не отображаются в понятную для вас кодировку, которую вы распознаете, а текстовые.

Посмотрите на приведенный ниже код. Также он имеет много очков для вас

from hashlib import md5
from Crypto.Cipher import AES
from Crypto import Random

def derive_key_and_iv(password, salt, key_length, iv_length):
    d = d_i = ''
    while len(d) < key_length + iv_length:
        d_i = md5(d_i + password + salt).digest()
        d += d_i
    return d[:key_length], d[key_length:key_length+iv_length]

def encrypt(in_file, out_file, password, key_length=32):
    bs = AES.block_size
    salt = Random.new().read(bs - len('Salted__'))
    key, iv = derive_key_and_iv(password, salt, key_length, bs)
    cipher = AES.new(key, AES.MODE_CBC, iv)
    out_file.write('Salted__' + salt)
    finished = False
    while not finished:
        chunk = in_file.read(1024 * bs)
        if len(chunk) == 0 or len(chunk) % bs != 0:
            padding_length = (bs - len(chunk) % bs) or bs
            chunk += padding_length * chr(padding_length)
            finished = True
        out_file.write(cipher.encrypt(chunk))

def decrypt(in_file, out_file, password, key_length=32):
    bs = AES.block_size
    salt = in_file.read(bs)[len('Salted__'):]
    key, iv = derive_key_and_iv(password, salt, key_length, bs)
    cipher = AES.new(key, AES.MODE_CBC, iv)
    next_chunk = ''
    finished = False
    while not finished:
        chunk, next_chunk = next_chunk, cipher.decrypt(in_file.read(1024 * bs))
        if len(next_chunk) == 0:
            padding_length = ord(chunk[-1])
            chunk = chunk[:-padding_length]
            finished = True
        out_file.write(chunk)

использование

with open(in_filename, 'rb') as in_file, open(out_filename, 'wb') as out_file:
    encrypt(in_file, out_file, password)
with open(in_filename, 'rb') as in_file, open(out_filename, 'wb') as out_file:
    decrypt(in_file, out_file, password)
Другие вопросы по тегам