Python читать текстовый файл как двоичный файл?
Я пытался построить программу шифрования в Python 2.7. Он будет читать двоичный файл из файла, а затем использовать ключ для его шифрования. Однако я быстро столкнулся с проблемой. Такие файлы, как файлы изображений и исполняемые файлы читаются как шестнадцатеричные значения. Тем не менее, текстовые файлы не используют open(). Даже если я бегу
file=open("myfile.txt", "rb")
из =file.read()
это все еще выходит как просто текст. Я на Windows 7, а не Linux, который я думаю, может иметь значение. Можно ли как-то прочитать двоичный файл из ЛЮБОГО файла (включая текстовые файлы), а не только изображения и исполняемые файлы?
3 ответа
Даже при чтении файла с флагом 'rb', если ваш файл имеет байт '\x41', он будет напечатан как буква 'A' в консоли. Если вы хотите шестнадцатеричные значения, закодируйте содержимое файла как шестнадцатеричное, что означает:
content = open('text.txt', 'rb').read()
hex = content.encode('hex')
Ваш двоичный файл выглядит как текст, потому что он, вероятно, был закодирован в 8-битной кодировке, когда он был сохранен (ASCII или Latin-1 и т. Д.). Кроме того, Python 2 ужасен тем фактом, что байты и (текстовые) символы используются взаимозаменяемо... т.е. много раз строка представляет собой просто массив байтов ASCII.
Вам следует поискать различия между кодировкой текста Python 2 и 3, и вы быстро поймете, почему могут возникнуть аномалии, с которыми вы столкнулись.
Ваши "двоичные" нетекстовые файлы на самом деле не отличаются от текстовых; они просто не отображаются в понятную для вас кодировку, которую вы распознаете, а текстовые.
Посмотрите на приведенный ниже код. Также он имеет много очков для вас
from hashlib import md5
from Crypto.Cipher import AES
from Crypto import Random
def derive_key_and_iv(password, salt, key_length, iv_length):
d = d_i = ''
while len(d) < key_length + iv_length:
d_i = md5(d_i + password + salt).digest()
d += d_i
return d[:key_length], d[key_length:key_length+iv_length]
def encrypt(in_file, out_file, password, key_length=32):
bs = AES.block_size
salt = Random.new().read(bs - len('Salted__'))
key, iv = derive_key_and_iv(password, salt, key_length, bs)
cipher = AES.new(key, AES.MODE_CBC, iv)
out_file.write('Salted__' + salt)
finished = False
while not finished:
chunk = in_file.read(1024 * bs)
if len(chunk) == 0 or len(chunk) % bs != 0:
padding_length = (bs - len(chunk) % bs) or bs
chunk += padding_length * chr(padding_length)
finished = True
out_file.write(cipher.encrypt(chunk))
def decrypt(in_file, out_file, password, key_length=32):
bs = AES.block_size
salt = in_file.read(bs)[len('Salted__'):]
key, iv = derive_key_and_iv(password, salt, key_length, bs)
cipher = AES.new(key, AES.MODE_CBC, iv)
next_chunk = ''
finished = False
while not finished:
chunk, next_chunk = next_chunk, cipher.decrypt(in_file.read(1024 * bs))
if len(next_chunk) == 0:
padding_length = ord(chunk[-1])
chunk = chunk[:-padding_length]
finished = True
out_file.write(chunk)
использование
with open(in_filename, 'rb') as in_file, open(out_filename, 'wb') as out_file:
encrypt(in_file, out_file, password)
with open(in_filename, 'rb') as in_file, open(out_filename, 'wb') as out_file:
decrypt(in_file, out_file, password)