Проблемы с преобразованием байтового массива в строку и обратно в байтовый массив

Question

Проблемы с преобразованием байтового массива в строку и обратно в байтовый массив

Есть много вопросов на эту тему, одно и то же решение, но это не работает для меня. У меня есть простой тест с шифрованием. Само шифрование / дешифрование работает (до тех пор, пока я выполняю этот тест с самим байтовым массивом, а не со строками). Проблема в том, что я не хочу обрабатывать его как байтовый массив, а как String, но когда я кодирую байтовый массив в строку и обратно, результирующий байтовый массив отличается от исходного байтового массива, поэтому дешифрование больше не работает. Я попробовал следующие параметры в соответствующих строковых методах: UTF-8, UTF8, UTF-16, UTF8. Никто из них не работает. Полученный байтовый массив отличается от оригинала. Есть идеи, почему это так?

Encrypter:

public class NewEncrypter
{
    private String algorithm = "DESede";
    private Key key = null;
    private Cipher cipher = null;

    public NewEncrypter() throws NoSuchAlgorithmException, NoSuchPaddingException
    {
         key = KeyGenerator.getInstance(algorithm).generateKey();
         cipher = Cipher.getInstance(algorithm);
    }

    public byte[] encrypt(String input) throws Exception
    {
        cipher.init(Cipher.ENCRYPT_MODE, key);
        byte[] inputBytes = input.getBytes("UTF-16");

        return cipher.doFinal(inputBytes);
    }

    public String decrypt(byte[] encryptionBytes) throws Exception
    {
        cipher.init(Cipher.DECRYPT_MODE, key);
        byte[] recoveredBytes = cipher.doFinal(encryptionBytes);
        String recovered = new String(recoveredBytes, "UTF-16");

        return recovered;
    }
}

Это тест, где я пробую это:

public class NewEncrypterTest
{
    @Test
    public void canEncryptAndDecrypt() throws Exception
    {
        String toEncrypt = "FOOBAR";

        NewEncrypter encrypter = new NewEncrypter();

        byte[] encryptedByteArray = encrypter.encrypt(toEncrypt);
        System.out.println("encryptedByteArray:" + encryptedByteArray);

        String decoded = new String(encryptedByteArray, "UTF-16");
        System.out.println("decoded:" + decoded);

        byte[] encoded = decoded.getBytes("UTF-16");
        System.out.println("encoded:" + encoded);

        String decryptedText = encrypter.decrypt(encoded); //Exception here
        System.out.println("decryptedText:" + decryptedText);

        assertEquals(toEncrypt, decryptedText);
    }
}

61

java string encryption bytearray

Источник

user319773 01 фев '12 в 14:58

4 ответа

Решение

Принятое решение не будет работать, если ваш String имеет некоторые нетипичные charcaters, такие как š, ž, ć, Ō, ō, Ū, так далее.

Следующий код работал хорошо для меня.

byte[] myBytes = Something.getMyBytes();
String encodedString = Base64.encodeToString(bytes, Base64.NO_WRAP);
byte[] decodedBytes = Base64.decode(encodedString, Base64.NO_WRAP);

30

Источник

user412466 15 окт '15 в 15:40

Теперь я тоже нашел другое решение...

    public class NewEncrypterTest
    {
        @Test
        public void canEncryptAndDecrypt() throws Exception
        {
            String toEncrypt = "FOOBAR";

            NewEncrypter encrypter = new NewEncrypter();

            byte[] encryptedByteArray = encrypter.encrypt(toEncrypt);
            String encoded = String.valueOf(Hex.encodeHex(encryptedByteArray));

            byte[] byteArrayToDecrypt = Hex.decodeHex(encoded.toCharArray());
            String decryptedText = encrypter.decrypt(byteArrayToDecrypt); 

            System.out.println("decryptedText:" + decryptedText);

            assertEquals(toEncrypt, decryptedText);
        }
    }

6

Источник

user319773 01 фев '12 в 16:00

Ваша проблема в том, что вы не можете построить строку UTF-16 (или любую другую кодировку) из произвольного байтового массива (см. UTF-16 в Википедии). Однако от вас зависит, чтобы сериализовать и десериализовать зашифрованный байтовый массив без каких-либо потерь, чтобы, скажем, сохранить его и использовать позже. Вот модифицированный клиентский код, который должен дать вам некоторое представление о том, что на самом деле происходит с байтовыми массивами:

public static void main(String[] args) throws Exception {
  String toEncrypt = "FOOBAR";

  NewEncrypter encrypter = new NewEncrypter();

  byte[] encryptedByteArray = encrypter.encrypt(toEncrypt);
  System.out.println("encryptedByteArray:" + Arrays.toString(encryptedByteArray));

  String decoded = new String(encryptedByteArray, "UTF-16");
  System.out.println("decoded:" + decoded);

  byte[] encoded = decoded.getBytes("UTF-16");
  System.out.println("encoded:" + Arrays.toString(encoded));

  String decryptedText = encrypter.decrypt(encryptedByteArray); // NOT the "encoded" value!
  System.out.println("decryptedText:" + decryptedText);
}

Это вывод:

encryptedByteArray:[90, -40, -39, -56, -90, 51, 96, 95, -65, -54, -61, 51, 6, 15, -114, 88]
decoded:<some garbage>
encoded:[-2, -1, 90, -40, -1, -3, 96, 95, -65, -54, -61, 51, 6, 15, -114, 88]
decryptedText:FOOBAR

decryptedText правильно, когда восстановлено из оригинала encryptedByteArray, Обратите внимание, что encoded значение не совпадает с encryptedByteArrayиз-за потери данных во время byte[] -> String("UTF-16")->byte[] преобразование.

0

Источник

user1037767 01 фев '12 в 15:50

Другие вопросы по тегам java string encryption bytearray

user318758 01 фев '12 в 15:53 2012-02-01 15:53 · Accepted Answer · 2012-02-01 15:53

Не стоит хранить зашифрованные данные в строках, потому что они предназначены для читабельного текста, а не для произвольных двоичных данных. Для двоичных данных лучше всего использовать byte[],

Однако, если вы должны сделать это, вы должны использовать кодировку, которая имеет соотношение 1 к 1 между байтами и символами, то есть, где каждая последовательность байтов может быть сопоставлена с уникальной последовательностью символов и обратно. Одним из таких кодировок является ISO-8859-1, то есть:

    String decoded = new String(encryptedByteArray, "ISO-8859-1");
    System.out.println("decoded:" + decoded);

    byte[] encoded = decoded.getBytes("ISO-8859-1"); 
    System.out.println("encoded:" + java.util.Arrays.toString(encoded));

    String decryptedText = encrypter.decrypt(encoded);

Другими распространенными кодировками, которые не теряют данные, являются шестнадцатеричное и base64, но, к сожалению, вам нужна вспомогательная библиотека для них. Стандартный API не определяет классы для них.

С UTF-16 программа потерпит неудачу по двум причинам:

String.getBytes ("UTF-16") добавляет к выводу символ порядка байтов, чтобы определить порядок байтов. Вы должны использовать UTF-16LE или UTF-16BE, чтобы этого не произошло.
Не все последовательности байтов могут быть сопоставлены с символами в UTF-16. Во-первых, текст, закодированный в UTF-16, должен иметь четное количество байтов. Во-вторых, UTF-16 имеет механизм для кодирования символов Юникода за пределами U+FFFF. Это означает, что, например, существуют последовательности из 4 байтов, которые отображаются только на один символ Юникода. Чтобы это было возможно, первые 2 байта из 4 не кодируют никаких символов в UTF-16.