В Java, как я могу преобразовать байтовый массив в строку шестнадцатеричных цифр, сохраняя ведущие нули?

Я работаю с примером кода Java для создания хэшей md5. Одна часть преобразует результаты из байтов в строку шестнадцатеричных цифр:

byte messageDigest[] = algorithm.digest();     
StringBuffer hexString = new StringBuffer();
for (int i=0;i<messageDigest.length;i++) {
    hexString.append(Integer.toHexString(0xFF & messageDigest[i]));
    }

Однако это не совсем работает, поскольку toHexString, по-видимому, сбрасывает начальные нули. Итак, как проще всего перейти от байтового массива к шестнадцатеричной строке, которая поддерживает ведущие нули?

28 ответов

Решение

Простой подход - проверить, сколько цифр выводится Integer.toHexString() и добавьте начальный ноль к каждому байту, если необходимо. Что-то вроде этого:

public static String toHexString(byte[] bytes) {
    StringBuilder hexString = new StringBuilder();

    for (int i = 0; i < bytes.length; i++) {
        String hex = Integer.toHexString(0xFF & bytes[i]);
        if (hex.length() == 1) {
            hexString.append('0');
        }
        hexString.append(hex);
    }

    return hexString.toString();
}

Проверьте кодек Apache Commons Hex.encodeHex. Тип возврата char[], которые могут быть легко преобразованы в String, Так:

import org.apache.commons.codec.binary;

Hex.encodeHexString(messageDigest);

Вы можете использовать тот, что ниже. Я проверил это с ведущими нулевыми байтами и с начальными отрицательными байтами, а также

public static String toHex(byte[] bytes) {
    BigInteger bi = new BigInteger(1, bytes);
    return String.format("%0" + (bytes.length << 1) + "X", bi);
}

Если вам нужны строчные шестнадцатеричные цифры, используйте "x" в формате Строка.

Использование DatatypeConverter.printHexBinary(), Вы можете прочитать его документацию в http://docs.oracle.com/javase/6/docs/api/javax/xml/bind/DatatypeConverter.html

Например:

byte bytes[] = {(byte)0, (byte)0, (byte)134, (byte)0, (byte)61};
System.out.println(javax.xml.bind.DatatypeConverter.printHexBinary(bytes));

Приведет к:

000086003D

Мне понравились представления Стива, но он мог обойтись без пары переменных и сохранить несколько строк в процессе.

public static String toHexString(byte[] bytes) {
    char[] hexArray = {'0','1','2','3','4','5','6','7','8','9','A','B','C','D','E','F'};
    char[] hexChars = new char[bytes.length * 2];
    int v;
    for ( int j = 0; j < bytes.length; j++ ) {
        v = bytes[j] & 0xFF;
        hexChars[j*2] = hexArray[v/16];
        hexChars[j*2 + 1] = hexArray[v%16];
    }
    return new String(hexChars);
}

Что мне нравится в этом, так это то, что легко увидеть, что именно он делает (вместо того, чтобы полагаться на какое-то волшебное преобразование черного ящика BigInteger), и вам также не нужно беспокоиться о угловых случаях, таких как начальные нули и прочее. Эта процедура берет каждый 4-битный кусок и превращает его в шестнадцатеричный символ. И он использует поиск по таблице, так что это, вероятно, быстро. Возможно, это будет быстрее, если вы замените v/16 и v%16 битовыми сдвигами и AND, но сейчас мне лень это проверять.

Я обнаружил, что Integer.toHexString немного медленный. Если вы конвертируете много байтов, вы можете рассмотреть возможность создания массива строк, содержащих "00".."FF" и использования целого числа в качестве индекса. Т.е.

hexString.append(hexArray[0xFF & messageDigest[i]]);

Это быстрее и обеспечивает правильную длину. Просто требуется массив строк:

String[] hexArray = {
"00","01","02","03","04","05","06","07","08","09","0A","0B","0C","0D","0E","0F",
"10","11","12","13","14","15","16","17","18","19","1A","1B","1C","1D","1E","1F",
"20","21","22","23","24","25","26","27","28","29","2A","2B","2C","2D","2E","2F",
"30","31","32","33","34","35","36","37","38","39","3A","3B","3C","3D","3E","3F",
"40","41","42","43","44","45","46","47","48","49","4A","4B","4C","4D","4E","4F",
"50","51","52","53","54","55","56","57","58","59","5A","5B","5C","5D","5E","5F",
"60","61","62","63","64","65","66","67","68","69","6A","6B","6C","6D","6E","6F",
"70","71","72","73","74","75","76","77","78","79","7A","7B","7C","7D","7E","7F",
"80","81","82","83","84","85","86","87","88","89","8A","8B","8C","8D","8E","8F",
"90","91","92","93","94","95","96","97","98","99","9A","9B","9C","9D","9E","9F",
"A0","A1","A2","A3","A4","A5","A6","A7","A8","A9","AA","AB","AC","AD","AE","AF",
"B0","B1","B2","B3","B4","B5","B6","B7","B8","B9","BA","BB","BC","BD","BE","BF",
"C0","C1","C2","C3","C4","C5","C6","C7","C8","C9","CA","CB","CC","CD","CE","CF",
"D0","D1","D2","D3","D4","D5","D6","D7","D8","D9","DA","DB","DC","DD","DE","DF",
"E0","E1","E2","E3","E4","E5","E6","E7","E8","E9","EA","EB","EC","ED","EE","EF",
"F0","F1","F2","F3","F4","F5","F6","F7","F8","F9","FA","FB","FC","FD","FE","FF"};

Я бы использовал что-то вроде этого для фиксированной длины, например, хэши:

md5sum = String.format("%032x", new BigInteger(1, md.digest()));

0 в маске делает отступы...

Я искал то же самое... несколько хороших идей здесь, но я провел несколько микро-тестов. Я обнаружил, что следующее является самым быстрым (изменено по сравнению с Айманом выше и примерно в 2 раза быстрее, и примерно на 50% быстрее, чем Стив чуть выше этого):

public static String hash(String text, String algorithm)
        throws NoSuchAlgorithmException {
    byte[] hash = MessageDigest.getInstance(algorithm).digest(text.getBytes());
    return new BigInteger(1, hash).toString(16);
}

Редактировать: Упс - пропустил, что это по сути то же самое, что и kgiannakakis, и поэтому может лишить лидирующие 0. Тем не менее, изменив это на следующее, он по-прежнему самый быстрый:

public static String hash(String text, String algorithm)
        throws NoSuchAlgorithmException {
    byte[] hash = MessageDigest.getInstance(algorithm).digest(text.getBytes());
    BigInteger bi = new BigInteger(1, hash);
    String result = bi.toString(16);
    if (result.length() % 2 != 0) {
        return "0" + result;
    }
    return result;
}
static String toHex(byte[] digest) {
    StringBuilder sb = new StringBuilder();
    for (byte b : digest) {
        sb.append(String.format("%1$02X", b));
    }

    return sb.toString();
}
String result = String.format("%0" + messageDigest.length + "s", hexString.toString())

Это самое короткое решение, учитывая то, что у вас уже есть. Если бы вы могли преобразовать байтовый массив в числовое значение, String.format может преобразовать его в шестнадцатеричную строку одновременно.

Гуава тоже делает это довольно просто:

BaseEncoding.base16().encode( bytes );

Это хорошая альтернатива, когда Apache Commons недоступен. У этого также есть некоторые хорошие средства управления выводом как:

byte[] bytes = new byte[] { 0xa, 0xb, 0xc, 0xd, 0xe, 0xf };
BaseEncoding.base16().lowerCase().withSeparator( ":", 2 ).encode( bytes );
// "0a:0b:0c:0d:0e:0f"

Это решение немного старше школы, и должно быть эффективным с точки зрения памяти.

public static String toHexString(byte bytes[]) {
    if (bytes == null) {
        return null;
    }

    StringBuffer sb = new StringBuffer();
    for (int iter = 0; iter < bytes.length; iter++) {
        byte high = (byte) ( (bytes[iter] & 0xf0) >> 4);
        byte low =  (byte)   (bytes[iter] & 0x0f);
        sb.append(nibble2char(high));
        sb.append(nibble2char(low));
    }

    return sb.toString();
}

private static char nibble2char(byte b) {
    byte nibble = (byte) (b & 0x0f);
    if (nibble < 10) {
        return (char) ('0' + nibble);
    }
    return (char) ('a' + nibble - 10);
}

Другой вариант

public static String toHexString(byte[]bytes) {
    StringBuilder sb = new StringBuilder(bytes.length*2);
    for(byte b: bytes)
      sb.append(Integer.toHexString(b+0x800).substring(1));
    return sb.toString();
}
static String toHex(byte[] digest) {
    String digits = "0123456789abcdef";
    StringBuilder sb = new StringBuilder(digest.length * 2);
    for (byte b : digest) {
        int bi = b & 0xff;
        sb.append(digits.charAt(bi >> 4));
        sb.append(digits.charAt(bi & 0xf));
    }
    return sb.toString();
}

Чтобы сохранить ведущие нули, вот небольшой вариант того, что предложил Пол (например, хэш md5):

public static String MD5hash(String text) throws NoSuchAlgorithmException {
    byte[] hash = MessageDigest.getInstance("MD5").digest(text.getBytes());
    return String.format("%032x",new BigInteger(1, hash));
}

Ой, это выглядит хуже, чем то, что предложил Айман, извините за это

Похоже, функции concat и append могут быть очень медленными. Следующее было НАМНОГО быстрее для меня (чем мой предыдущий пост). Переход к массиву символов в построении вывода был ключевым фактором для его ускорения. Я не сравнивал Hex.encodeHex, предложенный Брэндоном Дюретом.

public static String toHexString(byte[] bytes) {
    char[] hexArray = {'0','1','2','3','4','5','6','7','8','9','A','B','C','D','E','F'};
    char[] hexChars = new char[10000000];
    int c = 0;
    int v;
    for ( j = 0; j < bytes.length; j++ ) {
        v = bytes[j] & 0xFF;
        hexChars[c] = hexArray[v/16];
        c++;
        hexChars[c] = hexArray[v%16];
        c++;
    }
    return new String(hexChars, 0, c); }

Это то, что я использую для хэшей MD5:

public static String getMD5(String filename)
        throws NoSuchAlgorithmException, IOException {
    MessageDigest messageDigest = 
        java.security.MessageDigest.getInstance("MD5");

    InputStream in = new FileInputStream(filename);

    byte [] buffer = new byte[8192];
    int len = in.read(buffer, 0, buffer.length);

    while (len > 0) {
        messageDigest.update(buffer, 0, len);
        len = in.read(buffer, 0, buffer.length);
    }
    in.close();

    return new BigInteger(1, messageDigest.digest()).toString(16);
}

РЕДАКТИРОВАТЬ: Я проверил, и я заметил, что с этим также сокращаются конечные нули. Но это может произойти только в начале, поэтому вы можете сравнить с ожидаемой длиной и площадкой соответственно.

Это решение не требует сдвига или маскирования битов, таблиц поиска или внешних библиотек, и оно настолько короткое, насколько я могу получить:

byte[] digest = new byte[16];       

Formatter fmt = new Formatter();    
for (byte b : digest) { 
  fmt.format("%02X", b);    
}

fmt.toString()

Вы можете писать меньше без внешних библиотек:

String hex = (new HexBinaryAdapter()).marshal(md5.digest(YOUR_STRING.getBytes()))
byte messageDigest[] = algorithm.digest();
StringBuffer hexString = new StringBuffer();
for (int i = 0; i < messageDigest.length; i++) {
    String hexByte = Integer.toHexString(0xFF & messageDigest[i]);
    int numDigits = 2 - hexByte.length();
    while (numDigits-- > 0) {
        hexString.append('0');
    }
    hexString.append(hexByte);
}

И как вы можете преобразовать обратно из ascii в байтовый массив?

я следовал следующему коду для преобразования в ascii, данный Jemenake.

public static String toHexString(byte[] bytes) {
    char[] hexArray = {'0','1','2','3','4','5','6','7','8','9','A','B','C','D','E','F'};
    char[] hexChars = new char[bytes.length * 2];
    int v;
    for ( int j = 0; j < bytes.length; j++ ) {
        v = bytes[j] & 0xFF;
        hexChars[j*2] = hexArray[v/16];
        hexChars[j*2 + 1] = hexArray[v%16];
    }
    return new String(hexChars);
}

ИМХО все вышеупомянутые решения, которые предоставляют фрагменты для удаления ведущих нулей, неверны.

byte messageDigest[] = algorithm.digest();
for (int i = 0; i < messageDigest.length; i++) {
    hexString.append(Integer.toHexString(0xFF & messageDigest[i]));
}    

Согласно этому фрагменту, 8 битов берутся из байтового массива за итерацию, преобразуются в целое число (поскольку функция Integer.toHexString принимает в качестве аргумента int), а затем это целое число преобразуется в соответствующее значение хеш-функции. Так, например, если у вас есть 00000001 00000001 в двоичном формате, в соответствии с кодом, переменная hexString будет иметь значение 0x11 в качестве шестнадцатеричного значения, тогда как правильное значение должно быть 0x0101. Таким образом, при вычислении MD5 мы можем получить хэши длиной <32 байта (из-за пропущенных нулей), которые могут не удовлетворять криптографически уникальным свойствам, которые делает хэш MD5.

Решением проблемы является замена приведенного выше фрагмента кода следующим фрагментом:

byte messageDigest[] = algorithm.digest();
for (int i = 0; i < messageDigest.length; i++) {
    int temp=0xFF & messageDigest[i];
    String s=Integer.toHexString(temp);
    if(temp<=0x0F){
        s="0"+s;
    }
    hexString.append(s);
}

Это даст строку длиной в два символа для байта.

public String toString(byte b){
    final char[] Hex = new String("0123456789ABCDEF").toCharArray();
    return  "0x"+ Hex[(b & 0xF0) >> 4]+ Hex[(b & 0x0F)];
}

Мой вариант

    StringBuilder builder = new StringBuilder();
    for (byte b : bytes)
    {
        builder.append(Character.forDigit(b/16, 16));
        builder.append(Character.forDigit(b % 16, 16));
    }
    System.out.println(builder.toString());

меня устраивает.

Или вы можете сделать это:

byte[] digest = algorithm.digest();
StringBuilder byteContet = new StringBuilder();
for(byte b: digest){
 byteContent = String.format("%02x",b);
 byteContent.append(byteContent);
}

Это коротко, просто и в основном просто смена формата.

Я удивлен, что никто не придумал следующее решение:

StringWriter sw = new StringWriter();
com.sun.corba.se.impl.orbutil.HexOutputStream hex = new com.sun.corba.se.impl.orbutil.HexOutputStream(sw);
hex.write(byteArray);
System.out.println(sw.toString());

Это ошибочное решение? (Android Java)

    // Create MD5 Hash
    MessageDigest digest = java.security.MessageDigest.getInstance("MD5");
    digest.update(s.getBytes());
    byte[] md5sum = digest.digest();
    BigInteger bigInt = new BigInteger(1, md5sum);
    String stringMD5 = bigInt.toString(16);
    // Fill to 32 chars
    stringMD5 = String.format("%32s", stringMD5).replace(' ', '0');
    return stringMD5;

Так что в основном он заменяет пробелы на 0.

Это также эквивалентно, но более кратко, используя Apache с утилитой HexBin, где код сокращается до

HexBin.encode(messageDigest).toLowerCase();
Другие вопросы по тегам