Преобразовать строковое представление шестнадцатеричного дампа в байтовый массив, используя Java?
Я ищу способ преобразовать длинную строку (из дампа), которая представляет шестнадцатеричные значения в байтовом массиве.
Я не мог бы сформулировать это лучше, чем человек, который разместил здесь тот же вопрос.
Но чтобы сохранить оригинальность, я сформулирую это по-своему: предположим, у меня есть строка "00A0BF"
что я хотел бы интерпретировать как
byte[] {0x00,0xA0,0xBf}
что я должен делать?
Я новичок в Java и в конечном итоге использовать BigInteger
и следя за ведущими шестнадцатеричными нулями. Но я думаю, что это ужасно, и я уверен, что упускаю что-то простое.
26 ответов
Вот решение, которое я считаю лучше, чем любое опубликованное до сих пор:
public static byte[] hexStringToByteArray(String s) {
int len = s.length();
byte[] data = new byte[len / 2];
for (int i = 0; i < len; i += 2) {
data[i / 2] = (byte) ((Character.digit(s.charAt(i), 16) << 4)
+ Character.digit(s.charAt(i+1), 16));
}
return data;
}
Причины, почему это улучшение:
Сейф с ведущими нулями (в отличие от BigInteger) и с отрицательными значениями байтов (в отличие от Byte.parseByte)
Не конвертирует строку в
char[]
или создать объекты StringBuilder и String для каждого байта.Нет библиотечных зависимостей, которые могут быть недоступны
Не стесняйтесь добавлять проверку аргументов через assert
или исключения, если аргумент не известен как безопасный.
Однострочники:
import javax.xml.bind.DatatypeConverter;
public static String toHexString(byte[] array) {
return DatatypeConverter.printHexBinary(array);
}
public static byte[] toByteArray(String s) {
return DatatypeConverter.parseHexBinary(s);
}
Предупреждения:
- в Java 9 Jigsaw это больше не является частью (по умолчанию) корневого набора java.se, поэтому оно приведет к исключению ClassNotFoundException, если вы не укажете --add-modules java.se.ee (благодаря @
eckes
) - Недоступно на Android (благодаря
Fabian
чтобы отметить это), но вы можете просто взять исходный код, если вашей системе не хватаетjavax.xml
по какой-то причине. Благодаря @Bert Regelink
для извлечения источника.
Класс Hex в commons-codec должен сделать это за вас.
http://commons.apache.org/codec/
import org.apache.commons.codec.binary.Hex;
...
byte[] decoded = Hex.decodeHex("00A0BF");
// 0x00 0xA0 0xBF
Теперь вы можете использовать BaseEncoding в guava
чтобы сделать это.
BaseEncoding.base16().decode(string);
Чтобы изменить это, используйте
BaseEncoding.base16().encode(bytes);
На самом деле, я думаю, что BigInteger - это очень хорошее решение:
new BigInteger("00A0BF", 16).toByteArray();
Изменить: не безопасно для ведущих нулей, как отмечено на плакате.
Однострочники:
import javax.xml.bind.DatatypeConverter; public static String toHexString(byte[] array) { return DatatypeConverter.printHexBinary(array); } public static byte[] toByteArray(String s) { return DatatypeConverter.parseHexBinary(s); }
Для тех из вас, кто интересуется реальным кодом One-liners от Vladislav Rastrusny (мне нужно было это, поскольку javax.xml.bind недоступен для Android (по умолчанию)), это происходит из http://www.docjar.com/html/api/com/sun/xml/internal/bind/DatatypeConverterImpl.java.html:
public byte[] parseHexBinary(String s) {
final int len = s.length();
// "111" is not a valid hex encoding.
if( len%2 != 0 )
throw new IllegalArgumentException("hexBinary needs to be even-length: "+s);
byte[] out = new byte[len/2];
for( int i=0; i<len; i+=2 ) {
int h = hexToBin(s.charAt(i ));
int l = hexToBin(s.charAt(i+1));
if( h==-1 || l==-1 )
throw new IllegalArgumentException("contains illegal character for hexBinary: "+s);
out[i/2] = (byte)(h*16+l);
}
return out;
}
private static int hexToBin( char ch ) {
if( '0'<=ch && ch<='9' ) return ch-'0';
if( 'A'<=ch && ch<='F' ) return ch-'A'+10;
if( 'a'<=ch && ch<='f' ) return ch-'a'+10;
return -1;
}
private static final char[] hexCode = "0123456789ABCDEF".toCharArray();
public String printHexBinary(byte[] data) {
StringBuilder r = new StringBuilder(data.length*2);
for ( byte b : data) {
r.append(hexCode[(b >> 4) & 0xF]);
r.append(hexCode[(b & 0xF)]);
}
return r.toString();
}
HexBinaryAdapter
обеспечивает способность маршалировать и демаршализировать между String
а также byte[]
,
import javax.xml.bind.annotation.adapters.HexBinaryAdapter;
public byte[] hexToBytes(String hexString) {
HexBinaryAdapter adapter = new HexBinaryAdapter();
byte[] bytes = adapter.unmarshal(hexString);
return bytes;
}
Это просто пример, который я напечатал... Я на самом деле просто использую его как есть, и мне не нужно создавать отдельный метод для его использования.
Вот метод, который на самом деле работает (на основе нескольких предыдущих полу-правильных ответов):
private static byte[] fromHexString(final String encoded) {
if ((encoded.length() % 2) != 0)
throw new IllegalArgumentException("Input string must contain an even number of characters");
final byte result[] = new byte[encoded.length()/2];
final char enc[] = encoded.toCharArray();
for (int i = 0; i < enc.length; i += 2) {
StringBuilder curr = new StringBuilder(2);
curr.append(enc[i]).append(enc[i + 1]);
result[i/2] = (byte) Integer.parseInt(curr.toString(), 16);
}
return result;
}
Единственная возможная проблема, которую я вижу, - это если строка ввода очень длинная; вызов toCharArray() делает копию внутреннего массива строки.
РЕДАКТИРОВАТЬ: Да, и, кстати, байты подписаны в Java, поэтому ваша входная строка преобразуется в [0, -96, -65] вместо [0, 160, 191]. Но вы, наверное, уже знали это.
BigInteger()
Метод из java.math очень медленный и не рекомендуется.
Integer.parseInt(HEXString, 16)
может вызвать проблемы с некоторыми символами без преобразования в цифру / целое число
Хорошо работающий метод:
Integer.decode("0xXX") .byteValue()
Функция:
public static byte[] HexStringToByteArray(String s) {
byte data[] = new byte[s.length()/2];
for(int i=0;i < s.length();i+=2) {
data[i/2] = (Integer.decode("0x"+s.charAt(i)+s.charAt(i+1))).byteValue();
}
return data;
}
Удачи, удачи
РЕДАКТИРОВАТЬ: как указано @mmyers, этот метод не работает на вводе, который содержит подстроки, соответствующие байтам с установленным старшим битом ("80" - "FF"). Объяснение находится в Идентификаторе ошибки: 6259307 Byte.parseByte не работает как объявлено в Документации SDK.
public static final byte[] fromHexString(final String s) {
byte[] arr = new byte[s.length()/2];
for ( int start = 0; start < s.length(); start += 2 )
{
String thisByte = s.substring(start, start+2);
arr[start/2] = Byte.parseByte(thisByte, 16);
}
return arr;
}
Для чего стоит, вот еще одна версия, которая поддерживает строки нечетной длины, не прибегая к конкатенации строк.
public static byte[] hexStringToByteArray(String input) {
int len = input.length();
if (len == 0) {
return new byte[] {};
}
byte[] data;
int startIdx;
if (len % 2 != 0) {
data = new byte[(len / 2) + 1];
data[0] = (byte) Character.digit(input.charAt(0), 16);
startIdx = 1;
} else {
data = new byte[len / 2];
startIdx = 0;
}
for (int i = startIdx; i < len; i += 2) {
data[(i + 1) / 2] = (byte) ((Character.digit(input.charAt(i), 16) << 4)
+ Character.digit(input.charAt(i+1), 16));
}
return data;
}
Мне нравится решение Character.digit, но вот как я его решил
public byte[] hex2ByteArray( String hexString ) {
String hexVal = "0123456789ABCDEF";
byte[] out = new byte[hexString.length() / 2];
int n = hexString.length();
for( int i = 0; i < n; i += 2 ) {
//make a bit representation in an int of the hex value
int hn = hexVal.indexOf( hexString.charAt( i ) );
int ln = hexVal.indexOf( hexString.charAt( i + 1 ) );
//now just shift the high order nibble and add them together
out[i/2] = (byte)( ( hn << 4 ) | ln );
}
return out;
}
Если вам нужно больше, чем просто случайное преобразование, вы можете использовать .
Пример:
byte[] byteArray = Hex.hexStrToBytes("00A0BF");
Это самый простой случай. Ваш ввод может содержать разделители (например, MAC-адреса, отпечатки сертификатов и т. д.), ваш ввод может быть потоковым и т. д. В таких случаях становится легче оправдать использование внешней библиотеки, такой как HexUtilsHexUtils , какой бы маленькой она ни была.
С JDK 17 класс HexFormat удовлетворит большинство потребностей, и потребность в чем-то вроде HexUtils значительно уменьшится. Тем не менее, HexUtils по-прежнему можно использовать для таких вещей, как преобразование очень больших сумм в/из шестнадцатеричного (потоковая передача) или красивой печати шестнадцатеричного (например, дампы проводов), что не может сделать класс JDK HexFormat.
(полное раскрытие: я автор HexUtils)
Кодекс, представленный Бертом Регелинком, просто не работает. Попробуйте следующее:
import javax.xml.bind.DatatypeConverter;
import java.io.*;
public class Test
{
@Test
public void testObjectStreams( ) throws IOException, ClassNotFoundException
{
ByteArrayOutputStream baos = new ByteArrayOutputStream();
ObjectOutputStream oos = new ObjectOutputStream(baos);
String stringTest = "TEST";
oos.writeObject( stringTest );
oos.close();
baos.close();
byte[] bytes = baos.toByteArray();
String hexString = DatatypeConverter.printHexBinary( bytes);
byte[] reconvertedBytes = DatatypeConverter.parseHexBinary(hexString);
assertArrayEquals( bytes, reconvertedBytes );
ByteArrayInputStream bais = new ByteArrayInputStream(reconvertedBytes);
ObjectInputStream ois = new ObjectInputStream(bais);
String readString = (String) ois.readObject();
assertEquals( stringTest, readString);
}
}
Я всегда использовал такой метод, как
public static final byte[] fromHexString(final String s) {
String[] v = s.split(" ");
byte[] arr = new byte[v.length];
int i = 0;
for(String val: v) {
arr[i++] = Integer.decode("0x" + val).byteValue();
}
return arr;
}
этот метод разбивает на шестнадцатеричные значения, разделенные пробелом, но было бы нетрудно разбить строку по любому другому критерию, например, на группы из двух символов.
Если в качестве стиля кодирования вы предпочитаете потоки Java 8, этого можно достичь, используя только примитивы JDK.
String hex = "0001027f80fdfeff";
byte[] converted = IntStream.range(0, hex.length() / 2)
.map(i -> Character.digit(hex.charAt(i * 2), 16) << 4 | Character.digit(hex.charAt((i * 2) + 1), 16))
.collect(ByteArrayOutputStream::new,
ByteArrayOutputStream::write,
(s1, s2) -> s1.write(s2.toByteArray(), 0, s2.size()))
.toByteArray();
, 0, s2.size()
параметры в функции конкатенации коллектора могут быть опущены, если вы не возражаете против IOException
,
Основываясь на предложенном решении, следующее должно быть немного более эффективным:
public static byte [] hexStringToByteArray (final String s) {
if (s == null || (s.length () % 2) == 1)
throw new IllegalArgumentException ();
final char [] chars = s.toCharArray ();
final int len = chars.length;
final byte [] data = new byte [len / 2];
for (int i = 0; i < len; i += 2) {
data[i / 2] = (byte) ((Character.digit (chars[i], 16) << 4) + Character.digit (chars[i + 1], 16));
}
return data;
}
Потому что: первоначальное преобразование в массив char избавляет от проверки длины в charAt
Я обнаружил, что Kernel Panic предлагает наиболее полезное для меня решение, но столкнулся с проблемами, если шестнадцатеричная строка была нечетным числом. решил это так:
boolean isOdd(int value)
{
return (value & 0x01) !=0;
}
private int hexToByte(byte[] out, int value)
{
String hexVal = "0123456789ABCDEF";
String hexValL = "0123456789abcdef";
String st = Integer.toHexString(value);
int len = st.length();
if (isOdd(len))
{
len+=1; // need length to be an even number.
st = ("0" + st); // make it an even number of chars
}
out[0]=(byte)(len/2);
for (int i =0;i<len;i+=2)
{
int hh = hexVal.indexOf(st.charAt(i));
if (hh == -1) hh = hexValL.indexOf(st.charAt(i));
int lh = hexVal.indexOf(st.charAt(i+1));
if (lh == -1) lh = hexValL.indexOf(st.charAt(i+1));
out[(i/2)+1] = (byte)((hh << 4)|lh);
}
return (len/2)+1;
}
Я добавляю количество шестнадцатеричных чисел в массив, поэтому я передаю ссылку на массив, который я использую, и int мне нужно конвертировать и возвращать относительную позицию следующего шестнадцатеричного числа. Таким образом, последний байтовый массив имеет [0] количество шестнадцатеричных пар, [1...] шестнадцатеричных пар, затем количество пар...
Я знаю, что это очень старая тема, но все же хотел бы добавить свою копейку.
Если мне действительно нужно кодировать простую шестнадцатеричную строку в двоичный преобразователь, я бы хотел сделать это следующим образом.
public static byte[] hexToBinary(String s){
/*
* skipped any input validation code
*/
byte[] data = new byte[s.length()/2];
for( int i=0, j=0;
i<s.length() && j<data.length;
i+=2, j++)
{
data[j] = (byte)Integer.parseInt(s.substring(i, i+2), 16);
}
return data;
}
Поздно до вечеринки, но я объединил приведенный выше ответ DaveL в класс с обратным действием - на всякий случай, если это поможет.
public final class HexString {
private static final char[] digits = "0123456789ABCDEF".toCharArray();
private HexString() {}
public static final String fromBytes(final byte[] bytes) {
final StringBuilder buf = new StringBuilder();
for (int i = 0; i < bytes.length; i++) {
buf.append(HexString.digits[(bytes[i] >> 4) & 0x0f]);
buf.append(HexString.digits[bytes[i] & 0x0f]);
}
return buf.toString();
}
public static final byte[] toByteArray(final String hexString) {
if ((hexString.length() % 2) != 0) {
throw new IllegalArgumentException("Input string must contain an even number of characters");
}
final int len = hexString.length();
final byte[] data = new byte[len / 2];
for (int i = 0; i < len; i += 2) {
data[i / 2] = (byte) ((Character.digit(hexString.charAt(i), 16) << 4)
+ Character.digit(hexString.charAt(i + 1), 16));
}
return data;
}
}
И тестовый класс JUnit:
public class TestHexString {
@Test
public void test() {
String[] tests = {"0FA1056D73", "", "00", "0123456789ABCDEF", "FFFFFFFF"};
for (int i = 0; i < tests.length; i++) {
String in = tests[i];
byte[] bytes = HexString.toByteArray(in);
String out = HexString.fromBytes(bytes);
System.out.println(in); //DEBUG
System.out.println(out); //DEBUG
Assert.assertEquals(in, out);
}
}
}
public static byte[] hex2ba(String sHex) throws Hex2baException {
if (1==sHex.length()%2) {
throw(new Hex2baException("Hex string need even number of chars"));
}
byte[] ba = new byte[sHex.length()/2];
for (int i=0;i<sHex.length()/2;i++) {
ba[i] = (Integer.decode(
"0x"+sHex.substring(i*2, (i+1)*2))).byteValue();
}
return ba;
}
Мое официальное решение:
/**
* Decodes a hexadecimally encoded binary string.
* <p>
* Note that this function does <em>NOT</em> convert a hexadecimal number to a
* binary number.
*
* @param hex Hexadecimal representation of data.
* @return The byte[] representation of the given data.
* @throws NumberFormatException If the hexadecimal input string is of odd
* length or invalid hexadecimal string.
*/
public static byte[] hex2bin(String hex) throws NumberFormatException {
if (hex.length() % 2 > 0) {
throw new NumberFormatException("Hexadecimal input string must have an even length.");
}
byte[] r = new byte[hex.length() / 2];
for (int i = hex.length(); i > 0;) {
r[i / 2 - 1] = (byte) (digit(hex.charAt(--i)) | (digit(hex.charAt(--i)) << 4));
}
return r;
}
private static int digit(char ch) {
int r = Character.digit(ch, 16);
if (r < 0) {
throw new NumberFormatException("Invalid hexadecimal string: " + ch);
}
return r;
}
Это как функция PHP hex2bin(), но в стиле Java.
Пример:
String data = new String(hex2bin("6578616d706c65206865782064617461"));
// data value: "example hex data"
Далеко не самое чистое решение. Но это работает для меня и хорошо отформатировано:
private String createHexDump(byte[] msg, String description) {
System.out.println();
String result = "\n" + description;
int currentIndex = 0;
for(int i=0 ; i<msg.length ; i++){
currentIndex++;
if(i == 0){
result += String.format("\n %04x ", i);
}
if(i % 16 == 0 && i != 0){
result += " | ";
for(int j=(i-16) ; j<msg.length && j<i ; j++) {
char characterToAdd = (char) msg[j];
if (characterToAdd == '\n') {
characterToAdd = ' ';
}
result += characterToAdd;
}
result += String.format("\n %04x ", i);
}
result += String.format("%02x ", msg[i]);
}
if(currentIndex % 16 != 0){
int fitIns = msg.length / 16;
int leftOvers = msg.length - (fitIns * 16);
for(int i=0 ; i<16-leftOvers ; i++){
result += " ";
}
result += " | ";
for(int i=msg.length-leftOvers ; i<msg.length ; i++){
char characterToAdd = (char) msg[i];
if (characterToAdd == '\n') {
characterToAdd = ' ';
}
result += characterToAdd;
}
}
result += "\n";
return result;
}
Выход:
S -> C
0000 0b 00 2e 06 4d 6f 72 69 74 7a 53 6f 6d 65 20 54 | .Heyyy Some T
0010 43 50 20 73 74 75 66 66 20 49 20 63 61 70 74 75 | CP stuff I captu
0020 72 65 64 2e 2e 77 65 6c 6c 20 66 6f 72 6d 61 74 | red..well format
0030 3f | ?
Для меня это было решение, HEX="FF01", затем разделить на FF(255) и 01(01)
private static byte[] BytesEncode(String encoded) {
//System.out.println(encoded.length());
byte result[] = new byte[encoded.length() / 2];
char enc[] = encoded.toUpperCase().toCharArray();
String curr = "";
for (int i = 0; i < encoded.length(); i=i+2) {
curr = encoded.substring(i,i+2);
System.out.println(curr);
if(i==0){
result[i]=((byte) Integer.parseInt(curr, 16));
}else{
result[i/2]=((byte) Integer.parseInt(curr, 16));
}
}
return result;
}
Я думаю сделаю это для вас. Я собрал его вместе из аналогичной функции, которая возвращала данные в виде строки:
private static byte[] decode(String encoded) {
byte result[] = new byte[encoded/2];
char enc[] = encoded.toUpperCase().toCharArray();
StringBuffer curr;
for (int i = 0; i < enc.length; i += 2) {
curr = new StringBuffer("");
curr.append(String.valueOf(enc[i]));
curr.append(String.valueOf(enc[i + 1]));
result[i] = (byte) Integer.parseInt(curr.toString(), 16);
}
return result;
}