Конвертировать EBCDIC String в формат ASCII?

У меня есть плоский файл, который извлекается из таблицы Db2, плоский файл содержит записи как в формате char, так и в упакованном десятичном формате. Как преобразовать упакованные данные в строку Java. Есть ли способ преобразовать все плоский файл в формате ASCII.

4 ответа

EBCDIC - это семейство кодировок. Вам нужно будет более подробно узнать, какая кодировка EBCDIC вам нужна.

Java имеет ряд поддерживаемых кодировок, в том числе:

  • IBM500 / Cp500 - EBCDIC 500V1
  • x-IBM834 / Cp834 - корейская версия только для IBM EBCDIC DBCS (двухбайтовая)
  • IBM1047 / Cp1047 - набор символов Latin-1 для хостов EBCDIC

Попробуйте это и посмотрите, что вы получите. Что-то вроде:

InputStreamReader rdr = new InputStreamReader(new FileInputStream(<your file>), java.nio.Charset.forName("ibm500"));
    while((String line = rdr.readLine()) != null) {
        System.out.println(line);
}

Исходя из PAP, CP037 является кодировкой EBCDIC США.

Также взгляните на проект JRecord. Он позволяет вам читать файл с описанием Cobol или Xml и обрабатывать EBCDIC и Comp-3.

Наконец, вот процедура для преобразования упакованных десятичных байтов в строку. См. Метод getMainframePackedDecimal в Conversion.

Прочитайте файл как строку, запишите его как EBCDIC. Используйте OutputStreamWriter и InputStreamWriter и задайте кодировку в конструкторе.


Я поделился примером кода для вашей справки:

    package mypackage;
    import java.io.UnsupportedEncodingException;
    import java.math.BigInteger;
    public class EtoA {

public static void main(String[] args) throws UnsupportedEncodingException {

    System.out.println("########");
    String edata = "/ÂÄÀ"; //Some EBCDIC string ==> here the OP can provide the content of flat file which the OP pulled from DB2 table 
    System.out.println("ebcdic source to ascii:");
    System.out.println("ebcdic: " + edata);
    String ebcdic_encoding = "IBM-1047"; //Setting the encoding in which the source was encoded
    byte[] result = edata.getBytes(ebcdic_encoding); //Getting the raw bytes of the EBCDIC string by mentioning its encoding
    String output = asHex(result); //Converting the raw bytes into hexadecimal format
    byte[] b = new BigInteger(output, 16).toByteArray(); //Now its easy to convert it into another byte array (mentioning that this is of base16 since it is hexadecimal)
    String ascii = new String(b, "ISO-8859-1"); //Now convert the modified byte array to normal ASCII string using its encoding "ISO-8859-1"
    System.out.println("ascii: " + ascii); //This is the ASCII string which we can use universally in JAVA or wherever 

    //Inter conversions of similar type (ASCII to EBCDIC) are given below:
    System.out.println("########");
    String adata = "abcd";
    System.out.println("ascii source to ebcdic:");
    System.out.println("ascii: " + adata);
    String ascii_encoding = "ISO-8859-1";
    byte[] res = adata.getBytes(ascii_encoding);
    String out = asHex(res);
    byte[] bytebuff = new BigInteger(out, 16).toByteArray();
    String ebcdic = new String(bytebuff, "IBM-1047");
    System.out.println("ebcdic: " + ebcdic);

    //Converting from hexadecimal string to EBCDIC if needed
    System.out.println("########");
    System.out.println("hexcode to ebcdic");
    String hexinput = "81828384"; //Hexadecimal which we are converting to EBCDIC
    System.out.println("hexinput: " + hexinput);
    byte[] buffer = new BigInteger(hexinput, 16).toByteArray();
    String eout = new String(buffer, "IBM-1047");
    System.out.println("ebcdic out:" + eout);

    //Converting from hexadecimal string to ASCII if needed
    System.out.println("########");
    System.out.println("hexcode to ascii");
    String hexin = "61626364";
    System.out.println("hexin: " + hexin);
    byte[] buff = new BigInteger(hexin, 16).toByteArray();
    String asciiout = new String(buff, "ISO-8859-1");
    System.out.println("ascii out:" + asciiout);
}

//This asHex method converts the given byte array to a String of Hexadecimal equivalent
public static String asHex(byte[] buf) {
    char[] HEX_CHARS = "0123456789abcdef".toCharArray();
    char[] chars = new char[2 * buf.length];
    for (int i = 0; i < buf.length; ++i) {
        chars[2 * i] = HEX_CHARS[(buf[i] & 0xF0) >>> 4];
        chars[2 * i + 1] = HEX_CHARS[buf[i] & 0x0F];
    }
    return new String(chars);
}
}
Другие вопросы по тегам