我应该通过使用Java将EBCDIC文件转换为ASCII。到目前为止,我有以下代码:
public class Migration {
InputStreamReader reader;
StringBuilder builder;
public Migration(){
try {
reader = new InputStreamReader(new FileInputStream("C:\\TI3\\Legacy Systemen\\Week 3\\Oefening 3\\inputfile.dat"),
java.nio.charset.Charset.forName("ibm500") );
} catch(FileNotFoundException e){
e.printStackTrace();
}
builder = new StringBuilder();
}
public void read() throws IOException {
int theInt;
while((theInt = reader.read()) != -1){
char theChar = (char) theInt;
builder.append(theChar);
}
reader.close();
}
@Override
public String toString(){
return builder.toString();
}
}
文件描述如下:
02 KDGEX.
05 B1-LENGTH PIC S9(04) USAGE IS COMP.
05 B1-CODE PIC S9(04) USAGE IS COMP.
05 B1-NUMBER PIC X(08).
05 B1-PPR-NAME PIC X(06).
05 B1-PPR-FED PIC 9(03).
05 B1-PPR-RNR PIC S9(08) USAGE IS COMP.
05 B1-DATA.
10 B1-VBOND PIC 9(02).
10 B1-KONST.
20 B1-AFDEL PIC 9(03).
20 B1-KASSIER PIC 9(03).
20 B1-DATZIT-DM PIC 9(04).
10 B1-BETWYZ PIC X(01).
10 B1-RNR PIC X(13).
10 B1-BETKOD PIC 9(02).
10 B1-VOLGNR-INF PIC 9(02).
10 B1-QUAL-PREST PIC 9(03).
10 B1-REKNUM PIC 9(12).
10 B1-REKNR REDEFINES B1-REKNUM.
20 B1-REKNR-PART1 PIC 9(03).
20 B1-REKNR-PART2 PIC 9(07).
20 B1-REKNR-PART3 PIC 9(02).
10 B1-VOLGNR-M30 PIC 9(03).
10 B1-OMSCHR.
15 B1-OMSCHR1 PIC X(14).
15 B1-OMSCHR2 PIC X(14).
10 B1-OMSCHR-INF REDEFINES B1-OMSCHR.
15 B1-AANT-PREST PIC 9(02).
15 B1-VERSTR PIC 9(01).
15 B1-LASTDATE PIC 9(06).
15 B1-HONOR PIC 9(06).
15 B1-RIJKN PIC X(13).
10 FILLER--1 PIC 9(02).
10 B1-INFOREK PIC 9(01).
10 B1-BEDRAG-EUR PIC 9(08).
10 B1-BEDRAG-DV PIC X(01).
10 B1-BEDRAG-RMG-DV REDEFINES B1-BEDRAG-DV PIC X(01).
05 FILLER PIC X(5).
我们可以忽略每一行的前2个字节。问题是字节存在USAGE IS COMP,因为读者无法正确转换它们,我想我应该将它们读取为字节或其他内容,尽管我不知道如何。
如果我正确地解释了这种格式,则您的二进制文件格式具有固定长度的记录。其中一些记录不是字符数据(COBOL计算字段?)
因此,您将不得不使用更底层的方法来处理每个记录的各个字段来读取记录:
import java.io.*;
public class Record {
private byte[] kdgex = new byte[2]; // COMP
private byte[] b1code = new byte[2]; // COMP
private byte[] b1number = new byte[8]; // DISPLAY
// other fields
public void read(DataInput data) throws IOException {
data.readFully(kdgex);
data.readFully(b1code);
data.readFully(b1number);
// other fields
}
public void write(DataOutput out) throws IOException {
out.write(kdgex);
out.write(b1code);
out.write(b1number);
// other fields
}
}
在这里,我已将字节数组用于记录的前三个字段,但是您可以在适当的地方使用其他更合适的类型(如a
short
用于带有readShort的第一个字段。)
注意:我对字段宽度的解释可能是错误的; 这只是一个例子。
该DataInputStream类一般用作DataInput中的实现。
由于源编码和目标编码中的所有字符都使用一个八位字节的代码点,因此您应该能够使用以下方法对字符数据字段进行转码:
public static byte[] transcodeField(byte[] source, Charset from, Charset to) {
byte[] result = new String(source, from).getBytes(to);
if (result.length != source.length) {
throw new AssertionError(result.length + "!=" + source.length);
}
return result;
}
我建议使用COBOL标记您的问题(假设这是这种格式的来源),以便其他人可以更权威地谈论数据源的格式。
我正在尝试使用Apache Beam中JRecord中的CobolIoProvider类将EBCDIC文件转换为ASCII。 我正在使用的代码: 代码根据需要读取和转换文件。我只能从本地系统读取cobolfilename和copybookname,它们基本上分别是EBCDIC文件和copybook的路径。但是,当我试图从GCS读取文件时,它失败了,FileNotFoundException--“文
问题内容: 我需要编写一个“简单”实用程序以将ASCII转换为EBCDIC吗? Ascii来自Java,Web和AS400。我周围有一个google,似乎找不到一个简单的解决方案(也许因为没有一个:()。我希望使用开源util或为已经编写的util付费。 这样吧? 谢谢, 史考特 问题答案: JTOpen是IBM Java工具箱的开源版本,它具有访问AS / 400对象的类的集合,包括用于访问本机
我们有PHP服务器代码,在iSeries中端执行SQL语句。 以下是SQL查询的简化版本 查询执行得很好,问题是当使用诸如“sometext”“title”这样的静态字段/值时,结果在PHP中返回时,它们不是所需的格式 谢了! 编辑 根据bucks的建议,我们将用户配置文件CCSID更改为37,而不是65535 解决方案是将用户配置文件改为使用CCSID37,并将服务器作业改为使用CCSID37。
我尝试过使用python 2.6将EBCDIC转换为ASCII,但在这方面存在许多问题,比如压缩字段没有得到转换,记录计数增加。 是否有任何方法转换EBCDIC文件压缩字段到ASCII格式。