当前位置：首页 > 工具软件 > jdbf > 使用案例 >

JDBF不能读取中文问题的解决方法

丁业

2023-12-01

JDBF对于数据的读取采用了UNICODE字符集，所以读取数据的时候不存在问题。关键在于对字段的读取不兼容中文。
打开JDBF的源码就知道，它是把.dbf作为文件流的形式读进来的，但是我不明白它为什么读取字段和读取数据要分两种方式。读取字段的时候它是这样的：从文件流中一个一个byte(字节)地读取信息，却画蛇添足地把每个字节强行转化为字符(char)型，然后再把这一传char拼接成一个String字段。
这样就有问题了，在JAVA中一个char的大小是一个byte的两倍，这样的话，就相当于每个char的高位填入了一个为0000的空byte，对于使用高位的中文字符集来说，它就相当于每次读取了半个中文字符，然后就把这半个字符用补零的方法转换成整个中文字符，这就是JDBF不能读取中文字段名的原因。（所幸的是它在读取数据的时候却没有采用逐个byte读取的方式，所以不会出现问题。）
还有一点幸运的是，它读进来的字段虽然是错的，但是字段里面所含的信息没有丢失，我们只要把它人为填加的0000空byte去掉就可以转回真正的中文。
知道了原因，就很好解决了，下面是我写的一个转换函数，你在通过String columnName=DBFReader.getField(i).getName()得到每一个字段的时候使用这个函数转换，就可以转回正确的汉字。

//遍历字串的每一个char，转换成byte后组合成byte[]，再转换成String返回
//可以解决因逐个读入char（而不是byte）而组成的字串不能通过encoding还原成中文的问题

public String getStrByCharToByte(String str) {
byte[] temp = new byte[str.length()];
for (int i = 0; i < str.length(); i++) {
temp[i] = (byte) (str.charAt(i));
}
return new String(temp);
}

类似资料：

相关阅读

虚拟机中ubuntu不能联网问题的解决方法解决pandas使用read_csv()读取文件遇到的问题 Hyper-V虚拟机不能上网问题的解决方法 Java读取、写入文件如何解决乱码问题 Mysql中文乱码问题的最佳解决方法

相关文章

[SpringBoot] 解决Redis相关问题 Hadoop 50070 无法访问问题解决汇总 2.4.8 ListView之checkbox错位问题解决树链剖分解决什么问题？yml文件读取方式-2

相关问答

javascript - json文件读取问题？JFrame解决问题读取从csv文件生成图形时出现问题。不会读取CSV文件的标题在python中读取德语csv文件的问题 Jeter中从CSV文件中读取数据的问题

相关文档

小能在线客服官方中文文档 Ruby 源码解读 GitBook 中文解說 LeetCode 题解 Sublime 官方中文文档