JDBC读取Oracle的US7ASCII编码中文乱码及不同编码下汉字占用字节的问题

时间：2014-11-17 14:08:25 阅读：244 评论：0 收藏：0 [点我收藏+]

数据库版本：Oracle 10g

字符集：SIMPLIFIED CHINESE_CHINA.US7ASCII

JDK：1.6.0_45

Oracle驱动：ojdbc14.jar

使用JDBC操作数据库，获取连接、执行SQL没有问题。但是，查询出来的结果中，所有汉字，均显示为乱码。

debug查看到在数据从数据库中获取出来的时候，就已经是乱码，而使用PL/SQL等工具，均显示正常。

不知是否Oracle的驱动，在进行汉字处理的时候，使用了系统默认的字符集？此时，本着死马当活马医的理念，使用下对汉字的强制转码，ASCII码是标准的ISO-8859-1的子集，也许使用这个ISO-8859-1可以获取到正常的汉字？于是，首先测试使用new String(fieldValue.getBytes("ISO-8859-1"))；输出依然乱码！想想应该是将这东西进行转码，而不仅仅是按照这个格式获取，于是调整为：new String(fieldValue.getBytes("ISO-8859-1"), "GBK")，测试下，搞定！只是，所有用到汉字的地方，均需要这么搞一下，有点麻烦。

据说，可以使用另外一种方式：改Oracle的字符集！

1、需要修改注册表：HKEY_LOCAL_MACHINE\SOFTWARE\ORACLE\HOME0\NLS_LANG 的值为SIMPLIFIED CHINESE_CHINA.ZHS16GBK

2、修改一个系统变量NLS_LANG.

以上两种，第二种方式试过，可以。第一种，未在现有环境下做过测试。

另外，将获取到的汉字，写入另外一个oracle 11g的数据库中，发现：汉字不是按照一个汉字两个字节来存放的；而是一个汉字3个字节！

查了一下，发现：字符集是AL32UTF8,这个字符集一般都默认中文是3个字节。于是，需要将目标数据库表的字段长度进行扩充。实际对于汉字的问题，oralce以及较新的sqlserver，都支持nvarchar的格式，对于使用nvarchar的字段，无论汉字还是数字、字符、英文字母，均每个字符占用1位。

如果不确定当前一个汉字占用几个字符，可以使用select length(‘汗‘) from dual;进行查看。

对于US7ASCII的字符集，目前来看，新上的系统使用的较少了，而对于一些较老的遗留系统，可能会存在这种情况。具体还需注意！

JDBC读取Oracle的US7ASCII编码中文乱码及不同编码下汉字占用字节的问题

标签：ar 使用数据问题 as new 数据库 sql c

原文地址：http://blog.csdn.net/cyq1984/article/details/41207075

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行