本页主题: mysql JDBC连接池中文问题解决[转载] 打印 | 加为IE收藏 | 复制链接 | 收藏主题 | 上一主题 | 下一主题

Mike
群熵工程师
级别: 管理员


精华: 7
发帖: 951
威望: 714 点
金钱: 6601 RMB
贡献值: 0 点
好评度: 611 点
在线时间:1405(小时)
注册时间:2003-11-28
最后登录:2018-04-23

 mysql JDBC连接池中文问题解决[转载]

在最近的项目中使用了Mysql作为数据库,应用服务器是resin。但是在使用resin的连接池时发现中文数据保存到数据库后出现乱码,无法正确显示。我想一定是字符集不支持的原因。后来发现如果使用org.gjt.mm.mysql.Driver作为驱动的话那么只要再加两个参数就可以了,下面是web.xml中的写法:


prm
   
org.gjt.mm.mysql.Driver
jdbc:mysql://localhost:3306/prm
  abcm
  abcm
 
 



但是在resin的文档中推荐使用的是JDBC2.0的方式,直接使用了Mysql的连接池类com.mysql.jdbc.jdbc2.optional.MysqlConnectionPoolDataSource

如果使用这个驱动上面的方法就不行了。我看了一下mysql驱动的源代码,发现这个类并没有关于字符集的设置,于是改了一下。com.mysql.jdbc.jdbc2.optional.MysqlDataSource

/**
    * Creates a connection using the specified properties.
    *
    * @param props the properties to connect with
    *
    * @return a connection to the database
    *
    * @throws SQLException if an error occurs
    */
  protected java.sql.Connection getConnection(Properties props)
      throws SQLException {
      String jdbcUrlToUse = null;

      if (!explicitUrl) {
        StringBuffer jdbcUrl = new StringBuffer("jdbc:mysql://");

        if (hostName != null) {
          jdbcUrl.append(hostName);
        }

        jdbcUrl.append(":");
        jdbcUrl.append(port);
        jdbcUrl.append("/");

        if (databaseName != null) {
          jdbcUrl.append(databaseName);
          jdbcUrl.append("&useUnicode=true;characterEncoding=gb2312");这一行是后来我加上的。
        }

        jdbcUrlToUse = jdbcUrl.toString();
      } else {
        jdbcUrlToUse = this.url;
      }

      return mysqlDriver.connect(jdbcUrlToUse, props);

  }
}

现在就可以使用下面的描述应用连接池了web.xml.中文可以正确显示了。但是这个方法也有一定的问题那就是不够灵活,如果能够把字符集的设置也放到参数中就更好了。


prm

  com.mysql.jdbc.jdbc2.optional.MysqlConnectionPoolDataSource
jdbc:mysql://localhost:3306/prm
  abcm
  abcm



谁说的mysql JDBC连接池不支持中文
url
jdbc:mysql://localhost:3306/struts?useUnicode=true;characterEncoding=GBK


3.终于搞定了,特写一篇文章来纪念一下 :-)


我的环境:
中文简体 win2000 pro + sp3
mysql server 4.0.12
j2sdk 1.4.01
connetcor-j 3.0.7


问题:用 jdbc 插入、读取数据库种文字串乱码。


首先,mysql 数据库中的东西都是二进制存放的,支持任何数据,当然包括中文。你到命令行下
insert into testtable values ( '中文' );
select * from testtable;
全都显示正常。
但是,虽然存取中文没问题,但排序、匹配的时候有问题。所以如果你的数据库里有中文的话,记得在配置文件中,如 c:winntmy.ini 中的 [mysqld] 里添加一行:
default-character-set=gbk
然后重启 mysql server 。 注意 gbk 要小写,不然 mysqld 启动不了。


其次,数据库没问题,下面看看 java 程序。在程序里很无聊地加一句调试语句:
out.println("中文");
也显示正常,说明整个 java 环境没问题。


所以,当然是联系 java 和 mysql 的部分,mysql jdbc driver 出问题了。
分析一下,java 内部使用 unicode ,而 mysql 缺省使用 iso-8xxx(忘了),所以 jdbc driver 把查询字符串传给 mysql server 时,会做 unicode->iso-8xxx 的转换,从 mysql server 接受结果时,会做 iso-8xxx->unicode 的转换。(在屏幕上显示结果时会 unicode->GBK,不过不关这里的事。)
这就有问题了,我在命令行下插入数据库的中文字符串是 GBK (这是简体中文 windows 的默认),所以 jdbc driver 接受查询结果时,应该做 GBK->unicode 的转换才对。
验证一下,对从数据库中读出的中文字串 s ,
new String( s.getByte("iso-8xxx"), "gbk" )
将 s 先做一个 unicode->iso-8xxx 转换成它存放在数据库中的原始模样。我们知道它是 gbk ,所以手工来 gbk->unicode ,这样 java 程序就显式正常了。
类似,写入数据库的时候,我们期待 jdbc driver 会把 unicode->gbk ,结果却是 unicode->iso-8xxx ,当然是乱码了。


有很多文章,就到此为止,并告诉我们:要解决中文问题,自己手工转码吧。
这实在是不负责任。如果每一个字符串都要手工转码,说明程序设计出了问题。
想一想,写 mysql jdbc driver 的家伙会连转码都不知道?
所以我看看 connector-j-3.0.7 里面的 readme, 找到一个解决方案:
connection = DriverManager.getConnection( "jdbc:mysql://localhost/test?user=root&password=&useUnicode=true&characterEncoding=GBK" );
这是告诉 jdbc driver 强制按指定参数转码


其实还是有问题。如果 mysql server 一定得用 iso-8xxx ,那就只有用上一个办法了。但我记得我的 mysql 是 gbk ,不是都改过 my.ini 了吗? jdbc driver 怎么都不自动探测 mysql server 的字符集呢?
这个时候就看到开放源码的好处了 :-) connector-j-3.0.7 源码中确实有代码读取 mysql server 的信息,包括字符集。从注释中知道,
作者为 unicode 转换到单字节字符集写了自己的转换函数,并号称比 jvm 的快百分之多少多少。所以代码中有一段,判段数据库如果使用的是单字节就调用自己的转换函数。但这段代码后面就忘了把多字节字符集交给 jvm 去转换了,所以变成了缺省的 iso-8xxx 转换。
我的修改方式: commysqljdbcConnecter.java 这个文件的 1969 行,
this.doUnicode = true; // force the issue
将之上移四行到 1964 行,放在下面这一行的前面:
try {
用这份代码重新编出来的 jdbc driver ,你的 java 访问数据库的程序不用做任何修改就可以正确读写中文了,不过要记得 mysql server 要 default-character-set=gbk
我使用它测试了几个小程序,中文都显示正常,而且都没死机、异常。呵呵,自我感觉很好。


4.经过一番痛苦的经历, 终于解决了Java和MySQL连接的中文问题了,我把经过贴出来, 希望能给和我前几天一样的朋友一些借鉴。
  我的环境是这样, Win2000 Pro 英文版 SP4,默认语言是Chinese Simplified, Java SDK 1.4.2, J2EE1.4, Tomcat 4.1.27, MySQL 4.0.15-nt, JDBC:mysql-connector-java-3.0.8。
  问题: 中文乱码。
  解决:

JSP:<%@ page language="java" import="jl.*" contentType="text/html;charset=8859_1"%>

Servlet:response.setContentType("text/html; charset=8859_1");

Beans:编译的时候用 javac -encoding 8859_1 XxxBean.java

通过这样, 测试了 insert, update, select, delete, 都一切正常, 总算可以继续工作了。 感谢猫小和前前任版eclipse主的文章。

我的理解是 ISO-8859-1编码是8位的, 不会丢失中文编码的高位,所以干脆全部都用8位编码, 解码。 我不敢说对编码, 解码的机制完全理解了, 但现在至少乱码解决了。 也恳请各位高手赐教!

转自:http://hi.baidu.com/familyloh/blog/item/c6e0b026f13d0b168b82a168.html
顶端 Posted: 07-04-04 10:56 | [楼 主]
mycatboys
级别: 侠客


精华: 0
发帖: 12
威望: 13 点
金钱: 121 RMB
贡献值: 0 点
好评度: 12 点
在线时间:1(小时)
注册时间:2007-05-18
最后登录:2009-08-30

 

^_^ 好贴^_^ 好贴啊 谢谢楼主







--------------------------------------------------------------------------------------------------
久惯沙场丰美莱,曾经怒海藏泌清
顶端 Posted: 07-07-16 13:52 | 1 楼
帖子浏览记录 版块浏览记录
群熵信息 - 技术讨论区 » 面向WEB的Java技术

Total 0.033852(s) query 5, Time now is:06-21 10:49, Gzip enabled
Powered by PHPWind v6.3.2 Certificate Code © 2003-08 PHPWind.com Corporation

上海服务器租用 杭州世导双线服务器托管 云主机 VPS