Linux|系统管理|WEB开发

关注Linux,系统管理,WEB开发以及开源世界

再谈MySQL升级出现乱码的问题

| Comments

好早以前写过一篇关于MySQL升级到4.1出现乱码如何解决的帖子,他只是讲述了当你导入的数据都正常了,该怎么使用到MySQL4.1以后版本的多语言特征。但是如果在导入的过程中就遇到了字符集的问题,该怎么办呢?就是无论你怎么导入,怎么折腾字符集,都是乱码,但是你新插入的任何一条数据都没有问题,这就不是升级后调整字符集的问题了,而是在导出导入的工程中就需要考虑。

UP这两天估计被这个问题折腾的够呛,虽然事后找到的原因不是在于数据库,但是这里还是把升级的过程记录下来。今天up问我上次论坛如何升级和转换的,我就记得不太清楚了。

我自己试验成功的有两种方式

1)只需要把你原来版本的数据库文件考到到新的数据库目录下,什么都不用修改,这个时候输出应该是正常的,默认采用了latin1字符集。这大概只最简单的方式了,不过这种方式不太好的地方在于一旦将来要转换字符集,很是麻烦。

2)假设你要从MySQL4.0以下版本升级到MySQL4.1以上版本,并明确指定需要的字符集是gb2312,那么我的步骤是 a)在原来的数据库上导出你要的数据库,可以使用下面的命令: $mysqldump -u username -p password databasename >xxx.sql

b)修改导出的sql文件,首先将导出的数据表加上默认字符集gb2312,可以在vi中只用下面的替换命令 % s/engine=MyISAM;/engine=MyISAM DEFAULT CHARSET=GB2312;/g 当然你可以使用你喜欢的编辑器来替换;其次是将这个sql文件转化成gb2312编码格式的文件。你可以先file看看该文件的字符集,如果是ISO8859的,那还不错,如果是Non-ISO格式,那就必须转换,可以使用下面的命令 iconv -c -t gb2312 -o outout.sql xxx.sql UP导出的数据就是Non-ISO格式。

c)连接新的数据库服务器,创建需要的数据库 mysqladmin -uroot -p create databasename

d)在导入数据之前,看看默认的字符集,可以使用下面的方法

1
2
3
4
5
6
7
8
9
10
mysql> SHOW VARIABLES LIKE 'character_set_%';
+--------------------------+----------------------------+ |
Variable_name | Value |
+--------------------------+----------------------------+ |
character_set_client | latin1 | | character_set_connection | latin1
| | character_set_database | latin1 | | character_set_results |
latin1 | | character_set_server | latin1 | | character_set_system |
utf8 | | character_sets_dir | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+ 7 rows in set
(0.00 sec)

默认的字符集都是latinn1的,这个时候,你需要将latin1转换成gb2312,方法如下

1
2
3
4
5
6
7
8
9
10
11
12
13
14
mysql> set NAMES 'utf8'; Query OK, 0 rows affected (0.00 sec) mysql>
set character_set_database=utf8; Query OK, 0 rows affected (0.00 sec)
mysql> set character_set_server=utf8; Query OK, 0 rows affected (0.00
sec) mysql> show variables like 'character%';
+--------------------------+--------------------------------+ |
Variable_name | Value |
+--------------------------+--------------------------------+ |
character_set_client | utf8 | | character_set_connection | utf8 | |
character_set_database | utf8 | | character_set_filesystem | binary
| | character_set_results | utf8 | | character_set_server | utf8 | |
character_set_system | utf8 | | character_sets_dir |
/usr/share/mysql/charsets/ |
+--------------------------+--------------------------------+ 8 rows in
set (0.00 sec)

这时数据库字符集已经修改,可以导入数据了 mysql>source /path/to/xxx.sql

然后在你的网页中,在连接数据后,加上下面的一条指令 mysql_query(”set NAMES 'utf8'"); 应该就可以了,当然你的网页编码本身应该也要式gb2312的。

那么UP为什么会要折腾两天呢?不是他的步骤和方法有问题,而是操作系统的问题!操作系统?ubuntu! 问题就出现在iconv转换的过程中,只要转换成GB2312,那些中文就成了空白,而同样的文件,在其他Linux操作系统上就不会出现这个问题,难道式ubuntu并不支持GB2312?还是别的原因,个人没有使用过ubuntu,不太清楚他的字符集和字体支持是如何的,不过想来我用过的redhat,fedora,suse确实都在字符集和中文字体方面有些欠缺。这个方面,红旗Linux显然要优秀一些。

Comments