网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

mysql数据校验之字符集问题

浏览数：21 / 时间：2015年06月12日

场景：
主库DB：utf8字符集
备库DB：gbk字符集

需求：
校验主备数据是否一致，并且修复

校验过程：
设置主库连接为utf8，设置备库连接为gbk，分别进行查询，将返回的的结果集按记录逐字段比较。

显示结果：
原本相同的汉字字符，数据校验认为不一致。

原因分析：
对于主库而已，由于建立连接的字符集为UTF8，则返回的汉字字符编码为UTF8格式；对于备库而言则是GBK格式，而程序中通过字符串比较函数strcasecmp进行比较，显然不同的字符集编码，相同的字符有不同的二进制，因此结果肯定不会相等。

进一步分析：
那么对于这种情况，建立连接应该采用哪种字符集呢？GBK or UTF8。其实选择任何一种字符集都是OK的，只要是访问主库和备库的字符集保持一致即可，唯一的区别在于，若选择的字符集与客户端的字符集不一致，可能导致无法正常显示字符，即字符显示为乱码。

我们以客户端的字符集为例，详细说说三种情况：【这里的客户端可以认为是SecureCRT】
备注：绿色框代表DB字符集，黄色框代表连接字符集，橙色框代表客户端
第一种情况：

就是上述的情况，主库返回字符的GBK编码，备库返回字符的UTF8编码，因此进行字段比对，则会出现误差。

第二种情况：

访问主库的连接不变，备库连接由UTF8变为GBK，因此进行返回时，数据库会将DB的字符集转为GBK返回给客户端，那么对于客户端而已，相同字符都是通过GBK编码表示，因此二进制相等，校验结果正确。

第三种情况：

访问主库和备库的连接都是UTF8，因此对于主库而已，返回给客户端的字符编码由GBK转为UTF8，此时主库和备库都是UTF8编码，校验结果正确。但由于客户端实质是GBK编码方式显示，因此返回的汉字字符都是乱码，但不影响校验结果的正确性。

修复：

既然选择与主备库任一一个相同的字符集去访问，都不会影响校验结果的正确性，那么影响修复呢？由于UTF8的编码范围比GBK编码范围要大，因此若采用GBK连接访问UTF8编码DB，有可能出现部分字符GBK不能表示的情况。

我们拿第二种情况说明，此时主库为GBK，备库为UTF8，使用GBK访问UTF8。假设存在UTF8转为GBK过程中部分字符丢失，这时候主备库肯定是不一致的，因为存在部分字符GBK无法表示。假设修复语句如下：

Update t set c1=master_value where c1=slave_value and id=?

其中t表示表名，id是主键表示某一行，master_value为主库c1列的值，slave_value为备库c1列的值。此时，slave_value由于UTF8转为GBK已经丢失，因此语句执行最终影响0行记录，无法修复。

结论：

客户端访问两个不同字符集库进行数据校验时，连接采用表示范围更大的字符集。比如我们常用的字符集表示范围如下：

Latin<gb2312<gbk<utf8

附：mysql客户端与服务器通信时字符集编码转换流程

相关参数：

– character_set_client：客户端来源数据使用的字符集

– character_set_connection：连接层字符集

– character_set_results：查询结果字符集

– character_set_database：当前选中数据库的默认字符集

– character_set_system：系统元数据(字段名等)字符集

1.客户端请求服务器

1)将client的字符集转为connection字符集

2)将connection字符集转为DB内部的字符集

2.服务器返回结果给客户端

1)将DB内部字符集转为connection字符集

2)将connection字符集转为character_set_results字符集

3.设置字符集命令：set names 字符编码

指定客户端与服务器通信的字符集，包括请求与返回。

SET NAMES ‘x‘ 等价于：

SET character_set_client = x;

SET character_set_results = x;

SET character_set_connection = x;

附图：

来源于网络

mysql数据校验之字符集问题,古老的榕树,5-wow.com

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

mysql数据校验之字符集问题

标签： style 问题 src 服务器数据 at style 问题 src 服务器数据 at

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

女子占座被指责飞踹老人

女子占座被指责飞踹老人

北海银滩试拍

北海银滩试拍

越战结束40年裂痕犹在：越南仍未实现南北和解

越战结束40年裂痕犹在：越南仍未实现南北和解

潘主兰书法

潘主兰书法

中山路人徒手接住空中坠落小孩

中山路人徒手接住空中坠落小孩

米兰时装周火辣上演美模抱萌娃走秀场面温馨

米兰时装周火辣上演美模抱萌娃走秀场面温馨

你见过这种饥荒吗？

你见过这种饥荒吗？

亚太比基尼精选

亚太比基尼精选

河南一男童走失半年再见成“干尸”

河南一男童走失半年再见成“干尸”

范曾书法部分展览

范曾书法部分展览

您可能还喜欢

更多

11岁女孩因抄作业被父亲发现吊打身亡

11岁女孩因抄作业被父亲发现吊打身亡

杭州一企业女员工集体穿肚兜上班

杭州一企业女员工集体穿肚兜上班

深圳地铁站附近发生恶性砍人事件

深圳地铁站附近发生恶性砍人事件

深圳宝安机场一奔驰失控撞向行人致9死23伤

深圳宝安机场一奔驰失控撞向行人致9死23伤

甜妹 ootd 穿搭

甜妹 ootd 穿搭

2015北影表演专业考试首日校内颜值爆表

2015北影表演专业考试首日校内颜值爆表

美国成人展

美国成人展

特斯拉电动车图集

特斯拉电动车图集

秦舒培高挑身材

秦舒培高挑身材

广州海陆空盛筵开场比基尼美女助阵

广州海陆空盛筵开场比基尼美女助阵