mysql性能优化

浏览数：27 / 时间：2015年06月12日

http://blog.csdn.net/uestc_huan/article/category/536350 博主首页

http://blog.csdn.net/uestc_huan/article/details/6071081 博文地址

本文不从DBA的角度去讲解mysql Server的参数如何设置，而是从程序员和架构师的角度，去说明在写程序和设计系统的时候，需要注意的mysql的一些优化点。因此，没有在本文中详细论述服务器参数的设置含义和调优。

关于索引

1. mysql使用的B+tree的深度的计算：

B+树每块数值的大小 = 每个block的大小 / 索引值的大小

比如mysql每个block为4K，索引值设为4个字节的int，那么每个索引块的大小为4k/4 = 1k。

那么存储一亿行的数据，需要的B+树的高度为

h = log1000(一亿) =3 （以1000为底，一亿的对数）。可见B+树的高度不会很高，一般深度都不会超过5.

2. 为了避免随机IO操作，可以建立联合index来避免随机IO操作。即用“索引-值”对来建立一个联合index。这样，就可以直接从索引中读取数据，而不需要根据索引再去磁盘读取实际的数据。

比如： select age from user_info where name=lisi;

那么，建立name-age的联合索引，那么从索引就可以直接读取数据。如果仅仅建立name的索引，那么它需要根据name=lisi定位到这行数据的位置，再从这个位置读取出age。

3. 如果仅仅是点查询，而不需要范围查询，那么使用hash索引会比B+tree索引更快。就是仅仅需要 where aaa=bbb这样的查询条件，而不需要where aaa> bbb这样的查询条件。

4. 使用logloader或者dump的操作速度，会比简单的sql语句快5倍以上。

5.log 放在单独的磁盘上，可缓解io瓶颈。

6.慢查询是影响mysql性能的主要因素。慢查询主要通过分析慢查询日志来处理。很多现有的工具可以分析。诸如 mysqldumpslow, mysql_slow_log_filter, mysql_slow_log_parser, mysqlsal等。

关于事务的理解

1. 事务应该具有ACID属性，（atomicity, consistency, isolation, durability），一致性和持久性比较好理解。原子性和隔离性需要做一些说明。

事务的原子性仅仅指同一个事务本身的原子性。一个事务未执行或者执行一半时，另外的事务（另外一个连接中）是可以并发执行的。这涉及到事务隔离度的概念（isolation）。可以做一个测试，用两个客户端去连接数据库，分别开始事务，分别执行两个进程。只有在事务中执行了upate，insert，delete的语句，并且affect的行数大于0的时候，才会阻塞另外一个事务。而且这个跟数据库的隔离度等级也有关系。

下面是关于隔离度的解释。

（1）.查看当前会话隔离级别

select @@tx_isolation;

（2）.查看系统当前隔离级别

select @@global.tx_isolation;

（3）.设置当前会话隔离级别

set session transaction isolatin level repeatable read;

（4）.设置系统当前隔离级别

set global transaction isolation level repeatable read;

（5）.命令行，开始事务时

set autocommit=off 或者 start transaction

关于隔离级别的理解

（1）read uncommitted

可以看到未提交的数据（脏读），举个例子：别人说的话你都相信了，但是可能他只是说说，并不实际做。

（2）read committed

读取提交的数据。但是，可能多次读取的数据结果不一致（不可重复读，幻读）。用读写的观点就是：读取的行数据，可以写。

（3）repeatable read(MySQL默认隔离级别)

在MySQL中，其他事务新增的数据，看不到，不会产生幻读。采用多版本并发控制（MVCC）机制解决幻读问题。

（4）serializable

可读，不可写。写数据必须等待另一个事务结束。

7. 两个事务是可能发生死锁的，

举个例子：

Transaction1

Start transaction;

Update stockprice set close=45.5 where stock_id =4;

Update stockprice set close=47.7 where stock_id=3;

Commit;

Transaction2

Start transaction;

Update stockprice set close=45.5 where stock_id =3;

Update stockprice set close=47.7 where stock_id=4;

Commit;

当两个事务都执行了第一条而未执行第二条时，就发生了死锁。

关于数据类型

1. 避免用DEFAULT NULL数值，原因一方面是为了索引速度更快(尽管在高版本的mysql已经不存在这个问题)，另一方面是避免应用程序产生一些不必要的困惑和bug.

2. int(1)和int(20)的区别仅仅是在显示上，对于计算和存储过程，是完全一样的。

3. DECIMAL在4.1版本及之前，仅仅是存储类型，它的效率比float和double都低。DEMICAL仅仅应该用在金融数字上，因为它可以指定所需要的计算精度。

4. Blob和text是最耗性能的。因为内存存储机制（memory storage engine）不支持这两个类型，因为查询这两个类型的数据都会用到磁盘临时表。尽可能避免使用这两种类型数据。如果要对这两种类型的数据排序，用order by substring(column, length)转成string类型。此时如果substring小，可以转成内存临时表，速度会快很多。额外插一句，字符匹配查找算法的最高效率，不会高于KMP算法的效率。

5.可以用enum代替string类型。Enum最多可以存65535个字符。但此时排序是按enum值排序而非string值排序。

6. datetime 和timestamp的比较。

Datatime: 8字节，与时区无关，缺省值是NULL

Timestamp: 4字节，与时区相关，缺省插入值是当前时间。

如果没有特别需要，建议用timestamp。别用整数型数据来存储时间，尽管可以，但不推荐，因为得不到任何好处。

7.一般不推荐使用bit的数据类型，用tinyint会更利于扩展。Bit set也可以通过tiny int的位运算来替代。

8. 不要滥用MySQL的类型自动转换功能