MySQL学习之二进制日志

进制日志记录了数据库的所有改变,使得任何Slave都可以通过执行Master二进制日志保持数据的一致。

二进制日志仅包含可能改变数据库的语句。那些尚没有但是可能改变数据库的语句也会记录下来,注意那些可能带来变化的语句,如DROP TABLE IFEXISTS CREATE IF NOT EXISTS,以及那些不匹配任何行的语句,select语句一般不会被记录,因为它们不会对数据库做任何改动。

服务器上的事务通常不是一个接一个顺序执行的,而是交错的并行执行,为了防止两个事务之间产生冲突导致不一致的结果,服务器要确保事务的执行是顺序化的。二进制日志按Master上的提交顺序记录事务,虽然事务可能在Master上交错执行,但每个事务在二进制日志中的顺序是不变的,取决于事务的提交(commit)时间。


二进制日志的结构


看上图,二进制日志由若干个文件组成,事件存储在一系列binlog文件中,文件名类似于host-bin.000001,还有一个索引文件通常文件名为host-bin.index,索引文件跟踪服务器使用的所以binlog文件,索引文件的每一行都包含了一个binlog文件的完整文件名,使用这些命令,如PURGE BINARY LOGSRESTART MASTER FLUSH LOGS,添加或删除binlog文件,也导致索引文件添加或删除行。


数据安全

    比较常见的敏感信息就是密码,当执行改变数据库中表的语句,并且它包含访问这个表所必须的密码的时候,包含密码的事件就会被写入二进制日志。

例:

       update employee set pass= password(‘123456’) where email = ‘[email protected]’;

    如果复制是正确的,最好重写这个语句,可以通过以下方法实现:计算和存储哈希密码到用户自定义变量,然后在表达式中使用它:

       set @password =password(‘123456’);

       update employee set pass= @password  where email = ‘[email protected]’;

    由于set语句没有被复制,密码将不会存储在二进制日志中,而仅在执行该语句的时候存储在服务器内存中。


清除binlog文件

随着时间的推移,服务器会集聚binlog文件,要使服务器自动清理旧的binlog文件,需设置expire-logs-days选项。这个选项可用来作为一个服务器变量,达到你想保留binlog文件的天数,如果希望在重启后仍保持自动清除,必须添加该设置到my.cnf文件。

使用PURGE BINARY LOGS 命令手工清除binlog文件,有如下两种格式:

PURGE BINARYLOGS BEFORE datetime

这个命令格式将清除在给定时间之前的所有binlog文件。如果datetime在一个日志文件的中间,那么datetime所在的那个文件之前的所有文件将被清除。

实战演练:

1、由于是通过日期时间删除,我们先要知道需要删除那个时间之前的二进制日志。

mysqlbinlog  --force-if-open--base64-output=never mysql-bin.000003

2、假如我们需要删除2014/09/09之前的日志,执行如下命令:

PURGE BINARY LOGS BEFORE 140909

PURGE BINARY LOGS TO ‘filename’

这个命令格式将清除在给定文件之前的所有文件。也就是Show masterlogs 命令输出的所有文件中,在filename之前的文件都将被删除。

实战演练:

PURGE BINARY LOGS TO ‘mysql-bin.000002‘;


mysqlbinlog 工具的使用

mysqlbinlog

       --short-form 只打印被执行的SQL语句信息,忽略关于二进制日志的事件注释信息。

       --force-if-open 如果binlog文件正在被写入,或因为服务器崩溃,mysqlbinlog都将打印一条警告信息说这个binlog文件没有被正确关闭,这个选项忽略打印警告信息。

       --base64-output=never  阻止mysqlbinlog打印base64-encoded事件。

       start-position=bytepos 转储的第一个事件的字节位置。如果几个binlog是提供给mysqlbinlog的,这个位置将被解释为在序列号中第一个文件的位置。

       stop-position=bytepos 最后打印的事件的字节位置,如果给定了多个binlog文件,该位置将是序列中最后一个文件的位置。

       start-datetime=datetime 只打印那些有时间戳或datetime后的事件。

       stop-datetime=datetime 只打印那些有时间戳或datetime前的事件。

读取远程文件实例:

       mysqlbinlog  --read-from-remote-server --host=192.168.18.202 --base64-output=never --user=repl_user --password --start-position=386 --stop-position=643 mysqld-bin.000001


我们接下来使用mysqlbinlog来读取一个二进制日志文件:

mysqlbinlog --force-if-open--base64-output=never /mylogbin/mysql-bin.000001 | cat -n

 

     1    /*!50530 SET@@SESSION.PSEUDO_SLAVE_MODE=1*/;

     2    /*!40019SET @@session.max_insert_delayed_threads=0*/;

     3    /*!50003SET @OLD_COMPLETION_TYPE=@@COMPLETION_TYPE,COMPLETION_TYPE=0*/;

     4    DELIMITER/*!*/;

     5    #at 4

     6    #141015  9:03:53 server id 1  end_log_pos 245      Start: binlog v 4, server v 5.5.32-MariaDB-log created141015  9:03:53 at startup

     7    ROLLBACK/*!*/;

     8    #at 245

     9    #141015  9:09:21 server id 1  end_log_pos 428      Query     thread_id=1    exec_time=0   error_code=0

    10    use`test`/*!*/;

    11    SETTIMESTAMP=1413335361/*!*/;

    12    SET@@session.pseudo_thread_id=1/*!*/;

    13    SET@@session.foreign_key_checks=1, @@session.sql_auto_is_null=0,@@session.unique_checks=1, @@session.autocommit=1/*!*/;

    14    SET@@session.sql_mode=0/*!*/;

    15    SET@@session.auto_increment_increment=1, @@session.auto_increment_offset=1/*!*/;

    16    /*!\Cutf8 *//*!*/;

    17    SET@@session.character_set_client=33,@@session.collation_connection=33,@@session.collation_server=8/*!*/;

    18    SET@@session.lc_time_names=0/*!*/;

    19    SET@@session.collation_database=DEFAULT/*!*/;

    20    createtable employee ( id int auto_increment,name char(64) not null,emailchar(64),password char(64),primary key (id) )

    21    /*!*/;

    22    #at 428

    23    #141015  9:12:27 server id 1  end_log_pos 496      Query     thread_id=1    exec_time=0   error_code=0

    24    SETTIMESTAMP=1413335547/*!*/;

    25    BEGIN

    26    /*!*/;

 

    1~7行相对应的部分,它们修复序言中设置的值,然后回滚所以活动事务。

    每当数据库更改时,第10行的use语句会被打印,当一个use语句出现时,他就是一个新事件的第一行。

    紧接在use语句下面一行是SET TIMESTAMP 这个语句提供自纪元时间开始以秒计算的事件开始执行时的时间戳。

    12~19行包含常规设置,类似于第10行的use,只有第一个事件和当它们的值被改变时,它们才会被打印。

注释详解

# at 245

#141015  9:09:21 server id 1  end_log_pos 428    Query     thread_id=1

       exec_time=0   error_code=0

注释的各部分意义如下:

at 245

事件开始的字节位置,也就是该事件的第一个字节;

141015  9:09:21

事件被写入二进制日志的时间;

Server id 1

产生改事件的服务器的server id

end_log_pos 428

紧接着该事件之后,下一个事件开始的字节位置;

Query

事件类型,例如User_varIntvarXid

thread_id=1

执行该事件的线程ID

exec_time=0

以秒为单位的查询执行时间;

error_code=0

从语句执行结果得到的错误码;


二进制日志配置选项

expire-log-days=days

binlog需要保留的天数。当二进制日志已经轮换或服务器重启时,比指定数值老的文件将从文件系统中删除。这个选项默认是0,意味着binlog文件永远不会被删除。

 

log-bin [ =basename ]

通过在my.cnf中添加log-bin选项来开启二进制日志,这个选项还给出了binlog文件的基本名称,也就是在圆点之前的部分文件名。如果该选项没有指定basename,则基本名默认为host-bin,强烈建议给log-bin选项赋值。否则当hostname改变时,binlog文件将改名(除非pid-file被给定一个确切值)。

 

log-bin-index [ =filename ]

给出索引文件的名称,与log-bin选项情况类似,hostname将被用来组成索引文件名,意味着如果hostname改变,复制将中断,出于这个原因建议给这个选项赋值。

 

binlog-cache-size=bytes

事务缓存,当事务缓存的大小超过该值时,剩余的数据将进入磁盘。这有可能造成性能问题,因此如果你使用许多大型事务,增大该选项可以提高性能。

注意,只分配非常大的缓冲区并不是好主意,因为这意味着服务器的其他部分得到更少的内存,这可能导致性能下降。

 

max-binlog-cache-size=bytes

使用这个选项来限制在二进制日志中的每个事务的大小。由于大型事务有可能阻塞二进制日志很长时间,他们将导致其他线程为二进制日志护航二造成重大性能问题。如果事务的大小超过bytes,该语句将出错而被终止。

 

max-binlog-size=bytes

指定每个binlog文件的大小,如事务或语句超过了max-binlog-size,二进制日志将被轮换,该事务全部内容将被写入新的文件,因为事务永远不会被分割到不同的binlog文件。

 

sync-binlog=period (时段,周期)

指定多长时间通过fdatasync写二进制日志到磁盘一次,如果给定的数值为1,每次事务提交时调用fdatasync,而如果给定值为10,则每10个事务提交将调用一次fdatasync。数值为0表示永远不会调用,而且服务器相信操作系统会写二进制日志到磁盘,作为正常文件处理的一部分。

 

read-only

防止任何客户端进程(除了Slave进程和有SUPER权限的用户)更新服务器上的任何数据。


本篇内容纯手打,是笔者看书学到的知识,从中摘取了一些比较关键的内容和笔者的实验过程记录了下来。

本文出自 “坏人的博客” 博客,转载请与作者联系!

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。