标签:字符 单位 lin 原子性 inno 实时 show 功能 面向
mysql的逻辑架构分为3层,
读写锁通常也称为共享锁和排他锁,
事务是一个独立的工作单元,可以用START TRANSACTION语句开始一个事务,然后要么使用COMMIT提交,或者使用ROLLBACK撤销所有的修改。
事务有四大特性,
死锁是指两个或者多个事务在同一资源上相互占用,并请求锁定对方占用的资源,从而导致恶性循环的现象。只有部分或者完全回滚其中一个事务,才能打破死锁。对于事务型的系统,这是无法避免的,所以应用程序在设计时必须考虑如何处理死锁。
事务日志可以提高事务的效率,使用事务日志,存储引擎在修改表的数据时只要需要修改内存拷贝,再把修改行为记录到硬盘上的事务日志中,而不用每次都将修改的数据持久到磁盘。事务日志持久以后,内存中被修改的数据在后台可以慢慢的刷回到磁盘。目前大多数存储引擎都是这样实现的,我们通常称之为预写式日志。
MySQL中的事务
MySQL中提供了两种事务型的存储引擎:InnoDB和NDB Cluster。
MySQL默认采用自动提交模式。也就是说,如果不是显式地开始一个事务,则每个查询都被当作一个事务执行提交操作。可以通过设置AUTOCOMMIT变量来启用或者禁用自动提交模式。
SHOW VARIABLES LIKE ‘AUTOCOMMIT‘;
SET AUTOCOMMIT = 1;
MySQL也可以通过执行SET TRANSACTION ISOLATION LEVEL命令来设置隔离级别。
也可以只改变当前会话的隔离级别:
SET SESSION TRANSACTION ISOLATION LEVEL READ COMMITED;
不要在事务中混合使用存储引擎,例如InnoDB和MyISAM,在正常提交的情况下不会有什么问题。但如果该事务需要回滚,非事务型的表上的变更就无法撤销。
InnoDB采用的是两阶段锁定协议,锁只有在COMMIT或者ROLLBACK的时候才会释放,并且所有的锁是在同一时刻被释放。
另外,InnoDB也支持通过特定的语句进行显式锁定,这些语句不属于SQL规范。
SELECT ... LOCK IN SHARE MODE SELECT ... FOR UPDATE
MySQL也支持LOCK TABLES和UNLOCK TABLES语句,这是在服务层实现的与存储引擎无关,他们有自己的用途,但并不能代替事务处理。
MVCC的实现,是通过保存在某个时间点的快照来实现的,也就是说不管需要执行多长时间,每个事务看到的数据都是一致的。
典型的有乐观锁(optimistic)和悲观锁(pessimistic)。
InnoDB的MVCC,是通过在每行记录后面保存两个隐藏的列来实现的。这两个列,一个保存行的创建时间,一个保存行的过期时间。当然存储的并不是实际的时间,而是系统版本号。每开始一个新的事务,系统版本号都会自动递增。事务开始时刻的系统版本号会作为事务的版本号,用来和查询到的每行记录的版本号进行比较。
保存这两个额外系统版本号,使大多数操作都可以不用加锁。这样操作使得读数据操作很简单,性能很好,并且也能保证只会读取到符合标准的行。不足之处是每行记录都需要额外的存储空间,需要做更多的行检查工作,以及一些额外的维护工作。
MVCC只在REPEATABLE READ和READ COMMITED两个隔离级别下工作。其它两个隔离级别都和MVCC不兼容,因为READ UNCOMMITED总是读取最新的数据行,而不是符合当然事务版本的数据行。而SERIALIZABLE则会对所有读取的行都加锁。
在文件系统中,MySQL将每个数据库(也可以称之为schema),保存为数据目录下的一个子目录。创建表时,会在数据库子目录下创建一个和表同名的.frm文件保存表的定义。
可以使用SHOW TABLE STATUS命令显示表的相关信息。
Name | 表名。 |
Engine | 表的存储引擎类型。 |
Row_format | 行的格式。对于MyISAM表,可选的值为Dynamic、Fixed或者Compressed。Dynamic的行长度是可变的,一般包含可变长度的字段,如VARCHAR或BLOB。Fixed的行长度是固定的,只包含固定长度的列,如CHAR和INTEGER。Compressed的行则只在压缩表中存在。 |
Rows | 表中的行数。 |
Avg_row_length | 平均每行包含的字节数。 |
Data_length | 表数据的大小(以字节为单位)。 |
Max_data_length | 表数据的最大容量,该值和存储引擎有关。 |
Index_length | 索引的大小(以字节为单位)。 |
Data_free | 对于MyISAM表,表示已分配但目前没有使用的空间。 |
Auto_increment | 下一个AUTO_INCREMENT的值。 |
Create_time | 表的创建时间。 |
Update_time | 表数据的最后修改时间。 |
Check_time | 使用CHECK TABLE命令或者myisamchk工具最后一次检查表的时间。 |
Collation | 表的默认字符集和字符列排序规则。 |
Checksum | 如果启用,保存的是整个表的实时校验和。 |
Create_options | 创建表时指定的其它选项。 |
Comment | 对于MyISAM,保存的是标注释,对于InnoDB表,保存的是表空间的剩余空间信息,如果是一个视图,则该列包含"VIEW"的文本字样。 |
MyISAM会将表存储在两个文件中:数据文件和索引文件,分别以.MYD和.MYI为扩展名。
如果表在创建并导入数据后,不会再进行修改,这样的表适合采用MyISAM压缩表。
可以使用myisampack进行压缩,压缩表是不能修改的,可以极大的减少磁盘空间占用,因此也可以减少磁盘I/O,提升查询性能。支持索引,但索引是只读的。
MySQL默认是面向行的。每一行的数据是一起存储的,服务器的查询也是以行为单位处理的。而在大数据处理时,面向列的方式可能效率更高。如果不需要整行的数据,面向列的方式可以输出更少的数据。如果每一列单独存储,那么压缩的效率也会更高。
infobright是最有名的面向列的存储引擎。在非常大的数据量(数10TB)时,该引擎工作良好。
ALTER TABLE mytable ENGINE = InnoDB;
上述语法可以适用任何存储引擎,但是需要执行很长时间,MySQL会按行将数据从原表复制到一张新的表中,在复制期间会消耗系统所有的I/O能力,同时原表会加上读锁。所以在繁忙的表上执行此操作要特别小心。替代方案是导出与导入,手工进行表复制。
可以使用mysqldump将数据导出到文件,然后修改文件中CREATE TABLE语句的存储引擎选项。
还有一种不需要导出整个表的数据,而是先创建一个新的存储引擎的表,然后利用INSERT...SELECT语法来导数据。
CREATE TABLE innodb_table LIKE myisam_table; ALTER TABLE innodb_table ENGINE=InnoDB; INSERT INTO innodb_table SELECT * FROM myisam_table;
数据量不大,这样做工作得很好。如果数据量很大,则考虑做分批处理,针对每一段数据执行事务提交操作。
START TRANSACTION; INSERT INTO innodb_table SELECT * FROM myisam_table WHERE id BETWEEN x AND y; COMMIT;
如果有必要,可以在执行的过程中对原表加锁,以确保新表和原表的数据一致。
Percona Toolkit提供了一个pt-online-schema-change的工具,可以比较简单、方便的执行上述过程。
标签:字符 单位 lin 原子性 inno 实时 show 功能 面向
原文地址:http://www.cnblogs.com/chenyanger/p/6568045.html