先做一个简单的自我介绍,我于2017年6月毕业后,入职某互联网公司做兄弟。主要是从事JAVA的业务开发,经过一段时间的迷茫时期,感觉做业务开发,有时有对底层,对性能并没有那么的追求,更多的是要求系统稳定和对需求快速的响应。一个良好的底层存储结构,将决定整个系统的稳定程度及可扩展度。本系列文章将根据个人经验,参考《高性能MySQL》一书找梳理出在javaWeb开发中所需要的MySQL相关知识。因个人水平有限,不足之处还望各位看官指正。
自国内阿里刮起了去IOE的浪潮之后,越来越多的互联网公司数据库都选择了Mysql的集群化部署策略,相比Orlace,Mysql的开源及集群化部署策略可以更好的面对更大的数据量。
MySQL的服务器逻辑架构
![](https://img.haomeiwen.com/i18057055/ba6692c9034e77e4.png)
最上层的部分并不是Mysql所独有的,大多数基于网络的工具或服务都有类似架构。用于处理连接,授权,安全等。
而第二部分包含了大多数Mysql的核心服务功能,包括查询解析、分析、优化、缓存以及所有的内置函数(日期,时间,数学和加密函数),所有跨存储引擎的功能都在这一层实现:存储过程、触发器、视图等。【值得注意的是,为了保证更快的响应及更好的扩展,在开发中尽量不要设置存储过程,触发器,视图等】
第三部分则包含了存储引擎。存储引擎负责MySQL中数据的存储和提取,类似于文件系统负责数据的真正存储。服务器通过API与存储引擎进行通信,这些接口屏蔽了不同存储引擎之间的差异,使得这些差异对上层的查询过程透明。【因为InnoDB对事务的支持以及良好的读写速度,所以在项目中一般使用InnoDB引擎】
连接管理与安全性
每个客户端连接都会在服务器中拥有一个线程,这个链接的查询只会在这个额单独的线程中执行,该线程只能轮流在某个CPU核心中运行。服务器会负责缓存线程,因此不需要为每一个新建的连接创建或销毁线程(MySQL 5.5后支持了线程池插件)。
【说到线程池,就不得不提java中的数据库链接池(c3p0 dbcp druid 等),其实他们最终实现的目的是一致的,为了能让线程复用,不过一个是在MySQL服务器端,另一个则是在web服务器上。当使用了数据库连接池技术后,其实是一直保持了某个和Mysql的链接,来达到复用(不需要创建线程,也不需要链接)。而对于MySQL服务器的缓存线程机制,则是不需要频繁的创建销毁线程。所以来说,即使使用MySQL5.5也应当使用数据库链接池技术,保证web应用不用新建链接及线程,以节省资源开销。】
当客户端(web应用)连接到MySQL服务器时,服务器需要对其进行认证。认证基于用户名、原始主机信息和密码。一旦连接成功,服务器会继续验证该客户端是否具有执行某个特定插叙的权限(如读写权限、表权限、DDL权限等)
优化与执行
MySQL会解析查询,并创建内部数据结构(解析树),然后对其进行各种优化,包括重写查询、决定表的读取顺序,以及选择合适的索引等,用户可以通过特殊关键字(Hint)提示优化器,影响他的决策过程。也可以请求优化器解释(explain)优化过程的各个因素,用户可以知道服务器是如何进行优化决策的。(后序会有专门的一篇来写如何使用explain)
优化器并不关心表使用的是什么样的存储引擎,但存储引擎对于优化查询是有影响的。优化器会请求存储提供容量或某个具体操作的开销信息,以及表数据的统计信息等。
对于Select语句,在解析查询之前,服务器会先检查查询缓存(Query Cache),如果能够在其中找到对应的查询,服务器就不必在执行查询解析、优化和执行的整个过程,而直接返回结果。【一般DBA会关闭这个功能,所以web应用中需要使用缓存框架如redis等来做查询缓存。】
并发控制
Mysql中InnoDB引擎对于并发控制采用的是MVCC的机制。而对于MySQL服务器来说,则由读写锁来控制锁是否可重入,而锁的粒度又一般分为表锁和行锁。此处涉及内容将在后序 事务,mvcc,索引等章节详述。
文中【斜体】部分多为个人理解,不足支持还望指正。
欢迎注明出处及本文链接的转载。
网友评论