美文网首页互联网科技Java 杂谈程序员
MySQL内核源码解读-SQL解析之解析器浅析

MySQL内核源码解读-SQL解析之解析器浅析

作者: 老男孩_Misaya | 来源:发表于2018-10-19 14:11 被阅读22次

MYSQL服务器接收SQL格式的查询,首先要对sql进行解析,内部将文本格式转换为二进制结构,这个转换就是解析器,解析的目的是为了让优化器更好的处理指令,以便以最优的路径,最少的耗时返回我们想要的结果。

sql解析器的构成:

1、词法分析(Lexical scanner):作用是将整个查询分解为多个元素。

2、语法规则(Grammar rule module):寻找sql语法规则组合,产生一个序列,执行这些规则相关的代码。

1 and 2 产生一棵解析树,提供给优化器使用。

mysql解析器的特殊性在于它直接转换为程序内存中的内部解析的C/C++结构,而一般的解析器是将文本表达式转换为字节代码。

1. 源码解读解析器

MySQL语法解析封装在函数MYSQLparser中,包含两个模块:词法分析(Lexical scanner)和语法规则(Grammar rule module)。词法分析将整个SQL语句打碎成一个个单词(Token),而语法规则模块则根据MySQL定义的语法规则生成对应的数据结构,并存储在对象THD->LEX结构当中。最后优化器,根据这里的数据,生成执行计划,再调用存储引擎接口执行。词法分析和语法规则模块有两个较成熟的开源工具Flex和Bison分别用来解决这两个问题。MySQL出于性能和灵活考虑,选择了自行完成词法解析部分,语法规则部分使用Bison。词法解析和Bison沟通的核心函数是由词法解析器提供的函数接口yylex(),在Bison中,必要的时候调用yylex()获得词法解析的数据,完成自己的语法解析。Bison的入口为yyparse(),在MySQL中定义为MYSQLParse。

1.1. 解析示意

Bison在做语法解析后,会将解析结果(解析树/AST)存储在THD::LEX中,通过存储WHERE的数据结构来查看语法解析的结果。

1.2. 解析树的ITEM对象

在MYSQL中,有以下ITEM大类型:

FIELD_ITEM, FUNC_ITEM, 

SUM_FUNC_ITEM, 

STRING_ITEM, 

INT_ITEM, 

REAL_ITEM, 

NULL_ITEM, 

VARBIN_ITEM, 

COPY_STR_ITEM, 

FIELD_AVG_ITEM, 

DEFAULT_VALUE_ITEM, 

PROC_ITEM,COND_ITEM, 

REF_ITEM, 

FIELD_STD_ITEM, 

FIELD_VARIANCE_ITEM, 

INSERT_VALUE_ITEM, 

SUBSELECT_ITEM, 

ROW_ITEM, 

CACHE_ITEM, 

TYPE_HOLDER, 

PARAM_ITEM

其中许多ITEM还有小类,如Item_func有如下小类型:

UNKNOWN_FUNC,

EQ_FUNC,

EQUAL_FUNC,

NE_FUNC,

LT_FUNC,

LE_FUNC, 

GE_FUNC,

GT_FUNC,FT_FUNC, 

LIKE_FUNC,

NOTLIKE_FUNC,

ISNULL_FUNC,

ISNOTNULL_FUNC, 

COND_AND_FUNC, 

COND_OR_FUNC, 

COND_XOR_FUNC, 

BETWEEN, IN_FUNC, 

INTERVAL_FUNC, 

ISNOTNULLTEST_FUNC, 

SP_EQUALS_FUNC, 

SP_DISJOINT_FUNC,

SP_INTERSECTS_FUNC, 

SP_TOUCHES_FUNC,

SP_CROSSES_FUNC,

SP_WITHIN_FUNC, 

SP_CONTAINS_FUNC,

SP_OVERLAPS_FUNC, 

SP_STARTPOINT,

SP_ENDPOINT,

SP_EXTERIORRING, 

SP_POINTN,

SP_GEOMETRYN,

SP_INTERIORRINGN, 

NOT_FUNC, 

NOT_ALL_FUNC, 

NOW_FUNC, 

VAR_VALUE_FUNC

1.3. ITEM语法树


1.4. FIELD 类型

enum enum_field_types { 

MYSQL_TYPE_DECIMAL, MYSQL_TYPE_TINY,

MYSQL_TYPE_SHORT,MYSQL_TYPE_LONG,

MYSQL_TYPE_FLOAT,MYSQL_TYPE_DOUBLE,

MYSQL_TYPE_NULL,MYSQL_TYPE_TIMESTAMP,

MYSQL_TYPE_LONGLONG,MYSQL_TYPE_INT24,

MYSQL_TYPE_DATE, MYSQL_TYPE_TIME,

MYSQL_TYPE_DATETIME,MYSQL_TYPE_YEAR,

MYSQL_TYPE_NEWDATE,

MYSQL_TYPE_ENUM=247,

MYSQL_TYPE_SET=248,

MYSQL_TYPE_TINY_BLOB=249,

MYSQL_TYPE_MEDIUM_BLOB=250,

MYSQL_TYPE_LONG_BLOB=251,

MYSQL_TYPE_BLOB=252,

MYSQL_TYPE_VAR_STRING=253,

MYSQL_TYPE_STRING=254,

MYSQL_TYPE_GEOMETRY=255

};

1.5. FIELD和ITEM的关系

通过Item类中的tmp_table_field_from_field_type函数将一个Item类转化为一个Filed类返回,例如

Item_int ->Field_longlong

Item_real->Field_double

Item_string->Field_string

1.6. Bison语法中的WHERE

select_from ==>

---->from

join_table_list

where_clause

---->expr or expr

---->expr amd expr

---->……………………

---->simple_expr comp_op simple_expr

group_clausehaving_clause  opt_order_clause  opt_limit_clause

where 要点:

where_clause:

/ empty / {}

| WHERE expr

{

THD->lex->current_select->where = $2

}

expr:

...

| expr and expr 

{

$$ = new (YYTHD->mem_root) Item_cond_and($1, $3)

|ident comp_op NUM /简化版/

{

$$ = new Item_func_ge(a, b); /简化版/

}

通过解析就能生成where的语法树。

Where解析树的分支:如图

1.7. 总结

解析器的最终执行结果就是解析树,sql语法的复杂性要求具有同样复杂程度的结构,通过这种结构有效存储用于执行每个可能使用到的sql语句所需的信息。

解析树中重要的两个对象【enum_sql_command和select_lex】, sql_command显示sql类型,execute_command则指导调用相关函数。通过内核级别的调用,最终生成解析树,提供给优化器,最终完成我们的操作指令。

欢迎工作一到五年的Java工程师朋友们加入Java工程师学习交流群:795632998

群内提供免费的Java架构学习资料(里面有高可用、高并发、高性能及分布式、Jvm性能调优、Spring源码,MyBatis,Netty,Redis,Kafka,Mysql,Zookeeper,Tomcat,Docker,Dubbo,Nginx等多个知识点的架构资料)合理利用自己每一分每一秒的时间来学习提升自己,不要再用"没有时间“来掩饰自己思想上的懒惰!趁年轻,使劲拼,给未来的自己一个交代!

相关文章

  • MySQL内核源码解读-SQL解析之解析器浅析

    MYSQL服务器接收SQL格式的查询,首先要对sql进行解析,内部将文本格式转换为二进制结构,这个转换就是解析器,...

  • 查询处理相关实现

    参考:PostgreSQL数据库内核分析 Parser(sql解析器) 解析器对客户端执行的sql语句进行词法解析...

  • daily --mysql JOIN查询基础

    JOIN语句基础 SQL执行顺序 手写的SQL 手写代码经过MySQL解析器解析成机器识别的SQL

  • MySQL解析——MySQL内核源码解读

    一、SQL总体执行流程图 通过上面图,可以从全局上了解SQL语句执行流程以及与其他模块交互 1.1 SQL查询执行...

  • mysql体系架构图以及二进制安装mariadb

    SQL架构图 InnoDB 存储引擎层体系结构图 mysql的组成部分: mysql是由sql查询接口,解析器,优...

  • mysql深入学习01

    1.体系结构 Mysql是由SQL接口,解析器,优化器,缓存,存储引擎组成的(SQL Interface、Pars...

  • mysql工作原理介绍

    mysql是由sql接口、解析器、优化器、缓存、存储引擎组成。 image.png此图是mysql的内容架构。 部...

  • MySQL优化

    MySQL架构 网络连接层 服务层连接池系统管理和控制SQL接口解析器, 对SQL语句检查,生成解析树查询优化器缓...

  • SQL实战研究InnoDB架构设计

    业务系统通过一个数据库连接发给MySQL,经过SQL接口、解析器、优化器、执行器,解析SQL语句,生成执行计划,接...

  • mysql手工注入

    mysql数据库结构: SQL层的功能: 判断语法,语句,语义数据库对象授权情况判断,授权失败不继续解析(解析器)...

网友评论

    本文标题:MySQL内核源码解读-SQL解析之解析器浅析

    本文链接:https://www.haomeiwen.com/subject/shbyzftx.html