美文网首页大数据数据联邦&软件开发
执行计划分析 · datalake · 正则表达式(202206

执行计划分析 · datalake · 正则表达式(202206

作者: sinwaj | 来源:发表于2022-06-25 15:34 被阅读0次


一、背景

 本文介绍正则表达式解析数据分析引擎所产生的执行计划,最后能够以易懂的方式分析执行计划,进而为SQL优化提供帮助。

二、正则表达式

基础语法: "^([]{})([]{})([]{})$"

正则字符串 = "开始([包含内容]{长度})([包含内容]{长度})([包含内容]{长度})结束"

二、解析案例

1.Gather Motion

输入:Gather Motion 2:1  (slice1; segments: 2)  (cost=0.00..431.00 rows=1 width=8)

规则:(.*) \((cost=(.*)\.\.(.*) ){0,1}rows=(.*) width=(.*)\)

解读:"(.*)任意长度文本"   "\( 转义左括号"  

            "cost=文本开头 (.*)任意文本  \.\. 两个点 (.*) 任意文本 ){0,1} 长度为0或1" 

图1 类型匹配

2.域段分解

图3 域段

三、项目代码

https://github.com/sinwaj/planchecker

相关文章

网友评论

    本文标题:执行计划分析 · datalake · 正则表达式(202206

    本文链接:https://www.haomeiwen.com/subject/oymivrtx.html