最近在调试Spark-SQL的时候看了一个OptimizeIn优化规则,该规则做了两个事情:
- 去除In中重复的Literal条件;
- 如果In中Literal条件数目大于optimizerInSetConversionThreshold(默认值为10),做In到InSet的表达式转换。
在做DataSource扩展filter pushdown的时候要注意处理这种优化。
源码如下:
-
image.png
实例:
- image.png
最近在调试Spark-SQL的时候看了一个OptimizeIn优化规则,该规则做了两个事情:
在做DataSource扩展filter pushdown的时候要注意处理这种优化。
源码如下:
实例:
本文标题:【Spark】SparkOptimizer 优化:Optimiz
本文链接:https://www.haomeiwen.com/subject/smwhwxtx.html
网友评论