Hive优化器原理与源码解析系列—统计信息带谓词选择率Selectivity

背景
Apache Calcite基础知识
- 关键术语SQL、SqlNode、RelNode、RexNode、RelCall之间区别与联系
- 一个SQL语法解析过程
谓词Predicate
- 谓词描述及分类（等值谓词、非等值谓词、常量谓词、AND连接谓词、OR连接谓词、函数谓词等）
详解带谓词选择率Selectivity计算
总结

背景

之前文章有写过关于基于Operator操作符Selectivity选择率讲解，“Hive优化器原理与源码解析系列—统计信息之选择性和基数”，其中有讲过详细讲解Cardinality基数和Selectivity选择率的计算。但这篇文章主要内容讲述stats统计信息模块关于Predicate谓词的Selectivity选择率的讲解，为了方便讲述。这里还是先简单提一下Cardinality基数和Selectivity选择率概念：

基数：某列唯一键的数量，称为基数，即某列非重复值的数量。
选择率：某列基数与总行数的比值再乘以100%，则称为某列选择率

使用Selectivity选择率来估算对应结果集的Cardinality基数的，Selectivity选择率和Cardinality之间的关系如下

Cardinality=NUM_ROWS*selectivity

其中，NUM_ROWS表示表的总行数。同时总行数Row Count也是成本模型Cost Model的记录数、IO、CPU元素之一。

基于成本优化器CBO是根据成本模型CostModel和统计信息，估算一个关系表达式RelNode成本高低，再使用动态规划算法选出整体成本最优的执行计划BestPlan。所以对于基于成本优化器的来讲，成本模型设计的是否合理和完善，统计信息收集是否准确，直接影响优化器生成的执行计划的准确性。谓词Selectivity选择率属于stats统计信息的重要组成部分。

前面文章都有提过Hive优化器模块基于Apache Calcite动态数据管理框架实现的。接下来补充一下Apache Calicte此篇文章用到简单的基础知识，后续会推出Apache Calcite知识的专题文章。

Calcite基础知识

Apache Calcite关键术语
- SQL 查询语句
- SqlNode 表示为一个SQL的抽象语法树AST
- RelNode 关系表达式，表示为逻辑执行计划logicPlan
- RexNode 行表达式，可理解为基于字段级的表达式，select cast(a as int),id from table1中cast(a as int)，id字段的行表达式
- RelCall 继承了RexNode，可理解为带有一个或多个操作数的运算符的调用表示的表达式如CASE ... WHEN ... END，cast()或、-、* 、/ 加减乘除运算符的调用
一个SQL解析过程

一般数据库查询处理流程：

SQL查询提交后，数据库对SQL进行重写优化（可选），对SQL进行词法分析、语法分析再生成抽象语法树AST，绑定元数据信息Catalog进行语义验证，优化器再根据CostModel成本模型和stats统计信息来计算成本，并选出最优的执行计划，再生成物理执行计划去进行数据处理。

Apache Calcite处理流程也是类似：

Parser. Calcite通过Java CC将SQL解析成未经校验的AST
Validate. 校证Parser步骤中的AST是否合法,如验证SQL scheme、字段、函数等是否存在; SQL语句是否合法等. 生成了RelNode树
Optimize. 优化RelNode树的关键, 并将其转化成物理执行计划。主要涉及SQL规则优化如:基于规则优化(RBO)及基于代价(CBO)优化; Optimzer是可选的, 通过Validate后的RelNode树已经可以直接转化物理执行计划，但现代的SQL解析器基本上都包括有这一步，目的是优化SQL执行计划。此步得到的结果为物理执行计划。
Execute. 执行阶段。将物理执行计划转化成可在特定的平台执行的程序。如Hive与Flink都在在此阶段将物理执行计划CodeGen生成相应的可执行代码。

谓词Predicate

谓词定义：

谓词Predicate，通常为计算结果是TRUE、FALSE、UNKOWN的表达式。在SQL中的谓词，是被应用在Where从句、Having从句和Join 关联ON从句中或其他布尔值表达式中。谓词分为等值谓词、非等值谓词、常量谓词、AND连接谓词、OR连接谓词、函数谓词。

例如，SELECT * FROM EMP WHERE EMPNO = 123456;查询员工表，员工编号为123456的员工的所有信息。

在本例中，"EMPNO=123456" 就是一个谓词:

EMPNO结果不同，返回的结果为：

TRUE，如果EMPNO = 123456
FALSE，如果EMPNO 不为123456，
UNKNOW，如果EMPNO is NULL
谓词也分类可分类为等值谓词、非等值谓词、常量谓词、AND连接谓词、OR连接谓词、函数谓词
AND、OR、NOT
>, <, >=, <=, <> 或 !=
[NOT] IN
[NOT] Exists
LIKE
BETWEEN
IS [NOT] NULL

详解带谓词选择率Selectivity计算

谓词选择率Selectivity是基于RexCall行表达式的。RexCall是对RexNode行表达式继承实现的。RexCall可理解为带有一个或多个操作数的运算符的调用表示的表达式，如a > b 表达式，表示为 ">"大于运算符对操作数a、b调用的RexCall；还如( a>b ) and ( c > b)也是RexCall。

从RexCall来判断操作符的类型，来判断是何种谓词，在根据不同的谓词来估算不同的谓词选择率。

这里提一下Calcite框架中列引用类的定义RexInputRef，下面源码解析时会提到，它是一个输入表达式RelNode的字段引用变量。字段序号是0开始的，如果有多个字段，序号递增表示的，如join的两个输入RelNode表达式。RexInputRef(int index, RelDataType type)

例如，这里有两张表关联的例子：

员工表（员工编号，员工名称，部门编号）

部门表（部门编号，部门名称）

也可Calcite 中可表示为Input RelNode（TableScan）：

Input #0: EMP(EMPNO, ENAME, DEPTNO)

Input #1: DEPT(DEPTNO AS DEPTNO2, DNAME)

员工表和部门表两张表作为Input RelNode输入表达式，然后两张表使用部门编号进行内关联INNER JOIN：

SELECT

EMP.EMPNO,

EMP.ENAME,

EMP.DEPTNO,

DEPT.DEPTNO2，

DEPT.DNAME，

FROM EMP INNER JOIN DEPT ON EMP.DEPTNO = DEPT.DEPTNO2

那么它们对应的字段名称和序号Index如下对应关系：

Field #0: EMPNO

Field #1: ENAME

Field #2: DEPTNO (from EMP)

Field #3: DEPTNO2 (from DEPT)

Field #4: DNAME

这里 RexInputRef(3, Integer) 是从Input RelNode输入关系表达式DEPT对字段DEPTNO2的引用，其中3是字段DEPTNO2的序号，Integer是字段的数据类型。

下面都Selectivity都会用到Input RelNode输入关系表达式的列应用信息。

1）从统计信息中，获取最大为NULL列的记录数MaxNulls

在HiveMeta元数据信息表TAB_COL_STATS或PART_COL_STATS收集了每列的为null的记录数，通过表的所有为null列的比较找到null列的最大记录数MaxNulls。再通过总记录TotalRowCount - MaxNulls估算出非空记录数。

从RexCall调用表达式中获取，HiveCalciteUtil.getInputRefs方法返回列引用的序号集合，在通过TableScan获取每列的统计信息ColStatistics列表，就是上述讲到TAB_COL_STATS或PART_COL_STATS收集的MaxNulls信息。求出最大值并返回。

代码语言：javascript复制

private long getMaxNulls(RexCall call, HiveTableScan t) {
  long tmpNoNulls = 0;
  long maxNoNulls = 0;

  Set<Integer> iRefSet = HiveCalciteUtil.getInputRefs(call); //输入参数引用列索引号集合
  List<ColStatistics> colStats = t.getColStat(new ArrayList<Integer>(iRefSet)); //获取 输入引用列 统计信息列表，遍历这些列表，取得最大为空的号

  for (ColStatistics cs : colStats) { //遍历这些统计信息，基于列的在Hive元数据库中，Tal_col_stats 和 par_cols_stats两表内分别存放最大为空的记录数
    tmpNoNulls = cs.getNumNulls();
    if (tmpNoNulls > maxNoNulls) {
      maxNoNulls = tmpNoNulls;
    }
  }
  return maxNoNulls;
}

2）从统计信息，获取NUM_DISTINCTS每列非重复记录数

从RexCall调用表达式获取Operands操作数集合（区别于Operator操作符），如果操作数operator是RexInputRef引用列对象，则HiveRelMdDistinctRowCount.getDistinctRowCount获取列序号，从HiveMeta元数据从中获取NUM_DISTINCTS每列的非空记录数。遍历这些操作数operator的NDV（非空记录数）并从中选择最大非重复记录数。如操作数operator不是是RexInputRef引用列对象，则对操作数operator进行遍历模式找出引用的列索引，之后同上述一张找出最大非重复记录数。

代码语言：javascript复制

private Double getMaxNDV(RexCall call) {
  double tmpNDV;
  double maxNDV = 1.0;
  InputReferencedVisitor irv;
  RelMetadataQuery mq = RelMetadataQuery.instance();
  for (RexNode op : call.getOperands()) {
    if (op instanceof RexInputRef) {
      tmpNDV = HiveRelMdDistinctRowCount.getDistinctRowCount(this.childRel, mq,
          ((RexInputRef) op).getIndex());//
      if (tmpNDV > maxNDV)
        maxNDV = tmpNDV;
    } else {
      irv = new InputReferencedVisitor();
      irv.apply(op);
      for (Integer childProjIndx : irv.inputPosReferenced) {
        tmpNDV = HiveRelMdDistinctRowCount.getDistinctRowCount(this.childRel,
            mq, childProjIndx);
        if (tmpNDV > maxNDV)
          maxNDV = tmpNDV;
      }
    }
  }
  return maxNDV;
}

3）常量谓词Selectivity

行表达式常量，如果常量一直为False，则选择率为0. 如果一直为True，则选择率为1，即100%

代码语言：javascript复制

 //访问常量，如果是false为0，如果是true为1
  public Double visitLiteral(RexLiteral literal) {
    if (literal.isAlwaysFalse()) {
      return 0.0;
    } else if (literal.isAlwaysTrue()) {
      return 1.0;
    } else {
      assert false;
    }
    return null;
  }
}

4）AND连接的谓词的选择率Selectivity

从RexCall的操作数operand集合并遍历获取每个RexNode的Selectivity。

AND连接谓词的命中率=各个子连接谓词元素的选择率Selectivity的累乘，即谓词1的Selectivity * 谓词2的Selectivity * 谓词3的Selectivity…。如果谓词选择率为null，则选择率为100%。

代码语言：javascript复制

private Double computeConjunctionSelectivity(RexCall call) {
  Double tmpSelectivity;
  double selectivity = 1;
  for (RexNode cje : call.getOperands()) {
    tmpSelectivity = cje.accept(this);//对RexVisitorImpl当前对象的遍历，并返回选择率
    if (tmpSelectivity != null) {
      selectivity *= tmpSelectivity;
    }
  }

  return selectivity;
}

5）OR连接的谓词的选择率Selectivity

选择率取值范围[0-1]，如果选择率大于1，则最大值1，即100%，如果小于0，则取值0.

从RexCall的操作数operand集合并遍历获取每个RexNode的Selectivity。如果选择率Selectivity为null，默认值0.99。用当前RelNode对象基数childCardinality计算和每个operator的选择率Selectivity计算出其基数tmpCardinality。

如果当前operator的操作数基数范围[1-childCardinality]，则当前operator的选择率Selectivity：

选择率Selectivity = 1-当前operator的基数Cardinality / 总基数。否则为100*

那么，OR连接的谓词的选择率Selectivity = 1 - AND连接的谓词的选择率Selectivity

*注：AND连接的谓词的选择率Selectivity = 所有Operator的选择率Selectivity累乘

代码语言：javascript复制

private Double computeDisjunctionSelectivity(RexCall call) {
  Double tmpCardinality;
  Double tmpSelectivity;
  double selectivity = 1;

  for (RexNode dje : call.getOperands()) {
    tmpSelectivity = dje.accept(this);
    if (tmpSelectivity == null) {
      tmpSelectivity = 0.99;
    }
    tmpCardinality = childCardinality * tmpSelectivity;
    if (tmpCardinality > 1 && tmpCardinality < childCardinality) {
      tmpSelectivity = (1 - tmpCardinality / childCardinality);
    } else {
      tmpSelectivity = 1.0;//不满足条件则返回100%
    }
    selectivity *= tmpSelectivity;
  }

  if (selectivity < 0.0)
    selectivity = 0.0;

  return (1 - selectivity); //OR连接的谓词的选择率Selectivity = 1 - AND连接的谓词的选择率Selectivity
}

6）函数Functions的选择率Selectivity

通常>, >=, <, <=, =也当成Fuction函数来计算选择率Selectivity

Functions的选择率Selectivity = 1 / RexCall最大非重复个数，如f(x,y,z)选择率 = 1/maxNDV(x,y,z)。

代码语言：javascript复制

private Double computeFunctionSelectivity(RexCall call) {
  return 1 / getMaxNDV(call);//求最大非重复个数，
}

7）非等值谓词的选择率Selectivity

非等值谓词选择率Selectivity，如<> 或 != 或 Not取反的选择率Selectivity计算。

非等值谓词的选择率Selectivity = 1 - 1/getMaxNDV(call)

代码语言：javascript复制

private Double computeNotEqualitySelectivity(RexCall call) {
  double tmpNDV = getMaxNDV(call);
  if (tmpNDV > 1)
    return (tmpNDV - (double) 1) / tmpNDV;
  else
    return 1.0;
}

8) 计算各种谓词选择率Selectivity的汇总：

这是一个返回谓词选择率的visitCall汇总函数，通过判断RexCall谓词类型返回相应的谓词选择率，AND、OR、NOT或非等值，IS NOT NULL，IN，大于、等于、大于等于、小于、小于等于（默认选择率为1/3），其余默认谓词选择率为函数选择率。

代码语言：javascript复制

public Double visitCall(RexCall call) {
  if (!deep) {
    return 1.0;
  }
  /*
   * Ignore any predicates on partition columns because we have already
   * accounted for these in the Table row count.
   * 忽略分区上的，因为已经从全局Table中取得记录数
   */
  if (isPartitionPredicate(call, this.childRel)) {//判断是否为分区上的谓词，如果是父node需要分解，递归继续调用
    return 1.0;
  }

  Double selectivity = null;
  SqlKind op = getOp(call);

  switch (op) {
  case AND: {
    selectivity = computeConjunctionSelectivity(call);//分解为and连接命中率
    break;
  }
  case OR: {
    selectivity = computeDisjunctionSelectivity(call); //分解为or连接命中率
    break;
  }
  case NOT:
  case NOT_EQUALS: {
    selectivity = computeNotEqualitySelectivity(call); //分解为非等值命中率
    break;
  }
  case IS_NOT_NULL: {
    if (childRel instanceof HiveTableScan) {
      double noOfNulls = getMaxNulls(call, (HiveTableScan) childRel);
      double totalNoOfTuples = childRel.getRows();

      if (totalNoOfTuples >= noOfNulls) {
        selectivity = (totalNoOfTuples - noOfNulls) / Math.max(totalNoOfTuples, 1);
      } else {
        throw new RuntimeException("Invalid Stats number of null > no of tuples");
      }
    } else {
      selectivity = computeNotEqualitySelectivity(call);
    }
    break;
  }

  case LESS_THAN_OR_EQUAL:
  case GREATER_THAN_OR_EQUAL:
  case LESS_THAN:
  case GREATER_THAN: {
    selectivity = ((double) 1 / (double) 3);  //小于或等于、大于或等于，小于、大于默认的命中率都为1/3
    break;
  }

  case IN: {
    // TODO: 1) check for duplicates 2) We assume in clause values to be
    // present in NDV which may not be correct (Range check can find it) 3) We
    // assume values in NDV set is uniformly distributed over col values
    // (account for skewness - histogram).
    selectivity = computeFunctionSelectivity(call) * (call.operands.size() - 1);
    if (selectivity <= 0.0) {
      selectivity = 0.10;
    } else if (selectivity >= 1.0) {
      selectivity = 1.0;
    }
    break;
  }

  default:
    selectivity = computeFunctionSelectivity(call);//默认值：1/最大不重复记录数
  }
  return selectivity;
}

总结

Selectivity的计算详解选择率计算的准确性是CBO构建bestPlan执行计划的很重要的一部分。谓词选择率可分类为等值谓词、非等值谓词、常量谓词、AND连接谓词、OR连接谓词、函数谓词等选择率Selectivity的计算。

sql hive apache

0 人点赞