閱讀(1.7k) 書(shū)簽贊(0) 我要糾錯(cuò)

OceanBase DISTINCT

2021-06-29 17:31 更新

DISTINCT 算子用于為對(duì)數(shù)據(jù)行去重，包括去除重復(fù)的 NULL 值。

DISTINCT 算子包括 HASH DISTINCT 和 MERGE DISTINCT。

HASH DISTINCT

HASH DISTINCT 算子使用 HASH 算法執(zhí)行 DISTINCT 運(yùn)算。

示例 1：使用 HASH 算法執(zhí)行 DISTINCT 運(yùn)算，對(duì) t1 表的 c1 列進(jìn)行去重處理

obclient>CREATE TABLE t1(c1 INT, c2 INT);
Query OK, 0 rows affected (0.09 sec)

obclient>CREATE TABLE t2(c1 INT, c2 INT);
Query OK, 0 rows affected (0.09 sec)

obclient>EXPLAIN SELECT /*+USE_HASH_AGGREGATION*/ DISTINCT c1 FROM t1\G;
*************************** 1. row ***************************
Query Plan: 
|=======================================
|ID|OPERATOR     |NAME|EST. ROWS|COST |
---------------------------------------
|0 |HASH DISTINCT|    |101      |99169|
|1 | TABLE SCAN  |t1  |100000   |66272|
=======================================
Outputs & filters: 
-------------------------------------
  0 - output([t1.c1]), filter(nil), 
      distinct([t1.c1])
  1 - output([t1.c1]), filter(nil), 
      access([t1.c1]), partitions(p0)

上述示例中，執(zhí)行計(jì)劃展示中 0 號(hào)算子 HASH DISTINCT 執(zhí)行去重運(yùn)算，outputs & filters 詳細(xì)展示了 HASH DISTINCT 算子的具體輸出信息如下：

信息名稱	含義
output	該算子的輸出列。
filter	該算子的過(guò)濾謂詞。由于示例中 HASH DISTINCT 算子沒(méi)有設(shè)置 filter，所以為 nil。
partition	查詢需要掃描的分區(qū)。
distinct	指定需要去重的列。例如，`distinct([t1.c1])` 的參數(shù) `t1.c1` 指定對(duì) t1 表的 c1 列進(jìn)行去重處理，并且采用 HASH 算法。

MERGE DISTINCT

MERGE DISTINCT 算子使用 MERGE 算法執(zhí)行 DISTINCT 運(yùn)算。

示例 2：使用 MERGE 算法執(zhí)行 DISTINCT 運(yùn)算

obclient>EXPLAIN SELECT /*+NO_USE_HASH_AGGREGATION*/ DISTINCT c1 FROM t1\G;
*************************** 1. row ***************************
Query Plan: 
|=======================================
|ID|OPERATOR      |NAME|EST. ROWS|COST|
---------------------------------------
|0 |MERGE DISTINCT|    |3        |40  |
|1 | SORT         |    |3        |39  |
|2 |  TABLE SCAN  |t1  |3        |37  |
=======================================
Outputs & filters: 
-------------------------------------
  0 - output([t1.c1]), filter(nil), 
      distinct([t1.c1])
  1 - output([t1.c1]), filter(nil), sort_keys([t1.c1, ASC])
  2 - output([t1.c1]), filter(nil), 
      access([t1.c1]), partitions(p0)

上述示例中，0 號(hào)算子 MERGE DISTINCT 執(zhí)行去重運(yùn)算，采用了 MERGE 算法，并且由于 2 號(hào)算子輸出的數(shù)據(jù)是無(wú)序的，而 MERGE DISTINCT 算子需要輸入的數(shù)據(jù)有序，所以在執(zhí)行去重運(yùn)算前需要使用 SORT 算子對(duì)數(shù)據(jù)排序。執(zhí)行計(jì)劃展示中的 outputs & filters 詳細(xì)展示了 MERGE DISTINCT 算子的輸出信息如下：

信息名稱

含義

output

該算子的輸出列。

filter

該算子的過(guò)濾謂詞。

由于示例中 MERGE DISTINCT 算子沒(méi)有設(shè)置 filter，所以為 nil。

distinct

指定需要去重的列。

例如，distinct([t1.c1]) 的參數(shù) t1.c1 指定對(duì) t1 表的 c1 列進(jìn)行去重處理，并且采用 MERGE 算法。

以上內(nèi)容是否對(duì)您有幫助：

← OceanBase SUBPLAN FILTER

OceanBase SEQUENCE →

寫(xiě)筆記

我要補(bǔ)充