ROWNUM是一个伪列,它返回一个数字,表示从查询中获取结果的行编号。第一行的ROWNUM为1,第二行的为2,以此类推,使用ROWNUM来限制查询返回的行数,如以下示例所示:
gaussdb=# CREATE TABLE Students (name varchar(20), id int) with (STORAGE_TYPE = USTORE);
gaussdb=# INSERT INTO Students VALUES ('Jack', 35);
gaussdb=# INSERT INTO Students VALUES ('Leon', 15);
gaussdb=# INSERT INTO Students VALUES ('James', 24);
gaussdb=# INSERT INTO Students VALUES ('Taker', 81);
gaussdb=# INSERT INTO Students VALUES ('Mary', 25);
gaussdb=# INSERT INTO Students VALUES ('Rose', 64);
gaussdb=# INSERT INTO Students VALUES ('Perl', 18);
gaussdb=# INSERT INTO Students VALUES ('Under', 57);
gaussdb=# INSERT INTO Students VALUES ('Angel', 101);
gaussdb=# INSERT INTO Students VALUES ('Frank', 20);
gaussdb=# INSERT INTO Students VALUES ('Charlie', 40);
--输出表Students前10行。
gaussdb=# SELECT * FROM Students WHERE rownum <= 10;
name | id
-------+-----
Jack | 35
Leon | 15
James | 24
Taker | 81
Mary | 25
Rose | 64
Perl | 18
Under | 57
Angel | 101
Frank | 20
(10 rows)
|
如果有子句跟在同一查询语句中,则结果输出的行将按照子句重新排序:
gaussdb=# SELECT * FROM Students WHERE rownum < 5 order by 1;
name | id
-------+----
Jack | 35
James | 24
Leon | 15
Taker | 81
(4 rows)
|
如果将子句嵌入到子查询中并将条件放在最外层的查询中,则能够在排序后使用ROWNUM条件:
gaussdb=# SELECT rownum, * FROM (SELECT * FROM Students order by 1) WHERE rownum <= 2;
rownum | name | id
--------+---------+-----
1 | Angel | 101
2 | Charlie | 40
(2 rows)
|
当ROWNUM大于正整数的值,认为条件始终为 false。例如以下所示,该语句不会返回表中任何结果:
gaussdb=# SELECT * FROM Students WHERE rownum > 1;
name | id
------+----
(0 rows)
|
使用ROWNUM指定给表的一定范围的每一行分配值:
gaussdb=# SELECT * FROM Students;
name | id
---------+-----
Jack | 35
Leon | 15
James | 24
Taker | 81
Mary | 25
Rose | 64
Perl | 18
Under | 57
Angel | 101
Frank | 20
Charlie | 40
(11 rows)
gaussdb=# UPDATE Students set id = id + 5 WHERE rownum < 4;
UPDATE 3
gaussdb=# SELECT * FROM Students;
name | id
---------+-----
Jack | 40
Leon | 20
James | 29
Taker | 81
Mary | 25
Rose | 64
Perl | 18
Under | 57
Angel | 101
Frank | 20
Charlie | 40
(11 rows)
gaussdb=# DROP TABLE Students;
DROP TABLE
|
使用ROWNUM有一定的约束条件:
- ROWNUM不可作为别名,以免SQL语句出现歧义。
- 创建索引时不可使用ROWNUM。
- 创建表时默认值不可为ROWNUM。
- Where子句中不可使用ROWNUM的别名。
- 在插入数据时不可使用ROWNUM。
- 在无表查询中不可以使用ROWNUM。
- ROWNUM不能用于Limit子句。
- ROWNUM不能用于EXECUTE语句的参数。
- UPSERT语句不支持ROWNUM用做update子句更新。
- SELECT ... FOR UPDATE语句不支持ROWNUM用作投影列和WHERE条件。
- 若having子句中含有ROWNUM(且不在聚合函数中)时,group by子句中必须含有ROWNUM(且不在聚合函数中),除非group by子句存在表达式,例如:SELECT a + a FROM t group by a + a having rownum < 5。
- having子句中如果存在ROWNUM条件则不允许having子句下推至扫描节点:
gaussdb=# CREATE TABLE test (a int, b int);
NOTICE: The 'DISTRIBUTE BY' clause is not specified. Using 'a' as the distribution column by default.
HINT: Please use 'DISTRIBUTE BY' clause to specify suitable data distribution column.
CREATE TABLE
gaussdb=# INSERT INTO test SELECT generate_series, generate_series FROM generate_series(1, 10);
INSERT 0 10
--rownum条件不能下推至seqscan。
gaussdb=# EXPLAIN SELECT a,rownum FROM test group by a,rownum having rownum < 5;
QUERY PLAN
-------------------------------------------------------------------------
HashAggregate (cost=3.45..3.49 rows=3 width=4)
Group By Key: a, ROWNUM
Filter: ((ROWNUM) < 5::numeric)
-> Rownum (cost=0.19..3.40 rows=10 width=4)
-> Streaming (type: GATHER) (cost=0.19..3.40 rows=10 width=4)
Node/s: All datanodes
-> Seq Scan on test (cost=0.00..3.03 rows=10 width=4)
(7 rows)
|
- 子查询中如果存在ROWNUM条件则不允许谓词下推至扫描节点:
gaussdb=# EXPLAIN SELECT * FROM (SELECT * FROM test WHERE rownum < 5) WHERE b < 5; -- b<5 不能下推至seqscan
QUERY PLAN
-----------------------------------------------------------------------------------
Streaming (type: GATHER) (cost=0.06..0.63 rows=2 width=8)
Node/s: All datanodes
-> Subquery Scan on __unnamed_subquery__ (cost=0.00..0.50 rows=2 width=8)
Filter: (__unnamed_subquery__.b < 5)
-> Rownum (cost=0.00..0.45 rows=4 width=8)
StopKey: (ROWNUM < 5::numeric)
-> Streaming(type: BROADCAST) (cost=0.00..1.36 rows=12 width=8)
Spawn on: All datanodes
-> Rownum (cost=0.00..1.35 rows=4 width=8)
StopKey: (ROWNUM < 5::numeric)
-> Seq Scan on test (cost=0.00..3.03 rows=10 width=8)
(11 rows)
gaussdb=# DROP TABLE test;
DROP TABLE
|
- ROWNUM查询结果将会由于CN接收DN数据的顺序不同导致查询结果不稳定。
gaussdb=# CREATE TABLE test(a int, b int);
gaussdb=# INSERT INTO test VALUES(generate_series(1,10),generate_series(1,10));
--CN先收到DN1数据再收到DN2数据。
gaussdb=# SELECT rownum,* FROM test;
rownum | a | b
--------+----+----
1 | 1 | 1
2 | 2 | 2
3 | 5 | 5
4 | 6 | 6
5 | 8 | 8
6 | 9 | 9
7 | 3 | 3
8 | 4 | 4
9 | 7 | 7
10 | 10 | 10
(10 rows)
--CN先收到DN2数据再收到DN1数据。
gaussdb=# SELECT rownum,* FROM test;
rownum | a | b
--------+----+----
1 | 3 | 3
2 | 4 | 4
3 | 7 | 7
4 | 10 | 10
5 | 1 | 1
6 | 2 | 2
7 | 5 | 5
8 | 6 | 6
9 | 8 | 8
10 | 9 | 9
(10 rows)
|
- 不推荐ROWNUM条件用于JOIN ON子句,GaussDB中ROWNUM条件用于JOIN ON子句时在LEFT JOIN、RIGHT JOIN、FULL JOIN场景下和MERGE INTO场景下与其他数据库行为不一致,直接进行业务迁移存在风险。
当父查询中有rownum限制条件同时子查询的投影列中有rownum时,该限制条件将下推至子查询。其中约束条件如下:
- 只有父查询rownum限制条件为“<”、“<=”、“=”,且子查询直接用rownum作为伪列时,才可以下推。
- 父查询中有多个对子查询中rownum的过滤条件并且满足下推要求时,按顺序仅下推第一个过滤条件。
- 当子查询中包括volatile函数、存储过程时不能下推。