SELECT

Name

SELECT, TABLE, WITH -- 从表或视图中取出若干行

Synopsis

[ WITH [ RECURSIVE ] with_query [, ...] ]
SELECT [ ALL | DISTINCT [ ON ( expression [, ...] ) ] ]
    * | expression [ [ AS ] output_name ] [, ...]
    [ FROM from_item [, ...] ]
    [ WHERE condition ]
    [ GROUP BY expression [, ...] ]
    [ HAVING condition [, ...] ]
    [ WINDOW window_name AS ( window_definition ) [, ...] ]
    [ { UNION | INTERSECT | EXCEPT } [ ALL ] select ]
    [ ORDER BY expression [ ASC | DESC | USING operator ] [ NULLS { FIRST | LAST } ] [, ...] ]
    [ LIMIT { count | ALL } ]
    [ OFFSET start [ ROW | ROWS ] ]
    [ FETCH { FIRST | NEXT } [ count ] { ROW | ROWS } ONLY ]
    [ FOR { UPDATE | SHARE } [ OF table_name [, ...] ] [ NOWAIT ] [...] ]

where from_item can be one of:

    [ ONLY ] table_name [ * ] [ [ AS ] alias [ ( column_alias [, ...] ) ] ]
    ( select ) [ AS ] alias [ ( column_alias [, ...] ) ]
    with_query_name [ [ AS ] alias [ ( column_alias [, ...] ) ] ]
    function_name ( [ argument [, ...] ] ) [ AS ] alias [ ( column_alias [, ...] | column_definition [, ...] ) ]
    function_name ( [ argument [, ...] ] ) AS ( column_definition [, ...] )
    from_item [ NATURAL ] join_type from_item [ ON join_condition | USING ( join_column [, ...] ) ]

and with_query is:

    with_query_name [ ( column_name [, ...] ) ] AS ( select )

TABLE { [ ONLY ] table_name [ * ] | with_query_name }

描述

SELECT将从零个或更多表中返回记录行。SELECT通常的处理如下:

  1. (See WITH Clause below.) 在WITH列表中的所有查询都被计算。这些可以有效地充当在 FROM列表中可以被参照的临时表。在FROM 中的一个引用多于一次的WITH查询仅计算一次。

  2. 计算列出在FROM中的所有元素(FROM列表中 的每个元素都是一个实际的或虚拟的表)。 如果在FROM列表里声明了多个元素,那么他们就交叉连接在一起 (参见下面的FROM子句子句)。

  3. 如果声明了WHERE子句,那么在输出中消除所有不满足条件的行。 参见下面的 WHERE子句子句。

  4. 如果声明了GROUP BY子句,输出就分成匹配一个或多个数值的不同组里。 如果出现了HAVING子句,那么它消除那些不满足给出条件的组。 参见下面的GROUP BY子句子句和 HAVING子句子句。

  5. 实际输出行将使用SELECT输出表达式针对每一个选中的行进行计算。 参见下面的SELECT列表列表。

  6. 使用UNIONINTERSECTEXCEPT可以把多个SELECT语句的输出合并成一个结果集。 UNION操作符返回两个结果集的并集。INTERSECT操作符返回两个结果集的交集。 EXCEPT操作符返回在第一个结果集对第二个结果集的差集。不管哪种情况,重复的行都被删除, 除非声明了ALL。参阅下面的UNION 子句子句、INTERSECT子句子句、EXCEPT子句子句。

  7. 如果声明了ORDER BY子句,那么返回的行将按照指定的顺序排序。 如果没有给出ORDER BY,那么数据行是按照系统认为可以最快生成的顺序给出的。 参阅下面的ORDER BY子句子句。

  8. DISTINCT从结果中删除那些重复的行。DISTINCT ON删除那些匹配所有指定表达式的行。 ALL(缺省)将返回所有候选行,包括重复的。参阅下面的DISTINCT子句子句。

  9. 如果给出了LIMITFETCH FIRST)或 OFFSET子句,那么SELECT语句只返回结果行的一个子集。 参阅下面的LIMIT子句子句。

  10. 如果声明了FOR UPDATEFOR SHARE子句, 那么SELECT语句对并发的更新锁住选定的行。参阅下面的FOR UPDATE/FOR SHARE子句子句。

您必须有SELECT权限用于SELECT命令中每一列。 使用FOR UPDATEFOR SHARE还要求UPDATE权限。 (至少在如此选定的每表的一个列上。)

参数

WITH Clause

WITH子句允许您指定一个或者多个可以通过主查询中的名称参照的子句。 子查询在整个主查询期间有效地充当临时表或者视图。

一个名称(有模式修饰)必须对每个WITH查询指定。根据需要, 可以指定一个列名列表;若省略了这些,列名可从主查询省略。

如果RECURSIVE已指定,它允许一个子查询通过名称引用自身。 这样一个子查询必须按如下格式

non_recursive_term UNION [ ALL ] recursive_term

此时递归的自我参照必须出现在UNION的左边一侧。每个查询中仅允许 一个递归的自我查询。

RECURSIVE的另一个作用是WITH不需要配需: 一个查询可以参照在列表后的另一个。(然而,循环引用,或者互递归,在这里没有实现。) 没有RECURSIVEWITH查询只能参照早些时候 在WITH中的同类的WITH查询,

WITH查询的一个有效性能是:每次执行主查询时他们仅评估一次, 即使主查询引用过他们不止一次。

请参阅Section 7.8获取其他信息。

FROM子句

FROM子句为SELECT声明一个或者多个源表。 如果声明了多个源表,那么结果就是所有源表的笛卡儿积(交叉连接)。 但是通常会添加一些条件,把返回行限制成笛卡儿积的一个小的子集。

The FROM子句可以包括下列元素:

table_name

一个现存的表或视图的名字(可以有模式修饰)。如果声明了ONLY,则只扫描该表; 否则,该表和所有其派生表(如果没有声明ONLY)都被扫描。

alias

为那些包含别名的FROM项目取的别名。别名用于缩写或者在自连接中消除歧义 (自连接中同一个表将扫描多次)。如果提供了别名,那么它就会完全隐藏表或者函数的实际名字; 比如,如果给出FROM foo AS f,那么SELECT剩下的东西必须把这个FROM项按照 f而不是foo引用。 如果写了别名,也可以提供一个字段别名列表,这样可以替换表中一个或者多个字段的名字。

select

可以在FROM子句里出现一个子SELECT。 它的输出作用好像是为这条SELECT命令在其生存期里创建一个临时表。 请注意这个子SELECT必须用园括弧包围。并且必须给它一个别名。 当然,VALUES同样也可以在这里使用。

with_query_name

名可以提供与对一个表相同的方式。 一个WITH查询通过写其名称来引用,正如查询的名字是一个表名。 实际上WITH查询为主查询隐藏相同名称的任何实际表。必要时, 您可以通过模式修饰的表的名称引用一个相同名称的真实表。

function_name

函数(特别是那些返回结果集的函数)调用可以出现在FROM子句里。 这么做就好像在这个SELECT命令的生命期中,把函数的输出创建为一个临时表一样。 当然也可以使用别名。如果写了别名,还可以写一个字段别名列表, 为函数返回的复合类型的一个或多个属性提供名字替换。如果函数定义为返回record类型, 那么必须出现一个AS关键字或者别名, 后面跟着一个形如( column_name data_type [, ... ] )的字段定义列表。 这个字段定义列表必须匹配函数返回的字段的实际数目和类型。

join_type

下列之一

  • [ INNER ] JOIN

  • LEFT [ OUTER ] JOIN

  • RIGHT [ OUTER ] JOIN

  • FULL [ OUTER ] JOIN

  • CROSS JOIN

必须为INNEROUTER连接类型声明一个连接条件, 也就是NATURALON join_conditionUSING (join_column [, ...])之一。 它们的含义见下文,对于CROSS JOIN而言,这些子句都不能出现。

一个JOIN子句组合两个FROM项。 必要时使用圆括弧以决定嵌套的顺序。 如果没有圆括弧,JOIN从左向右嵌套。在任何情况下, JOIN都比逗号分隔的FROM项绑定得更紧。

CROSS JOININNER JOIN生成一个简单的笛卡儿积, 和您在FROM的顶层列出两个项的结果相同。 CROSS JOIN等效于INNER JOIN ON (TRUE),也就是说,没有被条件删除的行。 这种连接类型只是符号上的方便,因为它们和您用简单的FROMWHERE的效果一样。

LEFT OUTER JOIN返回笛卡儿积中所有符合连接条件的行, 再加上左表中通过连接条件没有匹配右表行的那些行。这样,左边的行将扩展成生成表的全长, 方法是在那些右表对应的字段位置填上NULL 。请注意,只在计算匹配的时候, 才使用JOIN子句的条件,外层的条件是在计算完毕之后施加的。

相应的,RIGHT OUTER JOIN返回所有内连接的结果行, 加上每个不匹配的右边行(左边用NULL扩展)。这只是一个符号上的便利, 因为总是可以把它转换成一个LEFT OUTER JOIN,只要把左边和右边的输入对掉一下即可。

FULL OUTER JOIN返回所有内连接的结果行, 加上每个不匹配的左边行(右边用NULL扩展), 再加上每个不匹配的右边行(左边用NULL扩展)。

ON join_condition

join_condition是一个导致boolean 类型值的表达式(类似于一个WHERE子句)这指定在连接中哪些行认为是匹配的。

一个生成boolean类型结果的表达式(类似WHERE子句),限定连接中那些行是匹配的。

USING ( join_column [, ...] )

一个形如USING ( a, b, ... )的子句, 是ON left_table.a = right_table.a AND left_table.b = right_table.b ...的缩写。 同样,USING蕴涵着每对等效字段中只有一个包含在连接输出中,而不是两个都输出的意思。

NATURAL

NATURAL是一个USING列表的缩写, 这个列表说的是两个表中同名的字段。

WHERE子句

可选的WHERE条件有如下常见的形式:

WHERE condition

这里condition可以是任意生成类型为boolean的表达式。 任何不满足这个条件的行都会从输出中删除。如果一个行的数值代入到条件中计算出来的结果为真, 那么该行就算满足条件。

GROUP BY子句

可选的GROUP BY子句的一般形式

GROUP BY expression [, ...]

GROUP BY将把所有在组合表达式上拥有相同值的行压缩成一行。expression可以是一个输入字段名字, 或者是一个输出字段(SELECT列表项)的名字或序号,或者也可以是任意输入字 段组成的表达式。在有歧义的情况下,一个GROUP BY的名字将被解释成输入字 段的名字,而不是输出字段的名字。

如果使用了聚集函数,那么就会对每组中的所有行进行计算并生成一个单独的值 (而如果没有GROUP BY,那么聚集将对选出来的所有行计算 出一个单独的值)。如果出现了GROUP BY,那么 SELECT列表表达式中再引用那些没有分组的字段就是非法的, 除非放在聚集函数里,因为对于未分组的字段,可能会返回多个数值。

HAVING子句

可选的HAVING子句有如下形式:

HAVING condition

这里condition与为WHERE 子句里声明的相同。

HAVING去除了一些不满足条件的组行。它与WHERE不同: WHERE在使用GROUP BY之前过滤出单独的行, 而HAVING过滤由GROUP BY创建的行。在 condition里引用的每个字段都必须无歧义地引用 一个分组的行,除非引用出现在一个聚集函数里。

HAVING的出现把查询变成一个分组的查询,即使没有GROUP BY子句也这样。 这一点和那些包含聚集函数但没有GROUP BY子句的查询里发生的事情是一样的。 所有选取的行都被认为会形成一个单一的组,而SELECT列表和HAVING子句只能从聚集函数里面引用表的字段。 这样的查询在HAVING条件为真的时候将发出一个行,如果为非真,则返回零行。

WINDOW Clause

可选的WINDOW子句有一般形式

WINDOW window_name AS ( window_definition ) [, ...]

此时window_name是一个 可以从随后的窗口定义或者OVER子句引用的名称,并且 window_definition

[ existing_window_name ]
[ PARTITION BY expression [, ...] ]
[ ORDER BY expression [ ASC | DESC | USING operator ] [ NULLS { FIRST | LAST } ] [, ...] ]
[ frame_clause ]

如果指定一个existing_window_name, 那么必须引用WINDOW列表中的一个更早的条目;如存在,新窗口从这个条目复制其分区子句, 及其排序子句。在这种情况下,新的窗口不能声明其自身PARTITION BY子句, 并且它可以仅在复制窗口没有一个ORDER BY子句时指定该子句,新窗口总是使用其自身的框 架条款;复制窗口不能指定一个框架条款。

PARTITION BY列表的元素以与GROUP BY子句 元素相同的形式来解译,除了他们总是简单的表达式并且从不是一个输出列的名称或者编号。 另一个不同是这些表达式包含聚集函数调用,这些在常规GROUP BY子句中都是不允许的。 他们在此处允许是因为开窗在分组和聚集之后发生。

同样地,ORDER BY列表的元素以与ORDER BY子句 的元素相同的形式来解译,除了这个表达式总是作为简单的表达式并且从不是一个输出列的名称或者编号。

可选的frame_clause为基于框架(并非全都基于此)的窗口函数定义 window frame。窗口框架是面向查询的每一行的一组相关行(称作current row)。 frame_clause可以作为下面中的一个

[ RANGE | ROWS ] frame_start
[ RANGE | ROWS ] BETWEEN frame_start AND frame_end

此时frame_startframe_end是以下其一

UNBOUNDED PRECEDING
value PRECEDING
CURRENT ROW
value FOLLOWING
UNBOUNDED FOLLOWING

frame_end被省略,其默认值为CURRENT ROW。 限制条件是frame_start不能是UNBOUNDED FOLLOWING, frame_end不能是UNBOUNDED PRECEDING, 并且frame_end选择不能比frame_start选择更早出现在 以上列表中—例如:不允许RANGE BETWEEN CURRENT ROW AND value PRECEDING

默认框架选项是RANGE UNBOUNDED PRECEDING,这与 RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW相同; 它将框架设置为分区中的所有行,在ORDER BY序列中是从当前行的最后一个元素开始 (这意味着若无从则是所有行)。通常,UNBOUNDED PRECEDING表示框架从分区的第一 行开始,类似地UNBOUNDED FOLLOWING表示框架已分区的最后一行结束(不管是 RANGE或者ROWS模式)。在ROWS模式,CURRENT ROW 意味着框架以当前行在ORDER BY序列中的首个获最后一个元素开始或者结束。 value PRECEDINGvalueFOLLOWING 目前仅允许在ROWS模式。他们表明框架以当前行之前或者之后许多航开始或者结束。 value必须是一个不包含任何变量、聚集函数或者窗口函数的整型表达式。 该值不能为空或者负值;但可以为0,并且这时选择当前行本身。

注意ROWS选项可以产生不可预测的结果,如果ORDER BY序列 若ORDER BY序列不能唯一地排列行。RANGE选项是为了确保是 ORDER BY序列中的peers的行能得到同等对待;任何两个对等行将会都在或 者都不在框架中。

一个WINDOW语句的目的是指定出现在 SELECT列表或者 ORDER BY子句中的 window functions的性能。这些函数可以通过在其OVER子句中的名称 参照WINDOW子句条目。一个WINDOW子句条目任何地方都 不需要参照;若它不在查询中使用,它将被忽略。可以使用窗口程序而根本不需要任何WINDOW, 尽管一个窗口函数调用可以直接在其OVER子句中指定其窗口定义。然而, WINDOW子句会在多于一个窗口函数需要相同窗口定义时保存输入。

窗口函数在Section 3.5, Section 4.2.8Section 7.2.4中有详细描述。

SELECT列表

SELECT列表(在SELECTFROM关键字之间的部分)声明组成 SELECT语句的输出行的表达式。这些表达式可以(并且通常也会)引用在 FROM子句里面计算出来的字段。

就像在一个表中,一个SELECT的每个输出列都有一个名称。 在一个简单的SELECT中,该名称仅用于标记显示的列,但当 SELECT是一个较大查询的子查询时,名称被较大查询视为子查询产生的 虚表的列名。为了指定用于输出列的名称,要在列表达式后写 AS output_name。 (您可以省略AS,但只有当所需的输出名称不匹配任何 PostgreSQL 关键字时(请参阅Appendix C)。)为了防止将来可能的关键字添加, 建议您要么写AS要么用双引号引起输出名称。) 如果你不指定一个列名称,PostgreSQL会自动选择 一个名称。如果列的表达式是一个简单的列参照,那么选择的名称与列名相同; 在更复杂的情况下,同?columnN?的生成名 通常会被选择。

一个输出列的名称可以用来参考ORDER BYGROUP BY子句中的 列的值,而不是在WHERE或者HAVING子句中的;反而您必须在 那里写出表达式。

除了表达式,也可以在输出列表中使用*表示所有字段。 还可以用table_name.* 作为来自该表的所有字段的缩写。 在这西情况下用AS指定新名称是不可能的;输出列的名称将会与表列的名称 相同。

UNION 子句

UNION子句的一般形式是:

select_statement UNION [ ALL ] select_statement

这里的select_statement是任意没有 ORDER BYLIMITFOR UPDATEFOR SHARE子句的SELECT语句。 如果用圆括弧包围,ORDER BYLIMIT可以附着在子表达式里。 如果没有圆括弧,这些子句将交给UNION的结果使用,而不是给它们右边的输入表达式。

UNION操作符计算那些涉及到的所有SELECT语句返回的行的结果联合。 一个行如果至少在两个结果集中的一个里面出现,那么它就会在这两个结果集的集合联合中。 两个作为UNION直接操作数的SELECT必须生成相同数目的字段, 并且对应的字段必须有兼容的数据类型。

缺省的UNION结果不包含任何重复的行,除非声明了ALL子句。ALL 制止了消除重复的动作。 因此,UNION ALL通常比UNION明显要快,可能的情况下尽量使用ALL

同一个SELECT语句中的多个UNION操作符是从左向右计算的, 除非用圆括弧进行了标识。

目前,FOR UPDATEFOR SHARE不能在UNION的结果或输入中声明。

INTERSECT子句

INTERSECT子句的一般形式是:

select_statement INTERSECT [ ALL ] select_statement

select_statement是任何不带ORDER BYLIMITFOR UPDATEFOR SHARE子句的SELECT语句。

INTERSECT计算涉及的SELECT语句返回的行集合的交集。 如果一个行在两个结果集中都出现,那么它就在两个结果集的交集中。

INTERSECT 的结果不包含任何重复行,除非您声明了ALL选项。用了ALL以后, 一个在左边的表里有m个重复而在右边表里有n个重复的 行将出现min(m,n)次。

除非用圆括号指明顺序,同一个SELECT语句中的多个 INTERSECT操作符是从左向右计算的。 INTERSECTUNION绑定得更紧, 也就是说A UNION B INTERSECT C将理解成A UNION (B INTERSECT C),除非您用圆括弧声明。

目前,不能给INTERSECT的结果或者任何INTERSECT 的输入声明FOR UPDATEFOR SHARE

EXCEPT子句

EXCEPT子句有如下的通用形式:

select_statement EXCEPT [ ALL ] select_statement

select_statement是任何没有ORDER BYLIMITFOR UPDATE或者 FOR SHARE子句的SELECT表达式。

EXCEPT操作符计算存在于左边SELECT语句的输出而不存在于 右边SELECT语句输出的行。

EXCEPT的结果不包含任何重复的行, 除非声明了ALL选项。使用ALL时, 一个在左边表中有m个重复而在右边表中有n个重复的行将在结果中出现 max(m-n,0)次。

除非用圆括弧指明顺序,否则同一个SELECT语句中的多个EXCEPT操作符是从左向右计算的。 EXCEPTUNION的绑定级别相同。

目前,不能给EXCEPT的结果或者任何EXCEPT的输入声明FOR UPDATEFOR SHARE子句。

ORDER BY子句

可选的ORDER BY子句有下面的一般形式:

ORDER BY expression [ ASC | DESC | USING operator ] [ NULLS { FIRST | LAST } ] [, ...]

ORDER BY子句导致结果行根据指定的表达式进行排序。 如果根据最左边的表达式,两行的结果相同,那么就根据下一个表达式进行比较, 依此类推。如果对于所有声明的表达式他们都相同,那么按随机顺序返回。

expression可以是一个输出字段(SELECT列表项)的名字或者序号, 或者也可以是用输入字段的数值组成的任意表达式。

序数指的是输出字段按顺序(从左到右)的位置。这个特性可以对没有唯一名称的字段进行排序。 这不是必须的,因为总是可以通过AS子句给一个要输出的字段赋予一个名称。

ORDER BY里还可以使用任意表达式, 包括那些没有出现在SELECT输出列表里面的字段。因此下面的语句现在是合法的:

SELECT name FROM distributors ORDER BY code;

这个特性的一个局限就是应用于UNIONINTERSECTEXCEPT查询的ORDER BY子句 只能在一个输出字段名或者数字上声明,而不能在一个表达式上声明。

请注意如果一个ORDER BY表达式是一个简单名称, 同时匹配输出字段和输入字段,ORDER BY将把它解释成输出字段名称。 这和GROUP BY在同样情况下做的选择正相反。这样的不一致是由SQL标准强制的。

可以给ORDER BY子句里每个字段加一个可选的ASC(升序,缺省) 或DESC(降序)关键字。 还可以在USING子句里声明一个排序操作符来实现排序。 一个排序操作符必须是一个小于或者大于一些B-tree操作符的数量。 ASC等效于使用USING <DESC等效于使用USING >。 但是一个用户定义类型的创建者可以明确定义缺省的排序顺序, 并且可以使用其他名称的操作符。

如果指定NULLS LAT,空值会在所有非空值之后排序;如果指定 NULLS FIRST,空值会在所有非空值之前排序。如果两者均为指定, 当指定ASC时,默认反应时是NULLS LAST,并且 当指定DESC时,默认反应时是NULLS FIRST(然而, 默认地认为空是大于非空的)。当指定USING,默认空排序时依赖 操作符是否是一个更小或者更大的操作符。

请注意排序选项仅适用于他们遵循的表达式;例如ORDER BY x, y DESC 不意味着与ORDER BY x DESC, y DESC相同。

字符类型的数据是按照区域相关的字符集顺序排序的,这个区域是在数据库创建的时候建立的。

DISTINCT子句

如果声明了DISTINCT,那么就从结果集中删除所有重复的行 (每个有重复的组都保留一行)。 ALL声明相反的作用:所有行都被保留(这是缺省)。

DISTINCT ON ( expression [, ...] )只 保留那些在给出的表达式上运算出相同结果的行集合中的第一行。 DISTINCT ON表达式是使用与ORDER BY 相同的规则进行解释的。 请注意,除非使用了ORDER BY来保证需要的行首先出现,否则, "第一行"是不可预测的。比如,

SELECT DISTINCT ON (location) location, time, report
    FROM weather_reports
    ORDER BY location, time DESC;

为每个地点检索最近的天气报告。但是如果没有使用ORDER BY来强制对每个地点的时间值进行降序排序, 那么就会得到每个地点的不知道什么时候的报告。

DISTINCT ON表达式必须匹配最左边的ORDER BY表达式。 ORDER BY子句将通常包含额外的表达式来判断每个DISTINCT ON 组里面需要的行的优先级。

LIMIT子句

LIMIT子句由两个独立的子句组成:

LIMIT { count | ALL }
OFFSET start

count声明返回的最大行数, 而start声明开始返回行之前忽略的行数。 如果两个都指定了,那么在开始计算count个返回行之前将先跳过 start行。

如果count表达式职位NULL, 它被当做LIMIT ALL,也就是,没有限制。如果 start 评估为空,他与 OFFSET 0相同对待。

SQL:2008引入了一个不同的语法来达到相同的效果,这也是PostgreSQL 支持的。这是:

OFFSET start { ROW | ROWS }
FETCH { FIRST | NEXT } [ count ] { ROW | ROWS } ONLY

根据该标准,OFFSET子句必须在FETCH子句之前 出现,若两个都存在;但是PostgreSQL的要求更为宽松并且允许两种顺序 中的任意一种。ROWROWS以及 FIRSTNEXT是不影响这些子句的效果的干扰词, 在这个语法中。在该语法中,当使用表达式而非start 或者count的简单常量,圆括号在大多数 情况下是有必要的。如果countFETCH中 省略了,它默认为1.

使用LIMIT的一个好习惯是使用一个ORDER BY子句把结果行限制成一个唯一的顺序。 否则您会得到无法预料的结果子集,您可能想要第十行到第二十行,除非您声明ORDER BY, 否则您不知道什么顺序。

查询优化器在生成查询规划时会把LIMIT考虑进去, 所以您很有可能因给出的LIMITOFFSET值不同而得到不同的规划(生成不同的行序)。 因此用不同的LIMIT/OFFSET值选择不同的查询结果的子集将不会产生一致的结果, 除非您用ORDER BY强制生成一个可预计的结果顺序。这可不是bug;这是SQL生来的特点 ,因为除非用了ORDER BY约束顺序,SQL不保证查询生成的结果有任何特定的顺序。

对于返回表行不同子集的相同LIMIT查询的重复执行甚至都是可能的, 如果没有一个ORDER BY来强制选择一个确定性子集。此外,这不是一个 漏洞;结果的决定论在这种情况下没法保证。

FOR UPDATE/FOR SHARE子句

FOR UPDATE子句的形式如下:

FOR UPDATE [ OF table_name [, ...] ] [ NOWAIT ]

很相近的FOR SHARE子句的形式如下:

FOR SHARE [ OF table_name [, ...] ] [ NOWAIT ]

FOR UPDATE令那些被SELECT检索出来的行被锁住, 就像要更新一样。这样就避免它们在当前事务结束前被其它事务修改或者删除; 也就是说,其它企图UPDATEDELETESELECT FOR UPDATE这些行的事务将被阻塞, 直到当前事务结束。同样,如果一个来自其它事务的UPDATEDELETE, 或SELECT FOR UPDATE 已经锁住了某个或某些选定的行,SELECT FOR UPDATE将等到那些事务结束,并且将随后锁住并返回更新的行(或者不返回行, 如果行已经被删除)。 在一个SERIALIZABLE事务内,然而,若要锁定的一行已经被改变, 一个错误将会在事务启动后抛出,更多的讨论参阅Chapter 13

FOR SHARE的行为类似,只是它在每个检索出来的行上要求一个共享锁, 而不是一个排它锁。一个共享锁阻塞其它事务在这些行上执行 UPDATEDELETESELECT FOR UPDATE却不阻止他们执行SELECT FOR SHARE

为了避免操作等待其它事务提交,使用NOWAIT选项。 那么NOWAIT将会立即汇报一个错误,而不是等待。如果被选择的行不能立即被锁住,请注意, NOWAIT只适用于行级别的锁,要求的表级锁ROW SHARE仍然以通常的方法进行 (参阅Chapter 13)。 如果需要申请表级别的锁同时又不等待,那么您可以使用LOCKNOWAIT选项。

如果在FOR UPDATEFOR SHARE中明确指定了表名字, 那么将只有这些指定的表被锁定,其他在SELECT中使用的表将不会被锁定。 一个其后不带表列表的FOR UPDATEFOR SHARE子句将锁定该命令中所有使用的表。 如果FOR UPDATEFOR SHARE应用于一个视图或者子查询, 它同样将锁定所有该视图或子查询中使用到的表。 然而,FOR UPDATE/FOR SHARE不适用于 主查询引用的WITH查询。如果你想行锁在一个WITH查询内发生, 在WITH查询内,指定FOR UPDATE或者 FOR SHARE

多个FOR UPDATEFOR SHARE子句可以用于为不同的表指定不同的锁定模式。 如果一个表出同时出现(或隐含同时出现)在FOR UPDATEFOR SHARE子句中,那么将按照FOR UPDATE处理。类似的, 如果影响一个表的任意子句中出现了NOWAIT,那么该表将按照NOWAIT处理。

FOR UPDATEFOR SHARE不能在那些无法使用独立的表行清晰标识返回行的环境里; 比如,它不能和聚集一起使用。

FOR UPDATE或者FOR SHARE 出现在SELECT查询的顶层,锁住的行通常都是那些查询返回的; 对于连接查询,锁住的行是那些导致返回连接行的。此外,那些满足查询快照中的 查询条件的行将被锁住,尽管如果他们在快照后被更新并且不再满足查询条件, 就不会再被返回。 如果使用一个LIMIT,加锁停止一次就足够行返回满足限制(但请注意 通过OFFSET跳过的行将会加锁)。如果FOR UPDATE 或者FOR SHARE用于一个游标的查询,只有通过游标实际读取或 逐步执行的行将会被锁住。

FOR UPDATE或者FOR SHARE出现在 SELECT下面,锁定的行是那些通过子查询返回到外部查询的。 这可能涉及到比检查子查询时显示的更少的行,因为外部查询的条件可能会用来 优化子查询的执行。例如:

SELECT * FROM (SELECT * FROM mytable FOR UPDATE) ss WHERE col1 = 5;

将会锁定仅拥有col1 = 5的行,即使那个条件在子查询中不是 原文的。

Caution

不要先锁定一个行然后在随后的保存点或PL/pgSQL异常 块中修改它。因为如果后来回滚的话将导致这个快丢失。例如:

BEGIN;
SELECT * FROM mytable WHERE key = 1 FOR UPDATE;
SAVEPOINT s;
UPDATE mytable SET ... WHERE key = 1;
ROLLBACK TO s;

ROLLBACK之后,该行将被解锁,而不是返回其上一个保存点状态(被锁定但未被修改)。 如果一个在当前事务中锁定的行被更新或删除,或者一个共享锁被升级为排它锁,这种情况就可能会出现。 在这两种情况下,先前的锁状态将被遗忘。如果事务后来回滚到一个介于最初锁命令和后来变更了锁状态之间的某个点, 那么该行将表现得好像根本没有被锁定一样。这个实现上的缺陷可能在将来的PostgreSQL版本中得到修补。

Caution

一个SELECT命令可以同时使用ORDER BYFOR UPDATE/SHARE返回行的顺序。 这是因为ORDER BY先生效。命令排序结果,但是可能会在其中一行 或多行上获取锁的时候被阻塞。但SELECT的阻塞被解除, 一些排序的列值可能已经被修改,导致这些行不按顺序出现(尽管它们是按初始 列值的顺序的)。这个可以通过必要时在子查询中配置 FOR UPDATE/SHARE来进行,例如:

SELECT * FROM (SELECT * FROM mytable FOR UPDATE) ss ORDER BY column1;

请注意这将导致锁定mytable的所有行,而顶层的FOR UPDATE 将会实际上仅锁住返回行。这可能会产生一个显著的性能差异,尤其是如果ORDER BYLIMIT或者其他限制结合。仅当顺序咧的并发更新是预期的并且一个严格的排序结果 是必须的时,该技术才是建议使用的。

TABLE Command

命令

TABLE name

完全等价于

SELECT * FROM name

它可以用作复杂查询中的一部分的一个顶级的命令或者一个节省空间的语法变体

例子

将表films和表distributors连接在一起:

SELECT f.title, f.did, d.name, f.date_prod, f.kind
    FROM distributors d, films f
    WHERE f.did = d.did

       title       | did |     name     | date_prod  |   kind
-------------------+-----+--------------+------------+----------
 The Third Man     | 101 | British Lion | 1949-12-23 | Drama
 The African Queen | 101 | British Lion | 1951-08-11 | Romantic
 ...

统计用kind分组的每组电影的长度(len)总和:

SELECT kind, sum(len) AS total FROM films GROUP BY kind;

   kind   | total
----------+-------
 Action   | 07:34
 Comedy   | 02:58
 Drama    | 14:28
 Musical  | 06:42
 Romantic | 04:38

统计用kind分组的每组电影的长度(len )总 和不足五小时的组:

SELECT kind, sum(len) AS total
    FROM films
    GROUP BY kind
    HAVING sum(len) < interval '5 hours';

   kind   | total
----------+-------
 Comedy   | 02:58
 Romantic | 04:38

下面两个例子是根据第二列(name)的内容对单独的结果排序的经典的方法:

SELECT * FROM distributors ORDER BY name;
SELECT * FROM distributors ORDER BY 2;

 did |       name
-----+------------------
 109 | 20th Century Fox
 110 | Bavaria Atelier
 101 | British Lion
 107 | Columbia
 102 | Jean Luc Godard
 113 | Luso films
 104 | Mosfilm
 103 | Paramount
 106 | Toho
 105 | United Artists
 111 | Walt Disney
 112 | Warner Bros.
 108 | Westward

下面这个例子演示如何获得表distributorsactors 的连接,只将每个表中以字母W开头的取出来。因为只取了不重复的行,所以关键字 ALL被省略了:

distributors:               actors:
 did |     name              id |     name
-----+--------------        ----+----------------
 108 | Westward               1 | Woody Allen
 111 | Walt Disney            2 | Warren Beatty
 112 | Warner Bros.           3 | Walter Matthau
 ...                         ...

SELECT distributors.name
    FROM distributors
    WHERE distributors.name LIKE 'W%'
UNION
SELECT actors.name
    FROM actors
    WHERE actors.name LIKE 'W%';

      name
----------------
 Walt Disney
 Walter Matthau
 Warner Bros.
 Warren Beatty
 Westward
 Woody Allen

这个例子显示了如何在FROM子句中使用函数,包括带有和不带字段定义列表的。

CREATE FUNCTION distributors(int) RETURNS SETOF distributors AS $$
    SELECT * FROM distributors WHERE did = $1;
$$ LANGUAGE SQL;

SELECT * FROM distributors(111);
 did |    name
-----+-------------
 111 | Walt Disney

CREATE FUNCTION distributors_2(int) RETURNS SETOF record AS $$
    SELECT * FROM distributors WHERE did = $1;
$$ LANGUAGE SQL;

SELECT * FROM distributors_2(111) AS (f1 int, f2 text);
 f1  |     f2
-----+-------------
 111 | Walt Disney

这个例子展示了如何使用一个简单的WITH子句:

WITH t AS (
    SELECT random() as x FROM generate_series(1, 3)
  )
SELECT * FROM t
UNION ALL
SELECT * FROM t

         x          
--------------------
  0.534150459803641
  0.520092216785997
 0.0735620250925422
  0.534150459803641
  0.520092216785997
 0.0735620250925422

请注意WITH查询仅评估一次,所以我们得到相同的三个随机值的 两个集合。

该示例使用WITH RECURSIVE来找到雇主Mary的所有下属 (直接或者间接),以及他们的间接级别,从一个仅显示直接下属的表:

WITH RECURSIVE employee_recursive(distance, employee_name, manager_name) AS (
    SELECT 1, employee_name, manager_name
    FROM employee
    WHERE manager_name = 'Mary'
  UNION ALL
    SELECT er.distance + 1, e.employee_name, e.manager_name
    FROM employee_recursive er, employee e
    WHERE er.employee_name = e.manager_name
  )
SELECT distance, employee_name FROM employee_recursive;

注意递归查询的典型形式:一个初始条件,紧接着是UNION, 然后是查询的递归部分。确定查询的递归部分最终将不会返回元组,否则 查询将循环下去。(请参阅Section 7.8获取更多示例)

兼容性

SELECT语句和SQL标准兼容。但是还有一些扩展和一些缺少的特性。

省略FROM子句

PostgreSQL允许在一个查询里省略FROM子句。 它的最直接用途就是计算简单的常量表达式的结果:

SELECT 2+2;

 ?column?
----------
        4

其它有些SQL数据库不能这么做,除非引入一个单行的伪表做为 SELECT的数据源。

请注意,如果没有声明FROM子句,那么查询不能引用任何数据库表。 比如,下面的查询是非法的:

SELECT distributors.* WHERE distributors.name = 'Westward';

PostgreSQL8.1之前的版本支持这种形式的查询, 为查询里引用的每个表都增加一个隐含的条目到FROM子句中。现在这个不再是缺省的了。

省略AS关键字

在SQL标准中,每当新列名称是一个有效的列名时,可选的关键字 AS可以在输出列名之前省略(也即,不是跟任何保留关键字都相同的)。 PostgreSQL限制略多一些:不管是保留还是不保留, 如果新列名匹配任何关键字,AS是必要的。建议的做法是使用AS 或者双括号括起输出列名称,以阻止对将来的关键字补充的任何可能的冲突。

FROM项中,标准和 PostgreSQL 都允许AS在一个无限制关键字别名之前省略。但是这对输出列名 是不切实际的, 因为语法的含糊不清。

ONLY和圆括号

SQL标准需要括号括起ONLY之后的表名,如同与SELECT * FROM ONLY (tab1), ONLY (tab2) WHERE ...。PostgreSQL也支持哪些,但是括号是可选的。 (该点同样适用于所有支持ONLY选项的SQL命令。)

GROUP BYORDER BY里可用的名字空间

在SQL-92标准里,ORDER BY子句只能使用输出字段名或者编号, 而GROUP BY子句只能用基于输入字段名的表达式。PostgreSQL对这两个子句都进行了扩展, 允许另外一种选择(但是如果存在歧义,则使用标准的解释)。PostgreSQL还允许两个子句声明任意的表达式。 请注意在表达式中出现的名字总是被当作输入字段名,而不是输出字段名。

SQL:1999以及之后的一个略微不同的定义并不能和SQL-92完全向前兼容。 不过,在大多数情况下,PostgreSQL将把 一个ORDER BYGROUP BY表达式解析成为SQL:1999制定的那样。

WINDOW Clause Restrictions

SQL标准提供了窗口frame_clause的 附加选项。 PostgreSQL目前仅支持上面列出的选项。

LIMITOFFSET

语句LIMITOFFSET是特定的 PostgreSQL语法,也是MySQL 使用的。SQL:2008标准引入了OFFSET ... FETCH {FIRST|NEXT} ...获取相同的功能性,如上面LIMIT子句 所示。该语法也被IBM DB2使用。(为Oracle 所写的应用程序通常使用一个涉及自动生成的rownum列的工作区, 要实现这些子句的效果,这在PostgreSQL中是不可用的。)

FOR UPDATE and FOR SHARE

尽管FOR UPDATE出现在SQL标准中,该标准允许它只是作为 DECLARE CURSOR的一个选项。PostgreSQL 允许它在人恶化SELECT查询以及SELECT子查询中, 但这是一个扩展。FOR SHARE变体以及NOWAIT选项, 不出现在标准中。

非标准子句

DISTINCT ON子句都没有在SQL标准中定义。