8.3. 字符类型

Table 8-4. 字符类型

名字描述
character varying(n), varchar(n)变长,有长度限制
character(n), char(n)定长,不足补空白
text变长,无长度限制

Table 8-4显示了在PostgreSQL里可用于一般用途的字符类型。

SQL定义了两种基本的字符类型: character varying(n)character(n), 这里的n是一个正整数。两种类型都可以存储最多n个字符的字符串(没有字节)。 试图存储更长的字符串到这些类型的字段里会产生一个错误, 除非超出长度的字符都是空白,这种情况下该字符串将被截断为最大长度。 这个看上去有点怪异的例外是SQL标准要求的。 如果要存储的字符串比声明的长度短, 类型为character的数值将会用空白填满; 而类型为character varying的数值将只是存储短些的字符串。

如果我们明确地把一个数值转换成character varying(n)character(n), 那么超长的数值将被截断成n个字符,且不会抛出错误。 这也是SQL标准的要求。

varchar(n)char(n)分别是character varying(n)character(n)的别名, 没有声明长度的character等于character(1); 如果不带长度说明词使用character varying, 那么该类型接受任何长度的字符串。后者是PostgreSQL的扩展。

另外,PostgreSQL提供text类型, 它可以存储任何长度的字符串。尽管类型text不是SQL标准, 但是许多其它SQL数据库系统也有它。

character类型的数值物理上都用空白填充到指定的长度 n并且以这种方式存储和显示。 不过,填充的空白在是无语意的。在比较两个character值的时候, 填充的空白都不会被关注,在转换成其它字符串类型的时候,character值里面的空白会被删除。 请注意,在character varyingtext数值里, 结尾的空白是有语意的。

在一个简短的字符串(最多126个字节)的存储要求是1个字节加上实际的字符串, 其中包括空格填充的character。 更长的字符串有4个字节的开销,而不是1。 长的字符串将会自动被系统压缩,因此在磁盘上的物理需求可能会更少些。 更长的数值也会存储在后台表里面,这样它们就不会干扰对短字段值的快速访问。 不管怎样,允许存储的最长字符串大概是1GB 。 允许在数据类型声明中出现的n的最大值比这还小。 修改这个行为没有什么意义,因为在多字节编码下字符和字节的数目可能差别很大。 如果你想存储没有特定上限的长字符串,那么使用text或没有长度声明词的character varying,而不要选择一个任意长度限制。

Tip: 这三种类型之间没有性能差别,除了当使用填充空白类型时的增加存储空间, 和当存储长度约束的列时一些检查存入时长度的额外的CPU周期。 虽然在某些其它的数据库系统里,character(n)有一定的性能优势, 但在PostgreSQL里没有。 事实上,character(n)通常是这三个中最慢的,因为额外存储成本。 在大多数情况下,应该使用textcharacter varying

请参考Section 4.1.2.1获取关于字符串文本的语法的信息, 以及Chapter 9获取关于可用操作符和函数的信息。 数据库的字符集决定用于存储文本值的字符集;有关字符集支持的更多信息, 请参考Section 22.2

Example 8-1. 使用字符类型

CREATE TABLE test1 (a character(4));
INSERT INTO test1 VALUES ('ok');
SELECT a, char_length(a) FROM test1; -- (1)
  a   | char_length
------+-------------
 ok   |           2

CREATE TABLE test2 (b varchar(5));
INSERT INTO test2 VALUES ('ok');
INSERT INTO test2 VALUES ('good      ');
INSERT INTO test2 VALUES ('too long');
ERROR:  value too long for type character varying(5)
INSERT INTO test2 VALUES ('too long'::varchar(5)); -- explicit truncation
SELECT b, char_length(b) FROM test2;
   b   | char_length
-------+-------------
 ok    |           2
 good  |           5
 too l |           5
(1)
char_length函数在Section 9.4中讨论。

PostgreSQL里另外还有两种定长字符类型, 在Table 8-5里显示。 name类型用于在内部系统表中存储标 识符并且不是给一般用户使用的。该类型长度当前定为64字节(63可用字符加结束符) 但应该在C的源代码中使用常量NAMEDATALEN引用。 这个长度是在编译的时候设置的,因而可以为特殊用途调整, 缺省的最大长度在以后的版本可能会改变。类型"char" (注意引号)和char(1)是不一样的, 它只用了一个字节的存储空间。它在系统内部用于系统表当做穷人的枚举类型用

Table 8-5. 特殊字符类型

名字存储空间描述
"char"1字节单字节内部类型
name64字节用于对象名的内部类型