在SQL Server 2005中实现表的行列转换

发表于:2007-06-20来源:作者:点击数: 标签:
PIVOT和UNPIVOT关系运算符是 SQL Server 2005提供的新增功能,因此,对升级到SQL Server 2005的 数据库 使用PIVOT和UNPIVOT时,数据库的兼容级别必须设置为90(可以使用sp_dbcmptlevel存储过程设置兼容级别)。 在查询的FROM子句中使用PIVOT和UNPIVOT,可以

   


  PIVOT和UNPIVOT关系运算符是SQL Server 2005提供的新增功能,因此,对升级到SQL Server 2005的数据库使用PIVOT和UNPIVOT时,数据库的兼容级别必须设置为90(可以使用sp_dbcmptlevel存储过程设置兼容级别)。

  在查询的FROM子句中使用PIVOT和UNPIVOT,可以对一个输入表值表达式执行某种操作,以获得另一种形式的表。PIVOT运算符将输入表的行旋转为列,并能同时对行执行聚合运算。而UNPIVOT运算符则执行与PIVOT运算符相反的操作,它将输入表的列旋转为行。

  在FROM子句中使用PIVOT和UNPIVOT关系运算符时的语法格式如下:

clearcase/" target="_blank" >cccccc width="90%" align=center bgColor=#e3e3e3 border=1>
[ FROM { <table_source> } [ ,...n ] ]

<table_source> ::= {
 table_or_view_name [ [ AS ] table_alias ]
 <pivoted_table> | <unpivoted_table>
}

<pivoted_table> ::=table_source PIVOT <pivot_clause> table_alias

<pivot_clause> ::=( aggregate_function ( value_column )
 FOR pivot_column
  IN ( <column_list> )
)

<unpivoted_table> ::=table_source UNPIVOT <unpivot_clause> table_alias

<unpivot_clause> ::=( value_column FOR pivot_column IN ( <column_list> ) )

<column_list> ::= column_name [ , ... ] table_source PIVOT <pivot_clause>

  指定对table_source表中的pivot_column列进行透视。table_source可以是一个表、表表达式或子查询。

aggregate_function

  系统或用户定义的聚合函数。注意:不允许使用COUNT(*)系统聚合函数。

value_column

  PIVOT运算符用于进行计算的值列。与UNPIVOT一起使用时,value_column不能是输入table_source中的现有列的名称。

FOR pivot_column

  PIVOT运算符的透视列。pivot_column必须是可隐式或显式转换为nvarchar()的类型。

  使用UNPIVOT时,pivot_column是从table_source中提取输出的列名称,table_source中不能有该名称的现有列。

IN ( column_list )

  在PIVOT子句中,column_list列出pivot_column中将成为输出表的列名的值。

  在UNPIVOT子句中,column_list列出table_source中将被提取到单个pivot_column中的所有列名。

table_alias

  输出表的别名。

UNPIVOT < unpivot_clause >

  指定将输入表中由column_list指定的多个列的值缩减为名为pivot_column的单个列。

  常见的可能会用到PIVOT的情形是:需要生成交叉表格报表以汇总数据。交叉表是使用较为广泛的一种表格式,例如,图5-4所示的产品销售表就是一个典型的交叉表,其中的月份和产品种类都可以继续添加。但是,这种格式在进行数据表存储的时候却并不容易管理,要存储图5-4这样的表格数据,数据表通常需要设计为图5-5这样的结构。这样就带来一个问题,用户既希望数据容易管理,又希望能够生成一种能够容易阅读的表格数据。好在PIVOT为这种转换提供了便利。

在SQL Server 2005中实现表的行列转换
点击查看大图

图5-4 产品销售表 图5-5 数据表结构

  假设Sales.Orders表中包含有ProductID(产品ID)、OrderMonth(销售月份)和SubTotal(销售额)列,并存储有如表5-2所示的内容。

表5-2 Sales.Orders表中的内容
ProductID OrderMonth SubTotal
1 5 100.00
1 6 100.00
2 5 200.00
2 6 200.00
2 7 300.00
3 5 400.00
3 5 400.00

  执行下面的语句:

SELECT ProductID, [5] AS 五月, [6] AS 六月, [7] AS 七月
FROM
Sales.Orders PIVOT
(
SUM (Orders.SubTotal)
FOR Orders.OrderMonth IN
( [5], [6], [7] )
) AS pvt

ORDER BY ProductID;

  在上面的语句中,Sales.Orders是输入表,Orders.OrderMonth是透视列(pivot_column),Orders.SubTotal是值列(value_column)。上面的语句将按下面的步骤获得输出结果集:

  a.PIVOT首先按值列之外的列(ProductID和OrderMonth)对输入表Sales.Orders进行分组汇总,类似执行下面的语句:

SELECT ProductID,
OrderMonth,
SUM (Orders.SubTotal) AS SumSubTotal
FROM Sales.Orders
GROUP BY ProductID,OrderMonth;

  这时候将得到一个如表5-3所示的中间结果集。其中只有ProductID为3的产品由于在5月有2笔销售记录,被累加到了一起(值为800)。
表5-3 Sales.Orders表经分组汇总后的结果

ProductID OrderMonth SumSubTotal
1 5 100.00
1 6 100.00
2 5 200.00
2 6 200.00
2 7 300.00
3 5 800.00

  b.PIVOT根据FOR Orders.OrderMonth IN指定的值5、6、7,首先在结果集中建立名为5、6、7的列,然后从图5-3所示的中间结果中取出OrderMonth列中取出相符合的值,分别放置到5、6、7的列中。此时得到的结果集的别名为pvt(见语句中AS pvt的指定)。结果集的内容如表5-4所示。

表5-4 使用FOR Orders.OrderMonth IN( [5], [6], [7] )后得到的结果集
ProductID 5 6 7
1 100.00 100.00 NULL
2 200.00 200.00 200.00
3 800.00 NULL NULL

  c.最后根据SELECT ProductID, [5] AS 五月, [6] AS 六月, [7] AS 七月FROM的指定,从别名pvt结果集中检索数据,并分别将名为5、6、7的列在最终结果集中重新命名为五月、六月、七月。这里需要注意的是FROM的含义,其表示从经PIVOT关系运算符得到的pvt结果集中检索数据,而不是从Sales.Orders中检索数据。最终得到的结果集如表5-5所示。

表5-5 由表5-2所示的Sales.Orders表将行转换为列得到的最终结果集
ProductID 五月 六月 七月
1 100.00 100.00 NULL
2 200.00 200.00 200.00
3 800.00 NULL NULL

  UNPIVOT与PIVOT执行几乎完全相反的操作,将列转换为行。但是,UNPIVOT并不完全是PIVOT的逆操作,由于在执行PIVOT过程中,数据已经被进行了分组汇总,所以使用UNPIVOT并不会重现原始表值表达式的结果。假设表5-5所示的结果集存储在一个名为MyPvt的表中,现在需要将列标识符“五月”、“六月”和“七月”转换到对应于相应产品ID的行值(即返回到表5-3所示的格式)。这意味着必须另外标识两个列,一个用于存储月份,一个用于存储销售额。为了便于理解,仍旧分别将这两个列命名为OrderMonth和SumSubTotal。参考下面的语句:

CREATE TABLE MyPvt (ProductID int, 五月int, 六月 int, 七月int); --建立MyPvt表
GO
  --将表5-5中所示的值插入到MyPvt表中

INSERT INTO MyPvt VALUES (1,100,100,0);
INSERT INTO MyPvt VALUES (2,200,200,200);
INSERT INTO MyPvt VALUES (3,800,0,0);

  --执行UNPIVOT

SELECT ProductID, OrderMonth, SubTotal
FROM
 MyPvt UNPIVOT
 (SubTotal FOR OrderMonth IN
  (五月, 六月, 七月)
 )AS unpvt;


  上面的语句将按下面的步骤获得输出结果集:

  a.首先建立一个临时结果集的结构,该结构中包含MyPvt表中除IN (五月, 六月, 七月)之外的列,以及SubTotal FOR OrderMonth中指定的值列(SubTotal)和透视列(OrderMonth)。

  b.将在MyPvt中逐行检索数据,将表的列名称(在IN (五月, 六月, 七月)中指定)放入OrderMonth列中,将相应的值放入到SubTotal列中。最后得到的结果集如表5-6所示。

表5-6 使用UNPIVOT得到的结果集
ProductID OrderMonth SubTotal
1 五月 100
1 六月 100
1 七月 0
2 五月 200
2 六月 200
2 七月 200
3 五月 800
3 六月 0
3 七月 0

原文转自:http://www.ltesting.net