1 1 T2Text1 NULL
2 NULL T2Text2 NULL
3 3 T2Text3 120.0000
4 1 T2Text4 123.0000
5 1 T2Text5 234.0000
6 3 T2Text6 345.0000
NULL NULL NULL NULL
有三行数据T1ID列的值是1,其中有一行的Amount值是NULL。有两行数据的T1ID值是3,这两行数据的Amount值都不为空(你还可以增加更多的行,但要确保行数目和Amount列为NULL的数目也不同)。
现在,运行下面的查询语句:
SELECT InnerOuter.T1.T1ID,
Sum(InnerOuter.T2.Amount)AS TotalAmount,
Count(InnerOuter.T2.T1ID)AS NumberOfRows,
Count(InnerOuter.T2.Amount)AS NumberOfAmounts,
Avg(InnerOuter.T2.Amount)AS AverageAmount
FROM InnerOuter.T1 LEFT OUTER JOIN
InnerOuter.T2 ON InnerOuter.T1.T1ID = InnerOuter.T2.T1ID
GROUP BY
InnerOuter.T1.T1ID
结果如下:
1 357.00 3 2 178.50
2 NULL 0 0 NULL
3 465.00 2 2 232.50
第一行的返回结果表明:如果按照T1ID列统计,你将得到正确的行数,但是如果是按照Amount列统计,得到的将是非NULL值的行数。需要注意的是:平均值是按照非NULL值的数目进行计算的,而不是总行数。
你可能会认为这些事例并不真实,因为表格之间的联系都是人为给定的。并且在实际中,似乎不允许外关键字为NULL。然而,我的确在数据库中发现存在着这样的情况。例如,HR招聘了一名新雇员,但是还没有安排他的工作部门;又例如,我们将一名客户加入到数据库中,但是还没为其安排一名销售代表。
有很多方法处理类似这样信息缺失的情况。在我看来,最糟糕的处理方法就是在添加所谓的0th行,当外关键字是NULL时,就使用0值来代换。这样,外关键字就永远不会是NULL。这一方法会造成两个问题:1)通过向数据表中引进一种新的数据类型,从概念上伪造了一个数据实体。然而关系数据库认为数据表中都是确实存在的数据类型;2)它将查询操作的处理变得更加的复杂化,因为你要将查询结果中含0的这些行删除。
延伸阅读
文章来源于领测软件测试网 https://www.ltesting.net/