T-SQL允许你使用不同的方法解决一个问题.有的时候,尽管选择不是那么明显,但是却可以让你得到令人满意的和快乐的惊奇.下边让我们解读Dr. Tom Moreau对同一问题不同的可能性的探索.可能我们可以在那些不同的方法之中发现一些珍贵的东西.

    让我们以我们的老朋友Northwind数据库为例,这里我们用到的是[order details]表,这个表是一个定单的明细表,和order表是多对一的关系.也就是一个定单对应多个订购的产品.假设你想得到每个定单订购的总价值,但是不包括59号产品.Listing 1给了我们第一种解法:

  1. select 
  2.   OrderID,sum (Quantity * UnitPrice) value  
  3. from 
  4.   [Order Details] o1  
  5. where 
  6.   ProductID <> 59  
  7. group by 
  8.   OrderID 


上边的语句很简单,它排除掉了59号产品的定单明细条目,然后进行分组统计.但是如果我们需要忽略掉订购59号产品的定单呢?也就是说我们要统计没有包含59号产品的定单的价值.你想到了WHERENOT EXIST(S)关键词了吗?Listing 2给了我们第二种方法:

  1. select 
  2.   o1.OrderID,sum (o1.Quantity * o1.UnitPrice) value  
  3. from 
  4.   [Order Details] o1  
  5. where not exists  
  6. (  
  7.   select 
  8.     *  
  9.   from 
  10.     [Order Details] o2  
  11.   where 
  12.     o2.OrderID   = o1.OrderID  
  13.   and o2.ProductID = 59  
  14. )  
  15. group by 
  16.   o1.OrderID 


如果你不喜欢用exist的话,你可以转化成使用not in:
Listing 3

  1. select 
  2.   o1.OrderID,sum (o1.Quantity * o1.UnitPrice) value  
  3. from 
  4.   [Order Details] o1  
  5. where 59 not in 
  6. (  
  7.   select 
  8.     ProductID  
  9.   from 
  10.     [Order Details] o2  
  11.   where 
  12.     o2.OrderID   = o1.OrderID  
  13. )  
  14. group by 
  15.   o1.OrderID 


尽管Listing 1不满足我们现在的查询条件.但是从性能发面考虑,Listing 1还是最好的,因为它只用到了一次表的扫描.而后边的两个查询都是用到了相关子查询,如果你查看查询计划就回看到,他们都涉及到了两次表的扫描.如果你曾经在 T-SQL用过交叉表查询的话,你就不会对聚集函数里边的case结构陌生.现在我们就把这个非常有趣的方法应用到我们的问题中来:
Listing 4

  1. select 
  2.   OrderID,sum (Quantity * UnitPrice) value  
  3. from 
  4.   [Order Details] o1  
  5. group by 
  6.   OrderID  
  7. having 
  8.   sum (case when ProductID = 59 then 1 else 0 end) = 0 


HAVING子句起到了对分组的结果进行过滤的作用.如果没有包含59号产品,就会出现0=0,显然这是满足条件的.如果包含了59号产品的订购,就会出现n=0(n<>0),这样的定单就回被过滤掉.查看执行计划你就回发现是一次表的扫描,非常棒!
  再来举一个例子:我们这回用到的表是order表,假设我们要统计只通过一个雇员雇员下定单的顾客.你可以想到用子查询not exist来实现:

  1. select distinct 
  2.   o1.CustomerID  
  3. from 
  4.   Orders o1  
  5. where not exists  
  6. (  
  7.   select 
  8.     *  
  9.   from 
  10.     Orders o2  
  11.     where 
  12.       o2.CustomerID = o1.CustomerID  
  13.     and o2.EmployeeID <> o1.EmployeeID  


同样的,这个语句可以通过带有HAVING子句的分组来实现.
Listing 6

  1. select 
  2.   CustomerID  
  3. from 
  4.   Orders  
  5. group by 
  6.   CustomerID  
  7. having 
  8.   min (EmployeeID) = max (EmployeeID) 


另一种方法:
Listing 7

  1. select 
  2. CustomerID  
  3. from 
  4.   Orders  
  5. group by 
  6.   CustomerID  
  7. having 
  8.   count (distinct EmployeeID) = 1 


Listing 6和Listing 7查询消耗都要小于Listing 5.相比Listing 5的两次表扫描,他们只进行一次表的扫描.而Listing 6的损耗还要稍微小于Listing 7.但是,Listing 7的一个显著的特点就是它可以适应到一个顾客对应两个雇员,三个雇员......
其实大家可能现在明白了这篇文章将的是什么?它就是教我们怎么用having 子句来达到过滤组的目的.可以达到避免两次表扫描的目的.可以达到更高的性能.我从这篇文章学到了很多的方法,你呢?

本日志由 flyinweb 于 2009-06-17 23:25:02 发表到 技术文摘 中,目前已经被浏览 3967 次,评论 0 次;

作者添加了以下标签: T-SQL