天天看点

第二章   汇总和聚合数据(一)

为完整地了解Oracle的聚合函数,我们还要知道当数据包含NULL时,情况会怎样。销售奖励只有销售人员才有,非销售人员没有,所以反映在HR.EMPLOYEES表中就是那些非销售人员的COMMISSION_PCT字段的值为NULL。如果想计算或同级COMMISSION_PCT的平均值,或是此字段有值的行的数量,可以用下面的SQL语句列出聚合计算的结果:

 select count(commission_pct),avg(commission_pct)
    from hr.employee;      

---------------------------------------------------------------

COUNT(COMMISSION_PCT)    AVG(COMMISSION_PCT)

                                           38                                    .255

    虽然我们知道在统计薪水时有107位员工,但在统计销售奖励时,COUNT函数忽略了那些COMMISSION_CPT为NULL值的行,统计出仅有38位员工有销售奖励。同样,当计算员工的平均销售奖励时,Oracle也忽略了NULL值对应的那些行,仅仅计算那些有值的行。

    仅仅在两种特殊情况下,Oracle在聚合函数中考虑了NULL值。第一种是在GROUPING功能里,用来检验包含NULL值的分析函数的结果,是直接由所在的表得来,还是由分析计算得到的最终聚合“NULL集”得来。第二种情况是在COUNT(*)的功能里。因为通配符“*”表示表中所有的字段,所以Oracle忽略任何实际的数据,而单独统计行数,看起来像是把NULL值和普通值一样对待。

    为了演示,下面的SQL语句明确显示了COUNT(*)与COUNT(COMMISSION_PCT)的不同:

select count(*),count(commission_pct)
    from hr.employee;      

---------------------------------------------

COUNT(*)    COUNT(COMMISSION_PCT)

         107                                               38

    COUNT(*)统计了表中的所有行,而COUNT(COMMISSION_PCT)仅仅统计了表中字段COMMISSION_PCT不为NULL的那些行。  

    在分组进行数据汇总时,SELECT语句中选中的字段或值,要么参加聚合计算,要么被涵盖到GROUP BY子句中。若想写出语法正确的GROUP BY子句,就要永远牢记:值要么用来分组,要么用来参加聚合计算——没有其他用途。

    当按聚合或其他函数进行排序时,Oracle提供了排序字段的简化符号。不必在ORDER BY后面累赘地写上字段的全名,直接用他们在SELECT 语句中的位置序号即可。

Select department_id, job_id,min(salary), avg(salary), max(salary)
    from hr.employee
    group by department_id, job_id
    order by 1, 5 desc ;      

    语句中ORDER BY 子句后面的1与5分别代表SELECT 语句中第一个位置和第五个位置的DEPARTMENT_ID与max(salary)。

    基于聚合函数或分组的结果,我们想排除某些数据组。也就是说,我们希望在GROUP BY子句的后面,再跟一个类似WHERE的子句,在分组或聚合之后进行筛选。

select department_id, job_id, min(salary), avg(salary), max(salary), count(*)
    from hr.employees
    group by department_id, job_id
    having count(*)>1
    and min(salary) between 2500 and 17000
    and avg(salary) !=5000
    and max(salary)/min(salary)<2;