1、oracle over函数详解 今天在javaeye上看到一道面试题,很多人都用over函数解决的 特意查了一下它的用法SQL select deptno,ename,sal 2 from emp 3 order by deptno;DEPTNO ENAME SAL- - - 10 CLARK 2450 KING 5000 MILLER 1300 20 SMITH 800 ADAMS 1100 FORD 3000 SCOTT 3000 JONES 2975 30 ALLEN 1600 BLAKE 2850 MARTIN 1250 JAMES 950 TURNER 1500 WARD 1250已
2、选择14行。2.先来一个简单的,注意over(.)条件的不同,使用 sum(sal) over (order by ename). 查询员工的薪水“连续”求和,注意over (order by ename)如果没有order by 子句,求和就不是“连续”的,放在一起,体会一下不同之处:SQL select deptno,ename,sal, 2 sum(sal) over (order by ename) 连续求和, 3 sum(sal) over () 总和, - 此处sum(sal) over () 等同于sum(sal) 4 100*round(sal/sum(sal) over ()
3、,4) 份额(%) 5 from emp 6 /DEPTNO ENAME SAL 连续求和 总和 份额(%)- - - - - - 20 ADAMS 1100 1100 29025 3.79 30 ALLEN 1600 2700 29025 5.51 30 BLAKE 2850 5550 29025 9.82 10 CLARK 2450 8000 29025 8.44 20 FORD 3000 11000 29025 10.34 30 JAMES 950 11950 29025 3.27 20 JONES 2975 14925 29025 10.25 10 KING 5000 19925 29
4、025 17.23 30 MARTIN 1250 21175 29025 4.31 10 MILLER 1300 22475 29025 4.48 20 SCOTT 3000 25475 29025 10.34 20 SMITH 800 26275 29025 2.76 30 TURNER 1500 27775 29025 5.17 30 WARD 1250 29025 29025 4.31已选择14行。3.使用子分区查出各部门薪水连续的总和。注意按部门分区。注意over(.)条件的不同,sum(sal) over (partition by deptno order by ename) 按部
5、门“连续”求总和sum(sal) over (partition by deptno) 按部门求总和sum(sal) over (order by deptno,ename) 不按部门“连续”求总和sum(sal) over () 不按部门,求所有员工总和,效果等同于sum(sal)。SQL select deptno,ename,sal, 2 sum(sal) over (partition by deptno order by ename) 部门连续求和,-各部门的薪水连续求和 3 sum(sal) over (partition by deptno) 部门总和, - 部门统计的总和,同一
6、部门总和不变 4 100*round(sal/sum(sal) over (partition by deptno),4) 部门份额(%), 5 sum(sal) over (order by deptno,ename) 连续求和, -所有部门的薪水连续求和 6 sum(sal) over () 总和, - 此处sum(sal) over () 等同于sum(sal),所有员工的薪水总和 7 100*round(sal/sum(sal) over (),4) 总份额(%) 8 from emp 9 /DEPTNO ENAME SAL 部门连续求和 部门总和 部门份额(%) 连续求和 总和 总份
7、额(%)- - - - - - - - -10 CLARK 2450 2450 8750 28 2450 29025 8.44 KING 5000 7450 8750 57.14 7450 29025 17.23 MILLER 1300 8750 8750 14.86 8750 29025 4.4820 ADAMS 1100 1100 10875 10.11 9850 29025 3.79 FORD 3000 4100 10875 27.59 12850 29025 10.34 JONES 2975 7075 10875 27.36 15825 29025 10.25 SCOTT 3000 1
8、0075 10875 27.59 18825 29025 10.34 SMITH 800 10875 10875 7.36 19625 29025 2.7630 ALLEN 1600 1600 9400 17.02 21225 29025 5.51 BLAKE 2850 4450 9400 30.32 24075 29025 9.82 JAMES 950 5400 9400 10.11 25025 29025 3.27 MARTIN 1250 6650 9400 13.3 26275 29025 4.31 TURNER 1500 8150 9400 15.96 27775 29025 5.17
9、 WARD 1250 9400 9400 13.3 29025 29025 4.31已选择14行。4.来一个综合的例子,求和规则有按部门分区的,有不分区的例子SQL select deptno,ename,sal,sum(sal) over (partition by deptno order by sal) dept_sum, 2 sum(sal) over (order by deptno,sal) sum 3 from emp;DEPTNO ENAME SAL DEPT_SUM SUM- - - - - 10 MILLER 1300 1300 1300 CLARK 2450 3750 3
10、750 KING 5000 8750 8750 20 SMITH 800 800 9550 ADAMS 1100 1900 10650 JONES 2975 4875 13625 SCOTT 3000 10875 19625 FORD 3000 10875 19625 30 JAMES 950 950 20575 WARD 1250 3450 23075 MARTIN 1250 3450 23075 TURNER 1500 4950 24575 ALLEN 1600 6550 26175 BLAKE 2850 9400 29025已选择14行。5.来一个逆序的,即部门从大到小排列,部门里各员工
11、的薪水从高到低排列,累计和的规则不变。SQL select deptno,ename,sal, 2 sum(sal) over (partition by deptno order by deptno desc,sal desc) dept_sum, 3 sum(sal) over (order by deptno desc,sal desc) sum 4 from emp;DEPTNO ENAME SAL DEPT_SUM SUM- - - - - 30 BLAKE 2850 2850 2850 ALLEN 1600 4450 4450 TURNER 1500 5950 5950 WARD
12、1250 8450 8450 MARTIN 1250 8450 8450 JAMES 950 9400 9400 20 SCOTT 3000 6000 15400 FORD 3000 6000 15400 JONES 2975 8975 18375 ADAMS 1100 10075 19475 SMITH 800 10875 20275 10 KING 5000 5000 25275 CLARK 2450 7450 27725 MILLER 1300 8750 29025已选择14行。6.体会:在. from emp;后面不要加order by 子句,使用的分析函数的(partition by
13、 deptno order by sal)里已经有排序的语句了,如果再在句尾添加排序子句,一致倒罢了,不一致,结果就令人费劲了。如:SQL select deptno,ename,sal,sum(sal) over (partition by deptno order by sal) dept_sum, 2 sum(sal) over (order by deptno,sal) sum 3 from emp 4 order by deptno desc;DEPTNO ENAME SAL DEPT_SUM SUM- - - - - 30 JAMES 950 950 20575 WARD 1250
14、 3450 23075 MARTIN 1250 3450 23075 TURNER 1500 4950 24575 ALLEN 1600 6550 26175 BLAKE 2850 9400 29025 20 SMITH 800 800 9550 ADAMS 1100 1900 10650 JONES 2975 4875 13625 SCOTT 3000 10875 19625 FORD 3000 10875 19625 10 MILLER 1300 1300 1300 CLARK 2450 3750 3750 KING 5000 8750 8750已选择14行row_number() ove
15、r (partition by col1 order by col2) ) as 别名表示根据col1分组,在分组内部根据 col2排序而这个“别名”的值就表示每组内部排序后的顺序编号(组内连续的唯一的),partition by col1 可省略。 以Scott/tiger登陆,以emp表为例。1、select deptno,ename,sal, sum(sal) over (order by ename) 累计, -按姓名排序,并将薪水逐个累加 sum(sal) over () 总和 , - 此处sum(sal) over () 等同于sum(sal),求薪水总和 100*round(sa
16、l/sum(sal) over (),4) 份额(%) -求每个人的薪水占总额的比例,小数点后保留2位,括号和百分号为特殊符号,所以需要“” from emp结果如下 :2、select deptno,ename,sal,sum(sal) over (partition by deptno order by ename) 部门连续求和,-partition by deptno先按部门分组,再按姓名排序,并将薪水逐个累加sum(sal) over (partition by deptno) 部门总和, - 每个部门的薪水总和100*round(sal/sum(sal) over (partiti
17、on by deptno),4) 部门份额(%),-每个员工在各自部门的薪水比例sum(sal) over (order by deptno,ename) 连续求和, -所有部门的薪水连续求和sum(sal) over () 总和, - 此处sum(sal) over () 等同于sum(sal),所有员工的薪水总和100*round(sal/sum(sal) over (),4) 总份额(%) -求每个人的薪水占总额的比例from emp结果如下:3、select deptno,ename,sal,sum(sal) over (partition by deptno order by sal
18、) dept_sum,-根据部门分组,再按部门内的个人薪水排序,逐个累加。sum(sal) over (order by deptno,sal) sum -按部门排序,将薪水逐个累加。from emp;结果如下:4、部门从大到小排列,部门里各员工的薪水从高到低排列select deptno,ename,sal, sum(sal) over (partition by deptno order by deptno desc,sal desc) dept_sum,-按部门分组后,按部门和薪水降序排 sum(sal) over (order by deptno desc,sal desc) sum
19、-按部门和薪水降序排 from emp;结果如下:5、将各部门的员工按薪水排序select ename,job,deptno,sal,(row_number() over(partition by deptno order by sal desc) as 排名 -先按部门分组,再在部门中按薪水降序排名from scott.emp结果如下:6、查找各部门中薪水最高的前2位select ename,job,deptno,sal,排名 from(select ename,job,deptno,sal,(row_number() over(partition by deptno order by sa
20、l desc) as 排名 from scott.emp -先将各部门的员工按薪水排序,再在结果中取出需要的部分) where 排名 SELECT country,max(substr(city,2) city2FROM3(SELECT country,sys_connect_by_path(city,) city4 FROM5(SELECT country,city,country|rn rchild,country|(rn-1) rfather6FROM7(SELECTtest.country ,test.city,row_number()over (PARTITION BY test.c
21、ountry ORDERBY test.city) rn8FROM test)9CONNECT BY PRIOR rchild=rfather START WITH rfather LIKE %0)10 GROUP BY country;COUNTRYCITY- -中国 上海,台北,香港日本 大阪,东京怎么合并多行记录的字符串,我同事曾经建议我用FUNCTION来实现,但是我的报表中有多个类似的字段需要合并,因此我想用最简单的方法来操作,没接受此方案,今天在网上看到这样一篇文章,实在是太高兴了,而且还使用到了partition和聚集,这样更能丰富合并多行记录的处理方法. 下面就合并多行字符串贴
22、出刚刚在网上搜到的一个好贴! 什么是合并多行字符串(连接字符串)呢,例如:SQLdesctest;NameTypeNullableDefaultComments-COUNTRYVARCHAR2(20)YCITYVARCHAR2(20)YSQLselect*fromtest;COUNTRYCITY-中国台北中国香港中国上海日本东京日本大阪要求得到如下结果集:-中国台北,香港,上海日本东京,大阪实际就是对字符实现一个聚合功能,我很奇怪为什么Oracle没有提供官方的聚合函数来实现它呢:)下面就对几种经常提及的解决方案进行分析(有一个评测标准最高):1.被集合字段范围小且固定型灵活性性能难度这种方法
23、的原理在于你已经知道CITY字段的值有几种,且还不算太多,如果太多这个SQL就会相当的长。看例子:SQLselectt.country,2MAX(decode(t.city,台北,t.city|,NULL)|3MAX(decode(t.city,香港,t.city|,NULL)|4MAX(decode(t.city,上海,t.city|,NULL)|5MAX(decode(t.city,东京,t.city|,NULL)|6MAX(decode(t.city,大阪,t.city|,NULL)7fromtesttGROUPBYt.country8/COUNTRYMAX(DECODE(T.CITY,
24、台北,T.CIT-中国台北,香港,上海,日本东京,大阪,大家一看,估计就明白了(如果不明白,好好补习MAXDECODE和分组)。这种方法无愧为最笨的方法,但是对某些应用来说,最有效的方法也许就是它。2.固定表固定字段函数法灵活性性能难度此法必须预先知道是哪个表,也就是说一个表就得写一个函数,不过方法1的一个取值就要便捷多了。在大多数应用中,也不会存在大量这种合并字符串的需求。废话完毕,看下面:定义一个函数createorreplacefunctionstr_list(str_ininvarchar2)-分类字段returnvarchar2isstr_listvarchar2(4000)defa
25、ultnull;-连接后字符串strvarchar2(20)defaultnull;-连接符号beginforxin(selectTEST.CITYfromTESTwhereTEST.COUNTRY=str_in)loopstr_list:=str_list|str|to_char(x.city);str:=,;endloop;returnstr_list;end;使用:SQLselectDISTINCT(T.country),list_func1(t.country)fromtestt;COUNTRYLIST_FUNC1(T.COUNTRY)-中国台北,香港,上海日本东京,大阪SQLsele
26、ctt.country,str_list(t.country)fromtesttGROUPBYt.country;COUNTRYSTR_LIST(T.COUNTRY)-中国台北,香港,上海日本东京,大阪这个时候,使用分组和求唯一都可以满足要求。它的原理就是,根据唯一的分组字段country,在函数里面再次查询该字段对应的所有被合并列,使用PL/SQL将其合并输出。3.灵活表函数法灵活性性能难度该方法是在方法2的基础上,使用动态SQL,将表名和字段名称传入,从而达到灵活的目的。createorreplacefunctionstr_list2(key_nameinvarchar2,keyinvar
27、char2,conameinvarchar2,tnameinvarchar2)returnvarchar2astypercisrefcursor;strvarchar2(4000);sepvarchar2(2);valvarchar2(4000);currc;beginopencurforselect|coname|from|tname|where|key_name|=:xusingkey;loopfetchcurintoval;exitwhencur%notfound;str:=str|sep|val;sep:=,;endloop;closecur;returnstr;end;SQLsele
28、cttest.country,2str_list2(COUNTRY,test.country,CITY,TEST)emplist3fromtest4groupbytest.country5/COUNTRYEMPLIST-中国台北,香港,上海日本东京,大阪4.一条SQL法灵活性性能难度一条SQL的法则是某位大师提出的,大家曾经在某个时期都乐此不彼的寻求各种的问题一条SQL法,但是大师的意思似乎被曲解,很多性能差,可读性差,灵活差的SQL都是这个原则产物,所谓画虎不成反成犬类。不过,解决问题始终是第一原则,这里还是给出一个比较有代表性的一条SQL方法。SELECTcountry,max(subst
29、r(city,2)cityFROM(SELECTcountry,sys_connect_by_path(city,)cityFROM(SELECTcountry,city,country|rnrchild,country|(rn-1)rfatherFROM(SELECTtest.country,test.city,row_number()over(PARTITIONBYtest.countryORDERBYtest.city)rnFROMtest)CONNECTBYPRIORrchild=rfatherSTARTWITHrfatherLIKE%0)GROUPBYcountry;下面分步解析,有
30、4个FROM,就有4次结果集的操作。step1给记录加上序号rnSQLSELECTtest.country,test.city,row_number()over(PARTITIONBYtest.countryORDERBYtest.city)rn2FROMtest3/COUNTRYCITYRN-日本大阪1日本东京2中国上海1中国台北2中国香港3step2创造子节点父节点SQLSELECTcountry,city,country|rnrchild,country|(rn-1)rfather2FROM3(SELECTtest.country,test.city,row_number()over(P
31、ARTITIONBYtest.countryORDERBYtest.city)rn4FROMtest)5/日本大阪日本1日本0日本东京日本2日本1中国上海中国1中国0中国台北中国2中国1中国香港中国3中国2step3利用sys_connect_by_path生成结果集SELECTcountry,sys_connect_by_path(city,)cityFROM(SELECTcountry,city,country|rnrchild,country|(rn-1)rfatherFROM(SELECTtest.country,test.city,row_number()over(PARTITIONBYtest.countryORDERBY