今天在一个关注度颇高的技术公众号上看到一篇Oracle分析函数的文章,和我2009年写的博文很像,仔细看了一下,或许互联网上的抄袭不叫抄袭吧,愤愤然把之前的帖子翻了出来,结果还得靠申诉才能争取原创。后来修改了一会儿,还是发出去吧。
Oracle分析函数应该是各个数据库分析函数的鼻祖,其他数据库到目前为止支持的还不够全面和友好,Oracle分析函数不仅能够减少代码量,提升可读性,还可以解决性能问题。
SUM :该函数计算组中表达式的累积和,求值后通常用于帕累托图分析
MIN :在一个组中的数据窗口中查找表达式的最小值,配合partition和order可以进行复杂的最小值求解
MAX :在一个组中的数据窗口中查找表达式的最大值,配合partition和order可以进行复杂的最大值求解
AVG :用于计算一个组和数据窗口内表达式的平均值,配合partition和order可以进行平均的最大值求解
COUNT :对一组内发生的事情进行累积计数
RANK :根据ORDER BY子句中表达式的值,从查询返回的每一行,计算它们与其它行的相对位置
DENSE_RANK :根据ORDER BY子句中表达式的值,从查询返回的每一行,计算它们与其它行的相对位置
row_number():返回的是行信息,不会跳跃;
dense_rank():返回的相关等级不会跳跃;
rank():返回的相关等级会跳跃;
count():返回的该窗口计算规则内的数量,简单排序会产生跳跃
FIRST :从DENSE_RANK返回的集合中取出排在最前面的一个值的行
LAST :从DENSE_RANK返回的集合中取出排在最后面的一个值的行
FIRST_VALUE :返回组中数据窗口的第一个值
LAST_VALUE :返回组中数据窗口的最后一个值。
FIRST_VALUE和LAST_VALUE比较方便查找满足条件的值
LAG :可以访问结果集中的其它行而不用进行自连接
LEAD :LEAD与LAG相反,LEAD可以访问组中当前行之后的行
LAG和LEAD可以取跨行值,减少自连接访问
ROW_NUMBER :返回有序组中一行的偏移量,从而可用于按特定标准排序的行号
STDDEV :计算当前行关于组的标准偏离
STDDEV_POP:该函数计算总体标准偏离,并返回总体变量的平方根
STDDEV_SAMP:该函数计算累积样本标准偏离,并返回总体变量的平方根
VAR_POP :该函数返回非空集合的总体变量(忽略null)
VAR_SAMP :该函数返回非空集合的样本变量(忽略null)
VARIANCE :如果表达式中行数为1,则返回0,如果表达式中行数大于1,则返回VAR_SAMP
COVAR_POP :返回一对表达式的总体协方差
COVAR_SAMP :返回一对表达式的样本协方差
CORR :返回一对表达式的相关系数
CUME_DIST :计算一行在组中的相对位置
NTILE :将一个组分为"表达式"的散列表示
PERCENT_RANK :和CUME_DIST(累积分配)函数类似
PERCENTILE_DISC :返回一个与输入的分布百分比值相对应的数据值
PERCENTILE_CONT :返回一个与输入的分布百分比值相对应的数据值
RATIO_TO_REPORT :该函数计算expression/(sum(expression))的值,它给出相对于总数的百分比
REGR_ (Linear Regression) Functions :这些线性回归函数适合最小二乘法回归线,有9个不同的回归函数可使用
以上函数一般用于统计分析报表中,方便进行TOP N%排名的求解
CUBE :按照OLAP的CUBE方式进行数据统计,即各个维度均需统计
ROLLUP :按照OLAP的CUBE方式进行数据统计,即相关维度层层统计
以上函数一般用于处理多维数据,在多维报表中进行灵活呈现
举例数据和结构如下:
代码语言:javascript复制SELECT
department_id,
manager_id,
employee_id,
first_name||' '||last_name employee_name,
hire_date,
salary,
job_id
FROM employees
ORDER BY department_id,hire_date