最新 最热

SQL 找出分组中具有极值的行

你可能也遇到过这种需求:找出每个部门入职最早的员工的信息;获取每个科目最高分的学生信息;获取用户最近一次的完整登录信息。

2020-07-20
2

PAT 1025 PAT Ranking (25分) vector + sort

Programming Ability Test (PAT) is organized by the College of Computer Science and Technology of Zhejiang University. Each test is supposed to run simultaneousl...

2020-07-14
6

「R」使用NMF包绘制热图

学习文档: https://cran.r-project.org/web/packages/NMF/vignettes/heatmaps.pdf

2020-07-03
1

生存曲线基础篇:这两个问题要清楚,避免踩雷!

每个人对统计学都存在着爱与恨,0.05这个数字像是莫得感情的虚拟法官,时刻对我们所做的工作进行宣判。

2020-06-24
1

hive sql 窗口函数

1) 窗口函数 Lag, Lead, First_value,Last_valueLag, Lead、这两个函数为常用的窗口函数,可以返回上下数据行的数据. LAG(col,n,DEFAULT) 用于统计窗口内往上第n行值LEAD(col,n,DEFAULT) 用于统计窗口内往下第n行值, ...

2020-06-19
3

【HDU 5833】Zhu and 772002(异或方程组高斯消元)

比如12=2^2*3,对应的奇偶值为01(2的个数是偶数为0,3的个数是奇数为1),3的对应奇偶值为01,于是12*3是完全平方数。

2020-06-02
1

hive排序后collect_set

首先排序:row_number() over (partition by category order by cast(duration as int) desc) duration_rank,然后拼接concat_ws(',',collect_set(category)),但是得到的结果却是乱序的,产生这个问题的根本......

2020-05-28
2

Graphviz dot 笔记

输入文件是 <infile.dot> ,生成的格式由 指定,生成的文件是 。其中 -T 包括:

2020-05-22
2

多重假设检验的三种常见方法计算

一般来说,当p.value < 0.05时,我们认为犯错误的概率很低,可以否定原假设。但是假如我们做了很多次实验,比如10000次,那么犯错误的次数可能能达到500次,我们要规避这么多的假阳性结果,就需要考虑多重假设检验。...

2020-05-18
2

关于SparkSQL的开窗函数,你应该知道这些!

相信用过MySQL的朋友都知道,MySQL中也有开窗函数的存在。开窗函数的引入是为了既显示聚集前的数据,又显示聚集后的数据。即在每一行的最后一列添加聚合函数的结果。...

2020-05-07
2