这道 SQL 题,听说你有不一样的解法?

2022-07-05 14:10:16 浏览数 (1)

题目:

(1).前置条件:

有以下数据集C,表查询结果如下图所示,设置该表为表:test_month_amount。

(2).题目要求:

数据集C 中 Amount 字段是每个人同一月份,不同状态的金额总和,现要求使用 sql 实现对相同月份的数据均分Amount。

预期结果:
解题思路:

(1). 子查询B: 按照NAME和MON进行分组求数量总和

查询结果如下:

代码语言:javascript复制
NAME    MON       cnt
张三    201901    3
李四    201902    2
王五    201902    2

(2). 使用子查询C left join 子查询 B 的结果,关联条件为: NAME, MON,使用 C.AMOUNT/B.cnt 即可求得平均值

查询结果如预期结果所示

解题方式一:

适用于不用创建物理表的情况下

使用数据集C、A替代物理表:test_month_amount,直接复制以下 hive sql 语句,可以在 Apache Hive 环境直接运行,得到以上预期结果数据。

代码语言:javascript复制
select C.ID
   ,C.NAME
   ,C.MON
   ,CAST(C.AMOUNT/B.cnt AS BIGINT) AS AMOUNT 
 from (
  select 1 ID,'张三' NAME,201901 MON,'A' STATE,9000 AMOUNT
  union all
  select 2 ID,'张三' NAME,201901 MON,'B' STATE,9000 AMOUNT
  union all
  select 3 ID,'张三' NAME,201901 MON,'E' STATE,9000 AMOUNT
  union all
  select 4 ID,'李四' NAME,201902 MON,'A' STATE,1800 AMOUNT
  union all
  select 5 ID,'李四' NAME,201902 MON,'C' STATE,1800 AMOUNT
  union all
  select 6 ID,'王五' NAME,201902 MON,'C' STATE,30000 AMOUNT
  union all
  select 7 ID,'王五' NAME,201902 MON,'F' STATE,30000 AMOUNT
 )C 
 left join (select A.NAME
      ,A.MON
      ,count(1) as cnt 
    from (
      select 1 ID,'张三' NAME,201901 MON,'A' STATE,9000 AMOUNT
      union all
      select 2 ID,'张三' NAME,201901 MON,'B' STATE,9000 AMOUNT
      union all
      select 3 ID,'张三' NAME,201901 MON,'E' STATE,9000 AMOUNT
      union all
      select 4 ID,'李四' NAME,201902 MON,'A' STATE,1800 AMOUNT
      union all
      select 5 ID,'李四' NAME,201902 MON,'C' STATE,1800 AMOUNT
      union all
      select 6 ID,'王五' NAME,201902 MON,'C' STATE,30000 AMOUNT
      union all
      select 7 ID,'王五' NAME,201902 MON,'F' STATE,30000 AMOUNT
    ) A group by NAME, MON
   ) B ON C.NAME=B.NAME AND C.MON=B.MON;
解题方式二:

适用于先创建物理表:test_month_amount的情况下

将测试数据 insert 至 test_month_amount 表。

表数据结果如下:

将解题方式一中的数据集C, A替换成表 test_month_amount即可。

代码语言:javascript复制
select C.ID
   ,C.NAME
   ,C.MON
   ,CAST(C.AMOUNT/B.cnt AS BIGINT) AS AMOUNT 
 from test_month_amount C 
 left join (select A.NAME
      ,A.MON
      ,count(1) as cnt 
    from test_month_amount A group by NAME, MON
   ) B ON C.NAME=B.NAME AND C.MON=B.MON;
知识点归纳:

使用 hive sql 完成这道 Sql 题,所使用到的函数或方法如下:

代码语言:javascript复制
CAST(C.AMOUNT/B.cnt AS BIGINT) AS AMOUNT 

C.AMOUNT/B.cnt: 求每个用户相同月份不同状态的平均值

CAST: 类型转换函数,此处将计算出来的平均值结果转换为 BIGINT 类型并将结果取了别名:AMOUNT

0 人点赞