DataFrame的常用操作

2023-02-25 15:50:38 浏览数 (1)

Java版本

代码语言:javascript复制
​//打印DataFrame中所有的数据(select * from ...)
​​df.show();

​​//打印DataFrame的元数据(schema)
​​df.printSchema();

//查询某列所有数据
​​df.select("name").show();

//查询某几个列所有数据并对列进行计算
​​df.select(df.col("name"),df.col("age").plus(1)).show();

//过滤
​​df.filter(df.col("age").gt(18)).show();

//按照组进行统计
df.groupBy(df.col("age")).count().show();

Scala版本

代码语言:javascript复制
df.select("name").show() 

df.select(df("name"), df("age")   1).show() 

df.filter(df("age") > 21).show() 

df.groupBy("age").count().show() 

0 人点赞