Java版本
代码语言:javascript复制//打印DataFrame中所有的数据(select * from ...)
df.show();
//打印DataFrame的元数据(schema)
df.printSchema();
//查询某列所有数据
df.select("name").show();
//查询某几个列所有数据并对列进行计算
df.select(df.col("name"),df.col("age").plus(1)).show();
//过滤
df.filter(df.col("age").gt(18)).show();
//按照组进行统计
df.groupBy(df.col("age")).count().show();
Scala版本
代码语言:javascript复制df.select("name").show()
df.select(df("name"), df("age") 1).show()
df.filter(df("age") > 21).show()
df.groupBy("age").count().show()