最新 最热

九个最容易出错的 Hive sql 详解及使用注意事项

五分钟学大数据,致力于大数据技术研究,如果你有任何问题或建议,可添加底部小编微信或直接后台留言

2021-03-04
0

数仓面试高频考点--解决hive小文件过多问题

五分钟学大数据,致力于大数据技术研究,如果你有任何问题或建议,可添加底部小编微信或直接后台留言

2021-03-04
1

hadoop生态之sqoop

在使用大数据的时候,各种不同的数据都要将数据采集同步到数据仓库中,一个是属于业务系统的RDBMS系统,也就是各种关系型数据库,一个是hadoop生态的存储,中间用于传输的数据的工具可以使用sqoop,也就是sql to hadoop。...

2021-03-04
0

hive之编译源码

使用maven来进行源码,真的是靠运气,特别是你网络很差的情况下,再特别是你没有本地库的时候,靠运气吃饭。。。

2021-03-04
0

hadoop生态之hive

大数据的生态包含各种各样的组件,hive是其中之一,hive主要是作为数据仓库的工具,简化相关人员的代码工作,只要编写简单的SQL就可以实现mapreduce效果。...

2021-03-04
1

工作经验分享:Spark调优【优化后性能提升1200%】

问题导读1.本文遇到了什么问题?2.遇到问题后,做了哪些分析?3.本文解决倾斜使用哪些方法?4.本次数据倾斜那种方法更有效?5.解决性能优化问题的原理是什么?优化后效果1.业务处理中存在复杂的多表关联和计算逻辑(原始数据达百亿...

2021-03-03
0

网易Kyuubi

网易在Spark多租户方面的工作,这个项目叫做Kyuubi(该项目的开源地址: https://github.com/netease-bigdata/kyuubi https://github.com/yaooqinn/kyuubi),实际上是类似于HiveSever2的程序。...

2021-03-03
0

hive之路4-CLI和Beeline

beeline是hiveserver2的CLI,一个JDBC的客户端,分为两种模式

2021-03-02
0

hive之路5-hive数据类型

它支持传统的UNIX时间戳可选纳秒的精度。它支持的java.sql.Timestamp格式YYYY-MM-DD HH:MM:SS.fffffffff和格式YYYY-MM-DD HH:MM:ss.ffffffffff。

2021-03-02
0

hive之路6-存储格式和数据格式

Hadoop API提供的**二进制存储格式,**具有使用方便、可分割、可压缩等特点。它支持三种压缩格式:

2021-03-02
0