最新 最热

大数据面试:面试官要求我了解过Presto——Presto到底是个什么东西

我在实习僧App上发现一家公司非常匹配我的需求~城市匹配 技能匹配 福利匹配 还是一家游戏公司 (典型的钱多离家近,事估计少不了了 ) 三配下来我不得不认真研究该公司的职位要求:...

2021-12-07
0

【推荐系统】推荐业务架构介绍(一)

在头条APP海量用户与海量文章之上,使用lambda大数据实时和离线计算整体架构,利用黑马头条用户在APP上的点击行为、浏览行为、收藏行为等建立用户与文章之间的画像关系,通过机器学习推荐算法进行智能推荐...

2021-12-07
0

【秋招面试】面试准备(一面准备)

实际上算法这块我还是个菜狗 没办法机会难得,不知道下次能不能这么走运 只能硬着头皮上了……!

2021-12-07
1

Could not open client transport with JDBC Uri: jdbc:hive2://192.168.88.10:10000: java.net.ConnectExc

Connection to node1.itcast.cn failed. [ 08S01] Could not open client transport with JDBC Uri: jdbc:hive2://192.168.88.10:10000: java.net.ConnectException: Co...

2021-12-07
1

大数据错题库(微信群Bug整理)

勤快懒人: 数据仓库 本身上讲 已经是结构化或者是半结构化的数据 数据湖 就是半结构化 +没有结构的数据 数据源更加丰富 【数据仓库或者数据湖的作用 感觉和代码复用很想 常用的抽出来】...

2021-12-07
1

大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day10】——Hbase4

•个数原则:如果列的个数比较多,建议2 ~ 3个,如果列的个数比较少,建议1个 –列族个数多了,导致比较次数变多,降低性能 –列族个数少了,导致列的比较次数变多,降低性能 •长度原则 :能满足业务需求的情况下,越短越好...

2021-12-07
1

2021年最新最全Flink系列教程__Flink综合案例(九)

day09_综合案例今日目标Flink FileSink 落地写入到 HDFSFlinkSQL 整合 Hive数据仓库订单自动好评综合案例Flink FileSink 落地写入到 HDFSFlinkSQL 整合 HiveFlink实现订单自动好评问题Streaming File sink 落地到 HD...

2021-12-07
0

最新大数据集群安装方法CentOS7.6__大数据环境安装和配置

大数据环境安装和配置(Hadoop2.7.7,Hive2.3.4,Zookeeper3.4.10,Kafka2.1.0,Flume1.8.0,Hbase2.1.1,Spark2.4.0等)

2021-12-07
1

Note_Spark_Day08:Spark SQL(Dataset是什么、外部数据源、UDF定义和分布式SQL引擎)

​ Spark 框架从最初的数据结构RDD、到SparkSQL中针对结构化数据封装的数据结构DataFrame, 最终使用Dataset数据集进行封装,发展流程如下。

2021-12-07
0