最新 最热

初识大数据与Hadoop

在大数据时代,基于大数据技术的职位更有钱途,因此成为很多人的职业首选。在大数据技术中,大家常常听到 Hadoop,很多刚开始接触的人会问,什么是 Hadoop?它有什么作用?下面笔者就跟大家唠叨唠叨。...

2021-03-09
1

Tiup 常用运维操作命令干货

2.启动顺序 PD->tikv->pump->tidb->tiflash->drainer

2021-03-08
0

hadoop常用命令

启动Hadoop 进入HADOOP_HOME目录。 执行sh bin/start-all.sh 关闭Hadoop 进入HADOOP_HOME目录。 执行sh bin/stop-all.sh

2021-03-07
0

解读Secondary NameNode的功能

最近有朋友问我Secondary NameNode的作用,是不是NameNode的备份?是不是为了防止NameNode的单点问题?确实,刚接触Hadoop,从字面上看,很容易会把Secondary NameNode当作备份节点;其实,这是一个误区,我们不能从字面来理解,阅读官方...

2021-03-05
1

大数据开源框架技术汇总

Hadoop:Apache Hadoop是一个开源的分布式系统基础框架,离线数据的分布式存储和计算的解决方案。Hadoop最早起源于Nutch,Nutch基于2003 年、2004年谷歌发表的两篇论文分布式文件系统GFS和分布式计算框架MapReduce的开源实...

2021-03-05
1

【开发实践】美团为什么开发 Kylin On Druid(上)?

在大数据分析领域,Apache Kylin 和 Apache Druid (incubating) 是两个普遍使用的 OLAP 引擎,都具有支持在超大数据上进行快速查询的能力。在一些对大数据分析非常依赖的企业,往往同时运行着 Kylin 和 Druid 两套系统,服务于...

2021-03-05
1

分布式计算—MapReduce、Spark、Storm、Flink分别适用什么场景

链接:https://www.zhihu.com/question/403840013/answer/1317631316

2021-03-05
1

最新Hadoop的面试题总结

1)Zookeeper:是一个开源的分布式应用程序协调服务,基于zookeeper可以实现同步服务,配置维护,命名服务。  2)Flume:一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。  3)Hbase:是一个分布式的、面向列的开源数...

2021-03-05
1

Spark 在金融领域的应用之日内走势预测

2014年后半年开始,国内 A 股市场可谓是热火朝天啊,路上的人谈的都是股票。小弟虽然就职金融互联网公司,但之前从来没有买过股票,但每天听着别人又赚了几套房几辆车,那叫一个心痒痒啊,那感觉,就跟一个出浴美女和你共处一室,但...

2021-03-05
1

最全大数据就业前景分析!此篇文章给你答案

如今,大数据的潜入已经开始在日益的改变着各行各业以及我们的生活,同时大数据已经开始广泛的应用于电网运行及优质服务等等各大领域,并且它也正在日益改变着各行各业的生产生活,最重要的是它还引领了大部分大数据人才的变...

2021-03-04
0