在OLAP分析引擎领域,Apache Kylin可以说是一个重要的成员,相比于大规模并行处理指导思想下的Hive、Presto等组件,Apache Kylin采取了新的计算模式,提供不同的解决方案。今天的大数据开发分享,我们就主要来讲讲OLAP分析引擎...
在之前的《大数据开发:OLAP开源数据分析引擎简介》一文当中,我们对主流的一些开源数据分析查询引擎做了大致的介绍,今天的大数据开发分享,我们具体来讲解其中的Presto查询引擎,是什么,为什么会出现,又能够解决什么样的数据处...
HDFS作为分布式文件系统的代表性产品,在大数据学习当中的重要性是不言而喻的,基于Hadoop基础架构,HDFS更是得到了广泛的认可,在大规模离线数据处理上,提供稳固的底层支持。今天的大数据开发技术分享,我们就主要来讲讲HDFS N...
HDFS作为Hadoop的分布式文件系统,其在大数据平台当中的地位是显而易见的。面对越来越大规模的数据存储任务,HDFS的高可靠性和高性能依然值得称赞,这也与HDFS的数据读写机制有关。今天的大数据开发分享,我们具体来讲讲HDFS...
但从利润率的角度来看,中国制造业还是存在着不足之处。制造企业想要降低成本、提高生产效率、增加产品的附加值、维护好客户关系就要与时俱进,实现企业信息化管理。其中借助ERP软件是关键。...
1、集群整体性能降低。对TBDS产品在同等配置物理机与虚拟机实际的性能测试对比表明,虚拟机整体性能较物理机下降约40%左右;
Kafka在大数据流式处理场景当中,正在受到越来越多的青睐,尤其在实时消息处理领域,kafka的优势是非常明显的。相比于传统的消息中间件,kafka有着更多的潜力空间。今天的大数据开发分享,我们就主要来讲讲Apache Kafka分布式...
Kafka在大数据技术生态当中,以作为消息系统而闻名,面对活跃的流式数据,提供高吞吐量的服务,在实时大数据处理场景下,可以说是一大利器,国内外大厂都有应用。今天的大数据开发分享,我们就主要来讲讲Kafka框架的工作原理。...
在流计算越来越受到重视的大趋势下,Flink框架受到的关注和重视,可以说是与日俱增,在大数据的学习当中,Flink也成为重要的一块。今天的大数据开发分享,我们主要来讲讲,Flink on Yarn原理。...
作为Hadoop生态核心组件的MapReduce,是实现大数据计算处理的主要引擎,其核心思想是“分而治之”,简单来说就是分为Map和Reduce两个阶段。今天的大数据开发分享,我们主要来讲讲MapReduce具体的任务流程。...