最新 最热

Hive 调优,先掌握这几种优化模式

Hive和MapReduce中拥有较多在特定情况下优化的特性,如何利用好相关特性,是Hive性能调优的关键。本文就介绍那些耳熟但不能详的几种Hive优化模式。

2020-03-25
0

超越 MapReduce ,要比它更快!

前面介绍了大数据领域里的两个主流引擎:MapReduce 和 Spark 。它们开创了历史,使得世界进入了大数据时代,让很多公司能够处理庞大的数据,并从中找到更多的有价值的东西。所以,Hadoop 刚开始兴起时,大家都兴奋于我终于能够处...

2020-03-25
0

Java8 Stream流

关注公众号(CoderBuff)回复“stream”获取《Java8 Stream编码实战》PDF完整版。

2020-03-25
0

趣谈交互式查询的历史之 Impala

接着上篇文章继续聊聊交互式查询,交互式查询崛起的原因是人类的懒惰本质,自从谷歌发表了 Dremel 论文后,相似的计算引擎不断地出现,在这篇文章里,针对几种典型的计算引擎简单聊聊。...

2020-03-25
0

快速学习-Azkaban入门

1)一个完整的数据分析系统通常都是由大量任务单元组成:shell脚本程序,java程序,mapreduce程序、hive脚本等 2)各任务单元之间存在时间先后及前后依赖关系 3)为了很好地组织起这样的复杂执行计划,需要一个工作流调度系统来调...

2020-03-25
0

酷炫的 Stream API 最佳指南

Java 8 带来一大新特性 Lambda 表达式流(Stream),当流与 Lambda 表达式结合使用,代码将变得相当骚气与简洁。

2020-03-24
1

快速学习-Kylin概述

Apache Kylin是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。...

2020-03-24
0

论文赏析[AI18]更快的基于非二叉化自底向上策略的转移系统成分句法分析

Faster Shift-Reduce Constituent Parsing with a Non-Binary, Bottom-Up Strategygodweiyang.com

2020-03-24
0

论文赏析[EMNLP18]针对自顶向下和中序移进归约成分句法分析的Dynamic Oracles

Dynamic Oracles for Top-Down and In-Order Shift-Reduce Constituent Parsinggodweiyang.com

2020-03-24
0

论文赏析[NAACL16]RNN文法

Recurrent Neural Network Grammarsgodweiyang.com

2020-03-24
0