最新 最热

系统数据流程

一、日志采集系统 记录用户行为(搜索、悬停、点击事件、按钮、输入,请求异常采集等) PC端、App端(Ios,安卓),前端收集埋点数据

2020-09-20
1

(四)Hive分区、分桶

CREATE TABLE IF NOT EXISTS salgrade2 ( GRADE int, LOSAL int, HISAL int ) partitioned by (day string) row format delimited fields terminated by 't' locati...

2020-09-18
1

CentOS7上安装 JDK8 Hadoop Hive

下载:https://pan.baidu.com/s/17ZDrs9n3geawFZZltvsbTQ 提取码: ph6v

2020-09-17
0

Hive on Spark参数调优姿势小结

Hive on Spark是指使用Spark替代传统MapReduce作为Hive的执行引擎,在HIVE-7292提出。Hive on Spark的效率比on MR要高不少,但是也需要合理调整参数才能最大化性能,本文简单列举一些调优项。为了符合实际情况,Spark也采用o...

2020-09-16
1

EdgeX foundry树莓派搭建与MQTT通讯

使用容器方法管理和搭建EdgeX:https://docs.edgexfoundry.org/1.2/getting-started/quick-start/

2020-09-16
1

flink教程-flink 1.11 使用sql将流式数据写入hive

上一篇介绍了使用sql将流式数据写入文件系统,这次我们来介绍下使用sql将文件写入hive,对于如果想写入已经存在的hive表,则至少需要添加以下两个属性. 写入hive底层还是和写入文件系统一样的,所以对于其他具体的配置参考...

2020-09-15
1

Flink源码分析之深度解读流式数据写入hive

前段时间我们讲解了flink1.11中如何将流式数据写入文件系统和hive [flink 1.11 使用sql将流式数据写入hive],今天我们来从源码的角度深入分析一下。以便朋友们对flink流式数据写入hive有一个深入的了解,以及在出现问题...

2020-09-15
1

flink教程-flink modules详解之使用hive函数

flink 提供了一个module的概念,使用户能扩展flink的内置对象,比如内置函数。这个功能是插件化的,用户可以方便的加载或者移除相应的module。

2020-09-15
1

Flink教程-使用sql将流式数据写入文件系统

flink提供了一个file system connector,可以使用DDL创建一个table,然后使用sql的方法写入数据,支持的写入格式包括json、csv、avro、parquet、orc。

2020-09-15
0

Flink教程-flink 1.11 流式数据ORC格式写入file

在flink中,StreamingFileSink是一个很重要的把流式数据写入文件系统的sink,可以支持写入行格式(json,csv等)的数据,以及列格式(orc、parquet)的数据。hive作为一个广泛的数据存储,而ORC作为hive经过特殊优化的列式存储格式,...

2020-09-15
1