最新 最热

一文详解数栈FlinkX实时采集原理与使用

PostgreSQL 实时采集是基于 PostgreSQL的逻辑复制以及逻辑解码功能来完成的。逻辑复制同步数据的原理是,在Wal日志产生的数据库上,由逻辑解析模块对Wal日志进行初步的解析,它的解析结果为ReorderBufferChange(可以简单理...

2021-05-14
1

看完了108份面试题,我为你总结出了这 10 个【Hive】高频考点(建议收藏)

之前听 CSDN 头牌博主 @沉默王二 说过一句话,我觉得十分在理:处在互联网时代,是一种幸福,因为各式各样的信息非常容易触达,如果掌握了信息筛选的能力,就真的是“运筹帷幄之中,决胜千里之外”。就像现在各行业都内卷不断,我们...

2021-05-13
1

开箱即用,腾讯数据湖计算为海量数据分析赋能

导读 / Introduction 数据湖解决了海量异构数据的入湖和存储需求。通过对海量数据的分析挖掘,提升对数据的洞察,助力数字化决策,进而促进业务发展,是每个企业构建数据湖的根本目的所在。随着业务迭代的不断加速,企业对数据...

2021-05-13
1

Pyspark学习笔记(三)--- SparkContext 与 SparkSession

__SparkContext__是spark功能的主要入口。 其代表与spark集群的连接,能够用来在集群上创建RDD、累加器、广播变量。 每个JVM里只能存在一个处于激活状态的SparkContext,在创建新的SparkContext之前必须调用stop()来关闭...

2021-05-10
1

QTX | Daniel Arsham全系列AE作品展精彩回顾

QQ潮玩展2021已完美收官,作为QQ潮玩展2021中最具艺术价值的展中展之一——由Archive Editons带来的Daniel Arsham作品展,给今年QTX的游客留下了深刻的印象。现在就来回顾! 本次展中展内,可以看到国际顶尖艺术家Daniel Ars...

2021-05-10
1

新手友好 | Hadoop-架构、原理、实时计算和离线计算

一、什么是Hadoop二、Hadoop各个组件的作用三、Hadoop核心组件的架构3.1、HDFS3.2、MapReduce3.3、YARN四、实时计算和离线计算的过程

2021-05-08
1

0836-Apache Druid on HDP

Apache Druid是一个分布式的、面向列的、实时分析数据库,旨在快速获取大量数据并将其编入索引,并对大型数据集进行快速的切片和切分分析(“OLAP查询),常用于实时摄取、快速查询和对时间依赖性很高的数据库用户。因此,Druid...

2021-04-30
1

CDP私有云基础版7.1.6的新功能是什么?

根据IDG的说法,当客户考虑更新到产品的最新版本时,他们期望新功能、增强的安全性和更好的性能,但越来越希望拥有更简化的升级过程。伴随着CDP私有云的每个新版本,我们正在努力提供这些内容。伴随着许多新功能,我们正在尽可...

2021-04-30
1

初识Hive之Hive的基本操作命令

其中方括号中的内容为可选项,意思是:如果不存在数据库test01则创建。 第二条创建语句comment选项后指定的是该数据库的备注信息,原生的hive不支持中文,想要支持中文要修改国际化的配置文件,location后指定的是数据库的存储...

2021-04-29
1

Hive本地模式安装 schematool -initSchema -dbType mysql初始MySQL数据库报错-Access denied for user ‘root‘@‘

根本原因:java.sql.SQLException异常:拒绝访问用户’root’@‘192.168.200.200’(使用密码:是)

2021-04-29
1