最新 最热

「基础」SQL-Hive中的select from 解析

Hive系列文章预计10-20篇,主要讲数据分析中最基础的SQL技能。每周定期更新,欢迎关注公众号。

2021-05-18
0

「基础」SQL-Hive中常用的表格操作(下)

下面我们将建好的表t_od_use_cnt重命名为t_od_use_cnt_new,然后再改回来。

2021-05-18
0

「基础」SQL-Hive中常用的表格操作(上)

Hive系列文章预计10-20篇,主要讲数据分析中最基础的SQL技能。每周定期更新,欢迎关注公众号。

2021-05-18
0

「基础」SQL-Hive中常用的数据库操作

如果想删除数据库,要么先将数据库中的表全部删除,此时可以使用CASCADE关键字,使用该关键字后,Hive会自己将数据库下的表全部删除。慎用慎用!

2021-05-18
0

「基础」SQL-Hive简介及常用数据类型

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表。Hive 定义了简单的类 SQL 查询语言,称为 HQL,它允许熟悉 SQL 的用户查询数据。...

2021-05-18
0

Hive个人笔记总结

①保证环境变量中有JAVA_HOME ②基于HADOOP工作,保证环境变量中有HADOOP_HOME ③在环境变量中配置HIVE_HOME,默认hive在启动时,会读取HIVE_HOME/conf中的配置文件...

2021-05-14
1

深入理解Hive【Hive架构介绍、安装配置、Hive语法介绍】

4、底层支持多种不同的执行引擎【MR/Tez/Spark】1.x默认为MR     2.x默认为Spark   当然也可以设置为Tez

2021-05-14
0

Hive文件格式之textfile,sequencefile和rcfile的使用与区别详解

hive在创建表时默认存储格式是textfile,或者显示自定义的stored as textfile。

2021-05-14
0

数栈技术分享:详解FlinkX中的断点续传和实时采集

数栈是云原生—站式数据中台PaaS,我们在github和gitee上有一个有趣的开源项目:FlinkX,FlinkX是一个基于Flink的批流统一的数据同步工具,既可以采集静态的数据,也可以采集实时变化的数据,是全域、异构、批流一体的数据同步引...

2021-05-14
0

大数据组件:Hive优化之配置参数的优化

Hive是大数据领域常用的组件之一,主要用于大数据离线数仓的运算,关于Hive的性能调优在日常工作和面试中是经常涉及的一个点,因此掌握一些Hive调优是必不可少的一项技能。影响Hive效率的主要因素有数据倾斜、数据冗余、jo...

2021-05-14
0