Hive环境搭建 | 数据仓库工具搭建详细过程

2022-05-31 10:06:01 浏览数 (1)

1.Hive简介

hive是基于Hadoop的一个数据仓库的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。

Hive的优点是学习成本低,可以通过类似SQL语句实现快速MapReduce统计,使MapReduce变得更加简单,而不必开发专门MapReduce应用程序。

2.环境Hive安装

1.前置环境

对应的安装包可以再公众号我获取。在安装Hive之前,需要先确保Hadoop与MySQL是正常启动的,Hadoop与MySQL的搭建可以参[环境搭建的系列文章。

2.解压安装包

这里我们在node1节点上安装Hive,将安装包解压放在app目录下

代码语言:javascript复制
#解压
tar -zxvf /opt/software/apache-hive-3.1.2-bin.tar.gz -C /app
#修改别名
mv apache-hive-3.1.2-bin hive-3.1.2

3.添加环境变量

代码语言:javascript复制
vim /etc/profile 
#添加下面两行
export HIVE_HOME=/app/hive-3.1.2
export PATH=$PATH:$HIVE_HOME/bin

#source /etc/profile

4.解决日志的Jar包冲突

代码语言:javascript复制
cd /app/hive-3.1.2/lib
mv log4j-slf4j-impl-2.10.0.jar log4j-slf4j-impl-2.10.0.jar.bak

5.拷贝MySQL的JDBC驱动到Hive

代码语言:javascript复制
#没有安装包的可以搜索下载也可以私聊我获取
cp mysql-connector-java-5.1.27.jar /app/hive-3.1.2

6.配置Metastore

在/app/hive-3.1.2/conf目录下新建hive-site.xml文件 vim hive-site.xml添加如下配置

代码语言:javascript复制
<configuration>
    <property>
        <name>javax.jdo.option.ConnectionURLname>
        <value>jdbc:mysql://node1:3306/metastore?useSSL=falsevalue>
    property>

    <property>
        <name>javax.jdo.option.ConnectionDriverNamename>
        <value>com.mysql.jdbc.Drivervalue>
    property>

    <property>
        <name>javax.jdo.option.ConnectionUserNamename>
        <value>rootvalue>
    property>

    <property>
        <name>javax.jdo.option.ConnectionPasswordname>
        <value>123456value>
    property>

    <property>
        <name>hive.metastore.warehouse.dirname>
        <value>/user/hive/warehousevalue>
    property>

    <property>
        <name>hive.metastore.schema.verificationname>
        <value>falsevalue>
    property>

    <property>
    <name>hive.server2.thrift.portname>
    <value>10000value>
    property>

    <property>
        <name>hive.server2.thrift.bind.hostname>
        <value>node1value>
    property>

    <property>
        <name>hive.metastore.event.db.notification.api.authname>
        <value>falsevalue>
    property>
    
    <property>
        <name>hive.cli.print.headername>
        <value>truevalue>
    property>

    <property>
        <name>hive.cli.print.current.dbname>
        <value>truevalue>
    property>
configuration>

7.登录MySQL创建对应数据库

代码语言:javascript复制
 create database metastore;

8.初始化Hive元数据库

代码语言:javascript复制
#运行命令
schematool -initSchema -dbType mysql -verbose

9.启动Hive查看是否安装成功

启动命令为 “hive”

0 人点赞