温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。
Fayson的github: https://github.com/fayson/cdhproject
提示:代码块部分可以左右滑动查看噢
1
文章编写目的
在前面Fayson的文章《0459-如何使用SQuirreL通过JDBC连接CDH的Hive(方式一)》和《0463-如何使用SQuirreL通过JDBC连接CDH的Hive(方式二)》介绍了SQuirreL的安装以及使用原生和Cloudera提供的JDBC 驱动访问Hive。本篇文章Fayson主要介绍如何使用Cloudera提供的Hive JDBC驱动访问Kerberos环境下的Hive,为什么不讲原生的JDBC驱动,因为Fayson也没有调通。
- 测试环境
1.RedHat7.2
2.CM和CDH版本为5.15.0
3.Window Server 2012R2
4.SQuirreL版本为3.9.0
2
安装Kerberos客户端
1.在Kerberos官网下载,地址如下
代码语言:javascript复制https://web.mit.edu/kerberos/dist/index.html
安装过程这里就不在详细说明了。
2.将CDH集群的/etc/krb5.conf文件,在Window客户端如下目录创建krb5.ini文件,内容如下:
代码语言:javascript复制“C:ProgramDataMITKerberos5krb5.ini”
代码语言:javascript复制[libdefaults]
dns_lookup_realm = false
ticket_lifetime = 24h
renew_lifetime = 7d
forwardable = true
rdns = true
default_realm = FAYSON.COM
#default_ccache_name = KEYRING:persistent:%{uid}
[realms]
FAYSON.COM = {
kdc = adserver.fayson.com
admin_server = adserver.fayson.com
}
[domain_realm]
.fayson.com = FAYSON.COM
fayson.com = FAYSON.COM
3.配置环境变量,krb5.ini文件以及Kerberos Credential Cache File的路径
变量名:KRB5_CONFIG,变量值:C:ProgramDataMITKerberos5krb5.ini
变量名:KRB5CCNAME,变量值:C:tempkrb5cache
注意:KRB5CCNAME的路径默认是不存在的,因此需要在C盘下创建temp文件夹,krb5cache文件则不需要创建。
配置完环境变量后,重启计算机使其生效。
4.完成以上配置后,在Window客户端测试是否能够正常kinit
Kinit成功后
3
SQuirreL注册Hive驱动
1.在SQuirreL上添加一个Hive的驱动
注意这里的Example URL:
代码语言:javascript复制jdbc:hive2://cdh2.fayson.com:10000/;AuthMech=1;KrbRealm=FAYSON.COM;KrbHostFQDN=cdh2.fayson.com;KrbServiceName=hive;KrbAuthType=2
注意:这个URL的几个参数
AuthMech: 0无认证、1Kerberos认证、2用户名方式、3用户名和密码认证、6使用Hadoop授权认证
KrbRealm:你的KDC服务定义的域名
krbHostFQDN:你的HiveServer2服务的FQDN(hostname或你dns解析的域名)
KrbServiceName:HiveServer2服务的Principal默认为hive
KrbAuthType:0表示获取你的Subject来实现Kerberos认证、1表示基于JAAS方式获取Kerberos认证、2表示基于当前客户端的Tick Cache方式认证
4
SQuirreL访问Hive
1.使用Kerberos客户端登录访问Hive的Kerberos账号
2.在SQuirreL创建一个访问Kerberos的Hive连接
3.创建成功后进行连接即可
4.执行SQL查询
5
总结
1.注意在使用Cloudera提供的Hive驱动包访问Kerberos环境下的Hive时注意JDBC URL地址配置方式。
2.Cloudera提供的Hive JDBC驱动与Hive原生的驱动类有些区别,驱动类需要指定为“com.cloudera.hive.jdbc41.HS2Driver”。使用Cloudera提供的驱动包不需要考虑驱动包依赖的问题,默认的将Hive驱动所依赖的包都打包在里面。
3.特别强调在Window机器上配置Kerberos客户端时,需要配置KRB5_CONF和KRB5CCNAME两个环境变量,否则在使用访问时会报“Unable to obtain Principal Name for authentication”
提示:代码块部分可以左右滑动查看噢
为天地立心,为生民立命,为往圣继绝学,为万世开太平。 温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。
推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。