如何优雅地使用 java 连接 HBase 客户端

2022-11-17 09:20:33 浏览数 (2)

点击上方蓝色“大数据实战演练”,选择“设为星标”或“置顶”

回复“资源”领取独家整理的学习资料!

每一个成功人士的背后,必定曾经做出过勇敢而又孤独的决定。

放弃不难,但坚持很酷~

HBase 版本:1.2.0-cdh5.7.0

一、客户端的长短连接

java 远程连接 HBase 客户端,大体分为两种方式。一种是长连接,一种是短连接。

短链接,顾名思义,就是客户端执行完某个操作之后,就关闭连接的这种方式,就是短链接。

而长连接就是有且连接一次,后续的所有操作都是基于这次连接做的操作,操作完成后,不关闭连接。长连接适用于频繁交互的场景,今天我们就来着重说一下它。

二、使用单例模式来初始化 HBase 客户端

以 HBase 为例,如果使用长连接,那就得需要确保 connection 唯一(不唯一的话,有可能造成资源浪费或者连接数过多报错),所有的操作都使用这一个 connection 。实现方法有很多,比如双重校验,加锁等方法。

但我们也可以使用静态内部类的形式实现上述场景。静态内部类也是实现单例模式的一种,保证只加载一次,懒加载并且线程安全。

代码语言:javascript复制
/**
 * HBase客户端操作(长连接)
 */
public class HBaseUtil {

    private static final Logger log = LoggerFactory.getLogger(HBaseUtil.class);

    private Connection connection;
    private static Configuration configuration;

    /**
     * 私有构造器
     * 初始化 HBase Connection
     */
    private HBaseUtil() {
        configuration = initHBaseEnv();
        try {
            connection = ConnectionFactory.createConnection(configuration);
        } catch (IOException e) {
            log.error("HBase Client connect abnormal: ", e);
            System.exit(-1);
        }
    }

    /**
     * 静态内部类
     */
    private static class InstanceHolder {
        // 不会在外部类初始化时就直接加载,只有当调用了getInstance方法时才会静态加载,线程安全。
        private static final HBaseUtil instance = new HBaseUtil();
    }

    /**
     * 单例模式,获取HBase实例
     */
    public static HBaseUtil getInstance() {
        return InstanceHolder.instance;
    }

    /**
     * 初始化 HBase 配置
     */
    public static Configuration initHBaseEnv() {

        try {
            configuration = HBaseConfiguration.create();
            configuration.set("hbase.zookeeper.quorum", "cdh-worker-1,cdh-worker-2,cdh-worker-3");
            configuration.set("hbase.zookeeper.property.clientPort", 2181);
            configuration.set("zookeeper.znode.parent", "/hbase");
        } catch (Exception e) {
            log.error("HBase Client Configuration Initialization exception: ", e);
        }
        return configuration;
    }

    /**
     * 获取namespace中所有的表名
     *
     * @param namespace
     */
    public List<String> listTables(String namespace) throws IOException {
        List<String> tableNameList = new ArrayList<>();
        // 获取namespace中所有的表名
        TableName[] tbs = connection.getAdmin().listTableNamesByNamespace(namespace);

        for (TableName tableName : tbs) {
            tableNameList.add(tableName.toString());
        }
        return tableNameList;
    }
}

上述代码,只有当触发 getInstance() 方法时,才会初始化 connection ,且 connection 只会被加载一次。

比如我们要执行 HBase 客户端操作的话,可以执行:HBaseUtil.getInstance().listTables("xxx") 。

三、总结

1、为什么这样实现就是单例的?

因为 HBaseUtil.java 的实例化是靠静态内部类的静态常量 instance 实例化的。instance 是常量,因此只能赋值一次;它还是静态的,因此随着内部类一起加载。

2、这样实现有什么好处?

我记得以前接触的懒汉式的代码好像有线程安全问题,需要加同步锁才能解决。采用静态内部类实现的代码也是懒加载的,只有触发静态内部类的静态常量 instance 的时候才加载;同时也不会有线程安全问题。

3、不只是 HBase 可以这样初始化客户端,Elasticsearch 等等的长连接也都可以,这样,你学会了吗?

0 人点赞