大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day10】——Hbase4

2021-12-07 11:07:08 浏览数 (1)

前言

本栏目大数据开发岗高频面试题主要出自大数据技术专栏的各个小专栏,由于个别笔记上传太早,排版杂乱,后面会进行原文美化、增加。

文章目录

    • 前言
    • 面试题 01、列族设计规则是什么?
    • 面试题02、Hive on Hbase的实现原理是什么?
    • 面试题 03、Phoenix是什么?
    • 面试题04、什么是二级索引?为什么要构建二级索引
    • 面试题05、Phoenix实现二级索引时,可以构建哪些索引类型?
    • 总结

停不要往下滑了,

默默想5min,

看看这5道面试题你都会吗?

代码语言:javascript复制
面试题 01、列族设计规则是什么?
面试题02、Hive on Hbase的实现原理是什么?
面试题 03、Phoenix是什么?
面试题04、什么是二级索引?为什么要构建二级索引
面试题05、Phoenix实现二级索引时,可以构建哪些索引类型?

以下答案仅供参考:

面试题 01、列族设计规则是什么?

•个数原则:如果列的个数比较多,建议2 ~ 3个,如果列的个数比较少,建议1个 –列族个数多了,导致比较次数变多,降低性能 –列族个数少了,导致列的比较次数变多,降低性能 •长度原则 :能满足业务需求的情况下,越短越好

面试题02、Hive on Hbase的实现原理是什么?

•Hive on Hbase的原理是通过MapReduce实现对Hbase数据的读写 •MapReduce中提供了TableInputFormat读取Hbase数据,TableOutputFormat写入数据到Hbase

面试题 03、Phoenix是什么?

•Phoenix是一个专门为Hbase设计的SQL on Hbase的工具 •底层通过Hbase API和大量的协处理器实现 •可以实现基于SQL访问Hbase以及构建维护二级索引等功能

面试题04、什么是二级索引?为什么要构建二级索引

•二级索引指的是基于一级索引之上再构建一层索引 •Hbase使用Rowkey作为唯一索引,只有使用Rowkey前缀进行查询,才走索引查询 •导致大部分的查询都是不走索引,性能比较差 •通过建立二级索引,可以通过走两次索引代替全表扫描,加快查询速度

面试题05、Phoenix实现二级索引时,可以构建哪些索引类型?

•全局索引 •覆盖索引 •本地索引 •函数索引

总结

今天我们复习了面试中常考的Hbase相关的五个问题,你做到心中有数了么?

0 人点赞