最新 最热

使用CDSW和运营数据库构建ML应用2:查询/加载数据

在本期中,我们将讨论如何执行“获取/扫描”操作以及如何使用PySpark SQL。之后,我们将讨论批量操作,然后再讨论一些故障排除错误。在这里阅读第一个博客。...

2021-02-07
1

使用HBCK2工具修复HBase集群

HBCK2工具是修复工具,可用于修复Apache HBase集群,包括CDP中的Apache HBase集群。HBCK2工具是Apache HBase hbck工具的下一版本。

2021-02-07
1

使用CDSW和运营数据库构建ML应用1:设置和基础

Python在数据工程师和数据科学家中被广泛使用,以解决从ETL / ELT管道到构建机器学习模型的各种问题。Apache HBase是用于许多工作流程的有效数据存储系统,但是专门通过Python访问此数据可能会很困难。对于想要利用存储...

2021-02-07
1

MapReduce编程初体验(idea):统计一个文档里的单词个数

注意: map的输出是一个 “key value的” list reduce输入是 key “value的list”

2021-02-05
1

HBase常用的shell命令

向user表中插入信息,row key为rk0001,列族info中添加name列标示符,值为zhangsan

2021-02-05
1

HBase安装部署

注意事项:HBase强依赖zookeeper和hadoop,安装HBase之前一定要保证zookeeper和hadoop启动成功,且服务正常运行

2021-02-05
1

HBase入门

http://mirror.bit.edu.cn/apache/hbase/2.2.6/

2021-02-04
1

Deploy TiDB on GCP GKE (Google Cloud)

how to deploy a TiDB cluster on GCP GKE with your laptop (Linux or macOS) for development or testing

2021-02-01
1

推荐10本大数据领域必读的经典好书(火速收藏)

写博客也已经快一年了,从去年的1024到现在金秋10月已纷至沓来。回顾这一年所发布的原创文章,基本都是与大数据主流或者周边的技术为主。本篇博客,就为大家介绍几篇关于大数据领域必看的经典书籍,喜欢的小伙伴记得来发一键...

2021-01-27
1

第一个“国产“Apache顶级项目——Kylin,了解一下!

说到Apache顶级开源项目,大家首先会想到什么??? 不熟悉Apache软件基金会的朋友也不用担心,大家可以去Apache官网,下拉到最下边的页面,查看Apache有哪些开源项目。...

2021-01-27
1