上周举行的腾讯云知识分享,雁栖学堂第一期数据湖入门篇已经圆满结束了。
数据爆炸时代已经来临,数据作为企业的核心资产,如何利用好数据对企业来说至关重要,数据湖存储应运而生。腾讯云存储团队技术大牛程力,围绕数据湖加速器GooseFS展开演讲,下面让我们一起回顾下程力老师的精彩演讲内容。今天的主题是数据湖存储方面的内容。整个内容分四个部分:
一、为什么选择对象存储COS作为数据湖存储的底座?
二、数据湖加速器GooseFS的具体应用;
三、数据湖加速器GooseFS对比Alluxio的优势?
四、如何在腾讯云上构建数据湖?
一、为什么选择对象存储COS作为数据湖存储的底座
可能大家应该都会好奇,为什么会选择对象存储cos作为数据湖存储的底座,接下来下面这张图将为大家来揭晓。
二、数据湖加速器GooseFS的具体应用
随着业务的增长,本地IDC自建、云上自建大数据集群,面对诸多痛点,数据湖加速器GooseFS从成本、性能、运维等多个维度去解决这些痛点。
接下来从多个维度、业务场景、数据端、计算端、EMR、TKE等来详细介绍数据湖加速器GooseFS的应用。
三、数据湖加速器GooseFS对比Alluxio的优势
了解了数据湖加速器GooseFS这么多的具体应用后,我们来看下他跟Alluxio在数据安全、性能、稳定性、运维、缓存策略及部署等方面的优势具体有哪些?
四、如何在腾讯云上构建数据湖
相信看完这些,大家会有一个疑问,将怎样在腾讯云上构建数据湖呢?这个您不用担心,腾讯云目前正在大力推广数据湖解决方案,帮助客户完成技术转型。具体策略如下:
面向大数据业务场景:
- 推荐系统
- 数字化运营
- 用户行为分析
- 风控系统
- 预测系统
方案价值:
- 云原生:serverless架构,免运维;
- 流批一体:通过Table Format(Delta Lake,Hudi,Iceberg)支持流批一体;
- 数据共享:打通大数据、AI、BI,消除数据孤岛
- 高性价比:弹性、按需扩容
- 一站式:多元化的数据分析引擎
COS数据湖GooseFS资源
下面整理了一些COS数据湖GooseFS常用的网址,请大家参考:
COSGooseFS产品页:https://cloud.tencent.com/document/product/436/56412
GooseFS快速入门:https://cloud.tencent.com/document/product/436/56413
GooseFS部署在腾讯云EMR:https://cloud.tencent.com/document/product/436/58513
GooseFS部署在腾讯云TKE:https://cloud.tencent.com/document/product/436/57225
GooseFS部署在自建集群:https://cloud.tencent.com/document/product/436/57224
GooseFS部署在Docker:https://cloud.tencent.com/document/product/436/58424
GooseFS监控指南:https://cloud.tencent.com/document/product/436/56422
COS 云 社区资源:https://cloud.tencent.com/developer/user/5909132
以上是程力老师分享内容的简要概括,更多精彩内容,可点击链接进行视频观看。
8月24日程力老师的分享已经结束,没来得及参与的小伙伴不用担心,关于更多腾讯云数据湖存储专题线上直播,关注“腾讯云存储”微信公众号即可了解最新直播资讯。
— END —