分区表就是将一个大表在物理上分割成若干小表,并且整个过程对用户是透明的,也就是用户的所有操作仍然是作用在大表上,不需要关心数据实际上落在哪张小表里面。Greenplum中分区表的原理和PostgreSQL一样,都是通过表继承和...
Greenplum(以下简称GP)有2种存储格式,Heap表和AO表(AORO表,AOCO表)。
基于规则的优化器,就是优化器在优化查询计划的时候,是根据预先设置好的规则进行的,这些规则无法灵活改变。举个例子,索引优先于扫描,这是一个规则,优化器在遇到所有可以利用索引的地方,都不会选择扫描。这在多数情况下是正确...
12月19日至20日,由腾讯主办的2020 Techo Park开发者大会将于北京召开。作为一个专注于前沿技术研讨的非商业大会,Techo Park开发者大会致力于为全球开发者搭建一个开放、中立、活跃的技术交流平台。通过最纯粹的技术分...
数据中台是全新的架构变革。过去三十年,企业数据管理都以传统的IT架构为基础。每当技术部门为业务部门解决问题时,需要从业务需求的探查、技术壁垒的打通等从上到下各个方面来建设新系统。每个系统的建成都自成一体,各自...
Snowflake已于2020年9月16日正式上市,市值超过700亿美元。该公司成立于2012年,致力于为企业提供数据云平台,帮助客户打破数据孤岛,方便企业运用和分享数据,并从中获得数据价值和商业洞见。Snowflake提供的产品技术服务在国...
http://tapd.oa.com/Greenplum/markdown_wikis/view/#1010134541008425443
Azkaban是LinkedIn开源的任务调度框架,类似于JavaEE中的JBPM和Activiti工作流框架。
随着大数据在越来越多的企业当中落地,企业要开展大数据相关的业务,那么首先要搭建起自身的数据平台。而企业搭建大数据平台,往往需要结合成本、业务、人员等各方面的因素,来规划数据平台建设方案。今天我们就来聊聊数据平...
Snova云数仓支持直接分析或者导入腾讯对象存储COS里的数据,本文列举了在使用COS场景下的一些技巧和注意事项。