SAP Vora(SAP HANA和Hadoop)简析

2020-11-27 16:10:58 浏览数 (1)

正文部分

此处声明一点,很多乱七八糟的网站或者人转载文章的时候不注明出处,也不通知本人。该当何罪。

我们都知道SAP HANA的费用很高,原因就是内存数据库,内存计算,大部分要归功于硬件的支撑

而SAP还有个产品也是处理大数据的,就是BW,现在BW4也推出了

但是在这个互联网发达的时代里,数据增长想当迅速,因此问题出现了

SAP提供了将热量数据存储在由HANA直接管理的基于磁盘的商店(动态分层)中的选项

这比HANA在内存中便宜得多,从而提高了解决方案的价格到内存比例

随着客户对存储和处理数据需求的增长,SAP必须提供一种利用Big Data / Hadoop作为冷库的方法

个普遍的策略是使用SDA通过Hive或Spark访问Hadoop

大多数人不知道的是,这不是利用Hadoop的好方法(此处应有得意表情,O(∩_∩)O哈哈~)

通过简单地将查询发送到Hadoop,数据将返回给HANA进行处理

HANA是发送数据的,所以SDA不是大数据的正确方法

HANA需要能够将其查询注入Hadoop节点并利用Hadoop的处理能力

例如,要对非常大的数据集进行转换,无法将其加载到HANA内存中

所以,重要嘉宾出场了,就是主咖出场了,我们的SAP Vora来了

SAP Vora是位于Hadoop中Spark的顶层的层。

SAP Vora的作用只是让HANA利用Hadoop来处理密集的工作。

当然还有其他作用,例如支持符合HANA的层次结构和货币。

Vora的缺点在于其对Hadoop集群的规模要求是三倍,并增加了SAP许可成本。

这可能会暂时损害SAP的大数据。

但是,Vora仍然是新的,随着时间的流逝,我们将看到更多的改进,也许是SAP更可行的许可策略。

0 人点赞