从NAS到分布式对象存储,看广发证券的IT进阶之路丨科技云·视角

2022-04-14 17:44:25 浏览数 (1)

客户证件、远程开户录像、合同扫描件、客服中心语音等典型的小文件,正在以惊人的速度海量增长,这些非结构化数据的存储和管理,成为金融机构头疼却不得不面对的一个难题。

车水马龙的证券营业厅,前来办理开户、查询、交易等业务的客户正在自助使用智能化服务平台。如今业界领先的银行及证券机构早已实现互联网转型,让客户可以通过自助办理、远程开户、客服中心等足不出户的方式,完成一次次在以前颇为繁琐的业务办理。

便捷业务的背后,实则是强大的IT技术作为支撑,从而保证金融业务的高效运转和新业务快速上线。随着在线业务量的暴增以及行业对服务水准要求变得越来越高,金融机构IT升级成为一个必然趋势。

作为全国证券行业综合排名Top3的广发证券,是中国首批综合类券商之一。面对互联网金融的新竞争环境和挑战,广发证券在传统IT架构的主流环境下,可谓是走出了一条独特的IT创新之路。

来自海量小文件的困扰

在证券日常业务中,客户证件、远程开户录像、合同扫描件、客服中心语音、企业相关资料等是最常见的非结构化数据,虽然这些文件平均大小只有几百KB,但近两年数据增长非常快。从存储容量上看,这些小文件甚至占据了金融机构数据总容量的80%以上。

今年7月1日,证监会正式实施“双录”规范。按照新规,如果投资者在营业厅办理的业务涉及“双录”的规定范围,金融机构就需要全程进行录音录像,资料需要保存20年且随时可调取。“双录”新规的出台,更是加剧了对各家券商信息系统的挑战,尤其对于大型券商来说,其分布于全国各地数百家的营业网点,都将面临大量资料采集、录入及存储、查询调取等工作。

事实上,金融机构对于非结构化数据的管理并不是毫无准备。2015年,在全国拥有264个营业部的广发证券就曾率先规划建立了档案中心,自动将各个业务系统的非结构化数据收集到档案中心,集中存储、备份,提供Web化的管理系统,方便调阅和访问,并可实现访问权限控制、自动水印等功能。

然而,到了2016年底,广发证券发现其档案中心开始变得“力不从心”。由于积累了过多数据,既有原有业务的数据存档,也有新业务以及“双录”规定下产生的海量数据,文件总数高达一个多亿,无论是营业厅视频的访问、播放,还是内部系统的录入,都显得异常卡顿。

广发证券面临的这一系列的挑战,也曾经是大型互联网公司遭遇的存储难题。由于传统的NAS存储采用古老的文件系统技术,会导致容量受限、访问性能下降、数据迁移困难等一系列问题。当广发证券向传统NAS厂商寻求解决方案时,他们发现互联网时代下的存储模式已发生了根本性的改变,其痛点已不是传统NAS能够解决的了。

在这种情况下,广发证券决心重新规划档案中心,面向市场寻求一种新型的存储解决方案,而这个方案至少要解决几大痛点:

首先,小文件数量海量增长,未来增长到数亿的趋势将不可避免,如何让存储具备面向未来的扩展性,是首当其冲的问题。

其次,在文件越来越多的情况下,如何提升档案中心的访问性能至关重要。营业网点与数据中心之间采用公网连接,由于营业网点不能直接访问数据中心的存储,文件访问都需要通过Web系统将存储中的文件读取后转化为HTTP数据流。而Web系统的并发能力有限,且经过一层转化,导致营业网点访问一些大文件,如视频文件非常慢,甚至不可用。

同时,广发证券在广州有两个主数据中心机房,现有的NAS存储只支持主备模式容灾,导致对端数据中心的主业务系统需要通过跨数据中心网络访问主存储,严重影响了访问性能。

更令广发证券头疼的是,证券交易时间一般集中在上午九点半到下午三点,可以说是证券机构业务量最为繁忙的时间段。但是在这么重要的时间段内,非结构化数据同步业务依然占据了大量的带宽。如何保证证券核心交易时间对跨数据中心带宽影响最小化,也是广发证券所关心的问题。

为小文件而生的分布式对象存储

2017年初,广发证券在会见了多家知名NAS存储厂商之后,依然没有找到理想的解决方案。正在踌躇之际,一家叫杉岩数据的创业公司闯入了视线。这家刚刚成立三年的存储新兴企业,拥有扎实的存储研发背景和业界领先的分布式对象存储的解决方案,它的出现令寻找了4个月解决方案的广发证券IT人员情不自禁地感叹道:“这产品简直像是为我们而生!”

相对于传统的集中式存储,分布式存储技术采用了云计算解决方案中的软件定义框架,具备去中心化的重要特点,横向扩展更为灵活。因此杉岩数据的分布式存储技术首先就满足了广发证券在扩展性方面的刚需。

针对广发证券几大痛点问题,杉岩数据提供的分布式对象存储解决方案也展示了其独特的优势,具体而言:

第一,用对象存储代替NAS,优化小文件性能。杉岩分布式对象存储采用哈希计算替代索引查找访问文件的先进技术,并且在数据存储方面,采用创新性的文件合并方式,保证了小文件优越的访问性能。

第二,营业网点通过HTTPS直接访问存储,提高访问效率。营业网点的前端页面与经过档案中心授权后获取对象的URL地址,利用URL直接与杉岩对象存储交互,利用杉岩对象存储分布式处理能力和高吞吐能力,保证营业网点的视频播放体验。

第三,跨数据中心AA模式,业务系统直接访问本中心存储。对于相同的目录多个数据中心支持同时读写访问,保证了不同数据中心访问数据的性能。跨数据中心之间采用异步复制模式,并利用杉岩分布式对象存储独有的QoS控制能力,保证证券核心交易时间对跨数据中心带宽影响最小化。

2017年4月,当广发证券与杉岩数据交流之后,很快就进入了测试环节。在测试过程中,广发证券最为关注的有两个方面:一是杉岩产品能否与现有业务系统很好地对接,其改造的工作量有多大;二是杉岩产品本身的可靠性和稳定性程度有多高。

不得不说,测试结果令广发证券颇为满意。在业务系统对接上,广发证券的开发团队仅仅花了一个小时就把档案中心其中一个业务系统与杉岩的产品打通了。在可靠性测试上,广发证券用一个月的时间模拟各种异常测试,杉岩都如期通过测试。同时,杉岩还提供了英特尔云创新中心出具的可靠性评估报告,近80页的报告详细阐述了杉岩各项指标的测试结果,无论在实际测试还是第三方权威评估中,杉岩的表现都可圈可点。

虽然对于杉岩的技术已有十足的信心,但出于金融机构的高度谨慎,广发证券在测试阶段之后,紧接着又进行了部分业务的试运行,而杉岩提出的三层数据安全性方案则实实在在让广发证券感到了放心:

第一层,杉岩存储集群内部提供数据副本和纠删机制,令业务数据的可靠性有保障;第二层,内置自动备份恢复机制,文件发生人为删除或误覆盖时,系统会自动对删除或覆盖的内容进行文件备份,并提供完善的恢复机制,完全取代外置的备份软件和外置备份设备;第三层,提供跨数据中心容灾功能,一旦某一套系统出现问题,另外一套数据中心也有完整数据。

2017年7月,广发证券正式确立与杉岩数据的合作,只在原来业务系统上进行了很微小的改造,就将广发证券超过数百TB的原有数据完全无缝地迁移到了杉岩分布式对象存储上。同时,为了配合证券交易时间,项目的实施都在非交易时间,即晚上六点到第二天早上六点进行。在这个过程中,项目实施完全不影响业务系统的正常运行。

金融IT创新的启示

最终,广发证券将整个业务系统的非结构化数据,全部集中存储在杉岩分布式对象存储上,整个系统规划达到PB级别。利用杉岩分布式对象存储的扩展性,未来10年以上的数据都可以归档存储到统一的存储平台上。

从技术上来看,原来在秒级的响应现在做到了百毫秒级,从原先营业厅在线播放视频卡住不动,到现在视频一点击就开始实时播放,文件访问和调阅都比以前更快,让广发证券的业务办理效率从外部到内部都有了质的飞跃。

对此,广发证券的IT相关负责人认为,杉岩对象存储是一个面向未来的解决方案,它真正解决了非结构化数据高速增长的难题。在5到10年内,广发证券的档案系统都将具备非常先进的存储基础架构,对于未来非结构化数据长期存储、价值利用和挖掘提供助力。

广发证券和杉岩数据的合作,看似简单且结果美满,深究其背后的原因,其实也有其不易之处。

一方面,广发证券是痛点倒逼金融创新,但大胆采用新技术,启用一家创业公司而非知名厂商,并非所有金融机构都有如此的勇气。广发证券在敢于创新的同时,严守高标准测试评估,确保方案万无一失,可谓是胆大心细,有勇有谋。

另一方面,有赖于杉岩数据独特的技术优势,提供了传统NAS以及其他分布式产品无法提供的独特价值,最终达成了双赢的局面。

除此之外,这与广发证券重视在信息技术与金融结合领域的创新也不无关系。广发证券在互联网金融、PB(主经纪商)业务、云计算及大数据应用等方面的投入持续加大,2016年,广发证券通过自行开发、合作开发、委托开发等方式对信息系统管理平台研发总投入达到1.56亿元。

就在广发证券与杉岩数据合作项目实施完毕之际,广发证券已经在规划下一步的IT创新之路了,为未来利用AI技术充分挖掘非结构化数据价值构建好数据平台。

在广发证券看来,开户视频录像、客服中心语音等非结构化数据里蕴含了大量的信息,如果能够在内部建成一个非结构化的数据仓库,结合AI技术进行分析,必将创造新的业务价值。这对于广发证券和杉岩数据来说,都将是一个全新的课题。

大数据和云计算发展到今天,业界对于按需定制的意识越来越强烈。虽然金融行业在对象存储方案的利用上还是非常谨慎,但是也不乏有创新和尝试者。依托“科技 服务”战略,打造智能化服务平台,构建线上线下相融相生的金融服务生态,必将成为业界的一种常态。

【科技云报道原创】

转载请注明“科技云报道”并附本文链接

0 人点赞