根据调研机构Gartner公司的预计,2020年全球云存储收入将以每年超过28%的速度增长,将达到650亿美元。其驱动力是为了实现规模经济,使基于云计算的解决方案能够提供比内部部署系统更具成本效益的主存储和备份存储。
根据调研机构Gartner公司的预计,2020年全球云存储收入将以每年超过28%的速度增长,将达到650亿美元。其驱动力是为了实现规模经济,使基于云计算的解决方案能够提供比内部部署系统更具成本效益的主存储和备份存储。
然而,大多数IT部门很快发现,将数千甚至数百万个文件从本地存储系统迁移和同步到云平台中企业文件同步和共享(EFSS)服务的过程中存在重大挑战。Gartner公司表示,“到2019年,75%的企业将部署多个企业文件同步和共享(EFSS)功能,超过50%的企业将面临数据迁移问题,高于目前的10%。”
在一份最新发布的题为“如何将文件共享、SaaS和ECM迁移到EFSS”的报告中,Gartner公司确定了组织可以管理迁移或与企业文件同步和共享(EFSS)服务同步的四种方法:自定义集成、基本副本、EFSS导入服务,以及在此详细探讨的专业第三方工具。
1.自定义集成
自定义解决方案可以由IT内部处理,也可以外包给在内容管理方面具有专业知识的厂商。无论如何处理,其问题仍然存在:是否需要集成?答案取决于存储系统的相似性或不同性,在大多数情况下,人们发现系统差异比最初预期的更广泛和更深入。
每个文件都有一组与之相关联的独特属性,大多数文件系统至少对其中一些文件属性的处理方式不同。属性包括基本信息,如文件名、格式和元数据,以及更高级的信息,如版本控制、所有权保留和权限。
在混合存储环境中,可能需要规范化文件名。可能需要人工跟踪版本。每个文件系统可能需要不同的安全模型,这可能会给用户带来一些问题,并给帮助台带来巨大的负担。在任何复杂的自定义集成中,肯定会有错误。混合存储环境中的最大问题通常是在组织出现问题之前无法检测到文件传输损坏或版本问题。
即使看似简单的场景也会变得非常复杂。可以借鉴Shawmut Design and Construction公司的经验,该公司是一家在美国各地设有办公室的建筑管理商。该公司使用来自Autodesk公司的BIM 360软件进行施工管理,并使用Citrix公司的ShareFile平台与该领域的团队进行合作。
变更单在建筑项目中很常见,使用过时的信息可能会导致代价高昂的错误。因此负责该项目的负责人非常谨慎地确保所有文件每天都准确同步。使用BIM 360和ShareFile中内置的文件管理功能,这项工作需要三名项目工作人员进行处理。每天,工作人员都会比较两个系统中许多文件的版本,根据需要将最新版本复制到另一个系统,以保持所有内容同步。如果只需要三名工作人员来处理两个文件系统之间的同步,那么在具有10多个或更多文件系统的组织中复杂性将会呈指数增长就不足为奇了。
Shawmut公司没有尝试让IT资源自动执行文件同步任务,但其他公司通常也没有令人满意的结果。使双向或多向文件同步工作良好并非易事。事实上,成功导航多个不兼容的存储系统的不同文件可能会成为一个充满潜在危险的工作。在比较涉及上次访问/修改日期,用户/组访问权限或锁定的文件属性之一时出错可能导致文件被原有版本损坏或覆盖。如果自定义集成应用程序缺乏强大的错误检测和报告,那么在用户抱怨之前,错误将一直未被发现。
对于一次性迁移或单向备份,自定义集成工作(包括人工和自动过程的组合)可以很好地工作。如果所涉及的存储系统之间的差异相对较小且易于管理,则情况尤其如此。
但在大多数情况下,提到的问题的答案是肯定的,需要成功安全地同步混合存储环境中的文件。幸运的是,自定义集成有三种选择。
2.基本副本
使用熟悉的,经过验证的、低技术“暴力”批量复制命令(例如Windows/DOS中的xcopy和Linux中的rsync)肯定很简单,因此看起来似乎万无一失。Windows中的文件资源管理器和大多数企业文件同步和共享(EFSS)服务提供的文件管理应用程序等应用程序也提供批量文件和文件夹复制功能。
但是,为了使暴力批量复制能够很好地工作,所涉及的存储系统或者必须兼容,或者必须在其“最低标准”下实现互操作。例如,为了适应最严格的存储系统,可能需要放弃更宽松的文件命名约定和更大的文件大小和功能。但这样做可以最大限度地减少所涉及的复杂性。但是,除非所有系统都能实现完全互操作,否则仍然存在一定的挑战,特别是涉及文件锁定和通过用户和组等属性访问读/写/删除权限的安全场景。
与自定义集成一样,基本副本可以很好地用于一次性迁移或作为单向备份解决方案。但由于基本批量复制命令和实用程序缺乏强大的文件比较功能,因此这种方法作为混合存储环境中的文件同步解决方案存在风险。
3.EFSS导入服务
几乎所有企业文件同步和共享(EFSS)平台都提供各种形式的导入服务。每个都有自己的文件管理应用程序,具有在线文件导入功能,一些提供商建议在导入超过100GB的数据时使用物理磁盘驱动器。
虽然这些在线应用程序和服务将责任转移到企业文件同步和共享(EFSS)提供程序,但它们可能会遇到相同的潜在复杂性和/或限制,例如丢失的权限模型和结构、用户定义的元数据、文件所有权,以及自定义集成和基础中遇到的版本复制机制。因此,如果导入服务未能充分适应不同存储系统之间的基础文件属性差异,则结果注定不太令人满意。正是出于这个原因,企业文件同步和共享(EFSS)提供商和越来越多的企业IT部门一样,开始使用专门构建的第三方文件迁移和同步工具。
4.专业的第三方工具
混合存储架构的日益普及和固有的复杂性已经产生了对专门用于管理存储系统迁移和同步的专用软件的需求。虽然设计各不相同,但这些文件后勤系统中更先进的系统会为每个支持的存储系统使用自定义“连接器”。这些连接器提供了一组通用功能,使每个存储系统都能与所有其他存储系统进行互操作,而不会牺牲任何存储系统的高级功能。结果是混合内容管理系统能够充当许多不同存储系统之间的智能中介。
为了在混合存储环境中提供所需的灵活性,连接器通常支持各种内部存储系统(如NFS/SAN/NAS、SharePoint和各种企业内容管理解决方案)和企业文件同步和共享(EFSS)平台(如Box、Dropbox for Business、Google Drive Office 365、OneDrive ShareFile和Syncplicity)。支持的深度和广度使这些工具适合于支持大多数企业应用程序,以及随着用户越来越多地将自己的数据迁移到云中而创建的“影子IT”自带存储(BYOS)环境。
由于对其人工同步越来越失望,促使Shawmut公司尝试采用第三方混合内容管理工具,并立即得到改进。通过连接Shawmut的内部存储系统和Citrix共享文件,该工具每天晚上仅根据几个“点击”指令自动同步文件,从而消除了人工比较的麻烦。现在,项目主管在每个工作日结束时只花几分钟来设置同步。在确认工具按预期工作后,先前负责同步文件的三个项目经理被重新分配到更高效的任务。
虽然安全不是Shawmut公司的主要关注点,但大多数组织都担心安全问题。为了满足这一重要要求,连接器通常包括对每个文件系统的安全性规定的支持,并且工具本身通常安装在企业防火墙和其他外围防御之后。
在任何特定情况下,确定这四种替代方案中哪一种可能是最佳且最具成本效益的过程始于对企业范围内在本地和云中使用的所有存储系统进行盘点。Gartner公司建议使用能够扫描每个文件系统的文件分析工具来索引其内容和文件属性。现在,随着更强大的工具可用于自动迁移和同步内部部署和基于云计算的存储服务,IT部门不再需要分配该任务。