随着开源的价值受到认可和推崇,越来越多的企业走上了“开源之路”。其中,阿里巴巴在十几年开源的沉淀中,从开源软件的使用者、贡献者,成长为开源软件的开拓者,已经成为国内开源走在前面的厂商之一。
据了解,阿里累计有 3000 多个开源项目、3 万多位全球贡献者,也收获了全球开发者 100 多万个 star,开源的数量和活跃度,一直都处于前列。根据《中国开源十年洞察报告》,阿里已经连续十年蝉联中国厂商开源活跃度、影响力双第一。InfoQ 近期发布的《中国开源发展研究分析 2022》研究报告显示,阿里 11 大开源项目上榜中国开源项目 Top30 榜单,占比超过三分之一;此外,在企业端对开源的赋能维度上,阿里巴巴在国内厂商中综合得分排名第一。
8 月 22-24 日,阿里巴巴首届开源开放周以线上的形式亮相,邀请了业界顶尖技术专家学者,与阿里开源领军人和头部项目代表共同探讨开源领域的最佳实践和新机遇。本次开源开放周,在主论坛之外,还特设了 5 大分论坛,聚焦操作系统、数据库、云原生、大数据、终端 5 个领域,帮助开源人探索技术开放生态的更多可能。
1 开源生态与未来
开源发展至今,已经成为基础软件的重要创新源头,云时代下,也给开源带来了新的软件开发模式和商业模式。本次开源开放周,主论坛聚焦「开源生态与未来」,探讨开源生态的新技术和趋势,展望云与开源的更多可能。
开源从早期理想主义的自由软件,发展到当前开源生态的多元化、商业模式的多元化,其已成为基础软件的源头。阿里巴巴开源委员会分管委员蒋江伟在主题为《阿里开源的动与势》的演讲中分享到,阿里巴巴开源的历史,可以划分为使用、贡献、开拓三个阶段。阿里在创业早起就大量使用开源软件,阿里技术的发展也根植于开源的沃土中。因此,当阿里在大规模互联网系统和云的研发中,积累了越来越多的技术经验,解决了越来越多的新问题之后,也积极地将自身的实践以开源软件的形态回馈到社区中。
随着历史的发展以及阿里在开源侧实践的深入,阿里巴巴对开源的认知也一直在演进。阿里认为,开源 云计算共同构成了数字世界的根,站在用户的视角,云平台与开源社区的有效合作,赋予了用户灵活的选择权。而阿里巴巴开源的独特的生命力在于“三位一体”,三位一体是指阿里自用的技术、社区开源的技术和阿里云对客户提供的技术是一个版本 ——“三位一体”的方式使得自研、开源与云计算商业形成血脉相通的整体。阿里通过集团业务自行验证,再对外开源的策略,构建起一个良性的开源生态。也是随着阿里巴巴对开源认知的升级,蒋江伟宣布,近期阿里对开源委员会和开源办公室经历了一轮升级,开源委员会作为负责制定阿里开源战略的组织,新设置了 9 位领域副主席,把基础软件领域的开源共建作为阿里开源的重心,明确了四大重点开源方向:操作系统、数据库、大数据与云原生。
随后,MongoDB 副总裁 Matt Asay 带来了《MongoDB 助力开发者实现高效开发》的分享,分享中 Matt Asay 表示:“在云时代,开源技术的好处就是,只要建立在像 MongoDB 这样的通用开源技术上,使用者就可以从一个云移动到另一个云,从一个数据中心移动到另一个数据中心……在不同的环境中使用 MongoDB,给使用者提供了选择的自由。”
bilibili 技术委员会主席毛剑,也带来了《B 站在云原生与开源方向的探索与实践》的主题分享,他提到:“为什么我们会如此关注云原生或者开源的社区和生态?最核心的一个点就是,我们在享受云原生社区的技术输出时,可以选择不同的组件,使业务开发更高效;同时,当我们使用开源组件遇到问题或者 bug 时,我们可以做技术的输入,因为这些问题大家可能都会遇到,所以我修掉一些 bug、提供一些 feature,让更多人受益,这其实就是云原生或者说开源社区一个大的作用——让更多的人参与到项目之中”。
那么在未来,云与开源的结合为开源生态提供了哪些新的可能性?在《数字世界已来,开源生态与未来》的圆桌讨论环节,阿里巴巴邀请到中国信息通信研究院云计算与大数据研究所副所长栗蔚,上海交通大学长聘教授、人工智能研究院总工程师、上海白玉兰开源开放研究院执行院长金耀辉,Apache 软件基金会首位华人董事、Tetrate 创始工程师吴晟,与阿里巴巴开源委员会秘书长、开源办公室负责人王晶昱共同展望了云与开源的更多可能。
王晶昱在讨论中分享说:“未来,云计算能够帮助开源软件实现更好的服务延伸,从而创造更好的服务;在此过程中,又可以反哺云计算公司,让其有更好的 Runtime Hosting;同时还能够帮助它的客户快速处理他们遇到问题,以上三方都将基于云和开源的结合受益。”
栗蔚表示,开源与云计算的结合,在未来会成为软件开发流水线或工程化的基础设施,继而实现互相促进融合的过程。吴晟也做了进一步的补充,他表示,云服务商作为最终向用户售卖服务的人,有责任去支撑用户最终的需求、问题,云厂商收集到的用户资料越多,基础数据源就越大,从而通过数据分析论证提出的解决方案是否合理,优化方向是否正确。
当谈及云与开源的联系时,金耀辉认为,中国有一大批开源的参与者,都是从云计算开始的。当社区由技术型主导变成服务型主导时,开发者更关心服务怎样交付以及 DevOps 等新兴事物,其整个过程都需要开源。因此,无论是开源社区的引入,还是目前开源的服务生态,二者都应是相辅相成、相互促进的关系。
2 云时代开源操作系统的技术实践
目前,阿里巴巴构建了完整的云原生底层系统——袋鼠,其在计算、存储网络等操作系统的核心组件方面都有非常深入地研究。分论坛出品人、阿里巴巴开源技术委员会副主席、龙蜥社区理事长马涛在致辞中表示,云原生时代,操作系统在机密计算、存储、网络以及大规模机器运维方面均面临挑战,阿里巴巴在云场景下积累了丰富的经验,这些经验也将通过龙蜥社区让用户使用起来:
- 在机密计算方面,龙蜥操作系统开源社区和 Intel、海光一起构建了完整的精密计算体系,帮助客户、用户更好地使用计算资源;
- 在存储方面,龙蜥操作系统开源社区构建了包括 Nydus、EROFS、FScache 等一整套的操作系统存储方案,通过整套方案帮助用户更好地使用云上各种各样的存储资源,同时,通过操作系统内核,无缝地支撑完整的镜像加速,这也是在业界一个非常巨大的创新;
- 在网络方面,通过将阿里云 eRDMA(弹性 RDMA)与龙蜥社区 SMC-R,两项技术的结合,可以让用户非常方便地使用 RDMA 技术,为应用提供加速;
- 在大规模机器运维方面,龙蜥社区成立了跟踪诊断 SIG 以及系统运维 SIG,汇集了阿里巴巴、统信、Intel 等各家公司的优秀工程师在运维方面的经验,希望这些经验通过龙蜥社区让用户使用起来,让大家面对大规模机器运维时不再有难言之隐。
在「云时代开源操作系统的技术实践」分论坛中,阿里和龙蜥社区携业内技术专家共同带来了技术实践思考。阿里云资深技术专家、Cloud Hypervisor 技术委员会刘奖,Intel 安全产品专家、龙蜥社区机密计算 SIG Maintainer 张顺达,字节跳动 Linux 内核研发高级工程师尹欣等,带来了云时代开源操作系统及其背后的技术实践,面向开发者全面分享了云原生、内核、网络、机密计算、运维等方面的技术落地与演进,共同探讨了在龙蜥社区和龙蜥操作系统上的实践与规划。
3 数据库开源生态与应用实践
数据库与操作系统、中间件并称为系统软件的“三架马车”,是企业 IT 系统不可或缺的组件,也是互联网应用级企业信息管理系统存储数据和管理数据的核心平台。加速“数据库开源”,搭建生态将是关键壁垒。
阿里巴巴集团副总裁、阿里云数据库事业部负责人李飞飞在致辞中谈到,计算机与信息技术领域一些核心的突破,越来越多由开源社区驱动,具体到数据库系统来说,也是如此。但是,放眼全世界,还没有一个非常活跃、成熟的云原生数据库开源社区。因此,2021 年 5 月,阿里将云原生数据库产品 PolarDB 进行开源,一共开源了两个版本,分别是 PolarDB-X 和 PolarDB for PG,开放对接底层云原生框架、基于 K8s 容器部署、对接共享存储等能力,同时期待有更多人加入社区,共同推动云原生分布式数据库的高速发展。
在「数据库开源生态与应用实践」分论坛中,阿里云数据库开源负责人王远从开源数据库 PolarDB 的角度出发,论述如何打造具有世界影响力的云原生数据库开源社区。王远谈到,阿里云数据库的开源策略主要有四点:一是要与现有生态比如 PostgreSQL、MySQL、Redis 兼容;二是百分之百开放,即开源的数据库要与阿里云的数据库完全一致;三是打造具有国际影响力的团队,引领社区决策;四是以身作则,反哺社区,打造开源共建文化。
接下来,阿里云数据库资深技术专家楼江航、张广舟分别带来了 PolarDB-X、PolarDB for PG 开源技术的规划和展望;此外,韵达科技业务中台总监李波涛及莲子数据硬件系统首席架构师许长魁,也带来了他们在业务环境中应用阿里云开源数据库 PolarDB 的探索和实践经验。
4云原生开源技术演进与生态发展
十余年来,阿里云一直坚定地拥抱开源,通过与开源社区共建标准,推动国产自研技术快速发展。开源也在深刻的改变着云计算,让云计算越来越标准化,使用门槛越来越低、触手可得。阿里云在云原生领域拥有 30 开源项目,覆盖容器编排调度、分布式应用架构、分布式应用治理等方向。据阿里巴巴研究员、阿里云智能云原生应用平台负责人丁宇介绍,阿里云在云原生领域拥有 10 个 CNCF 项目,2 个 Apache 顶级项目,外部 Contributor 超过 2000 人,Star 数量超过 25 万,服务了百万开发者。
其中 Apache RocketMQ 是国内首个互联网中间件 Apache 顶级项目,成为国内消息领域的事实标准,超过 75% 的头部互联网公司在生产实践中使用 RocketMQ;Apache Dubbo 是微服务框架中影响力最大、采用率最高的国产框架,在全球化和影响力两大维度,入选 Apache 开源项目第一方阵。
面向云原生时代,为了更好地实现应用交付管理,阿里云开源了 KubeVela:以应用为中心,重新定义研发、运维和基础设施之间的协作方式,开发者可以通过 KubeVela 建设通用的应用交付运维平台。在 Serverless 领域,阿里云开源了 Serverless 开发者平台—— Serverless Devs,这也是业内首个支持主流 Serverless 框架的云原生平台。开发者可以一键体验多云 Serverless 产品,极速部署 Serverless 应用,大幅研发提效。
今年,阿里云在云原生领域持续突破,又发布了两大开源项目:一个是云原生混部系统 Koordinator,它基于阿里巴巴内部超大规模混部实践而来,为用户打造云原生场景下接入成本最低、混部效率最佳的标准化解决方案。第二个是阿里云联合 bilibili、字节跳动、Nacos 社区、Dubbo 社区共同发起的微服务治理规范项目 OpenSergo,致力于异构微服务治理,让更多微服务互联互通。
在「云原生开源技术演进与生态发展」分论坛中,来自阿里、Apache Dubbo,以及 OpenSergo & Sentinel 社区的嘉宾,聚焦云原生领域热门开源项目,全面展示了云原生开源项目的技术实践与生态建设,帮助开发者全面拥抱云原生。
5大数据 AI 一体化趋势下的开源生态
开源软件是整个数字世界的基石,尤其在基础软件领域,互联网的快速发展和崛起离不开开源技术的普及,同时也加速了企业走向互联网化和数字化。作为「大数据 AI 一体化趋势下的开源生态」分论坛的出品人,阿里巴巴研究员、阿里巴巴开源大数据平台负责人、Apache Flink 中文社区发起人王峰表示,近 10 年来,阿里巴巴在内部和业界,持续推动开源理念的践行。
同时,作为大数据方向的从业者,王峰观察到,在大数据领域的开源生态中,目前比较火的方向有实时离线一体化、流批一体化、数据湖存算分离引起的湖仓一体化,以及大数据 AI 一体化等,在开源社区中,这些方向也有越来越多的贡献者参与其中。
在本场分论坛中,阿里巴巴邀请了阿里云、快手、网易云音乐的技术专家,分享他们在生产环境中,在流批一体、深度学习,以及数据平台提效降本方面的探索和实践。
6阿里巴巴终端体系持续走向开源
随着技术的演进、前端和客户端越来越强的相互渗透、Web 的开放性和高效迭代,客户端技术的即时体验和原生能力要求在持续升级。在这样的技术背景下,今年伊始,阿里巴巴推动了前端和客户端体系的融合,使终端工程领域正式走到了台前。
本次「阿里巴巴终端体系持续走向开源」分论坛,是阿里巴巴终端委员会对外的首场开源分享。大淘宝技术跨端技术部负责人、阿里巴巴终端委员会委员舒文亮在出品人致辞中谈到,从宏观的行业视角来看,随着互联网设施的完善,终端设备的规模和类型在爆炸式地增长,各种信息载体持续涌现,比如沉浸式的 VR 设备、实时呼应的车机语音硬件、智能家居的 IoT 设备等在不断的扩展终端的定义,用户的体验被空前的满足支撑,而这些体验的技术眼花缭乱,背后的行业标准和厂商生态也在互相的追赶;在中观的层面,站在阿里的角度,今年年初阿里内部推动了前端、客户端体系的融合,让终端技术走向台前,同时,作为推崇开源精神的阿里巴巴前端和客户端技术,将持续保持在开源项目上的投入。
此外,阿里巴巴高级技术专家、XQUIC 开源项目负责人刘彦梅,阿里巴巴前端技术专家、OpenSumi 开源负责人吴丹武,阿里巴巴终端工程师、大淘宝终端框架负责人刘晨凌,阿里巴巴高级前端技术专家、阿里低代码引擎负责人廉洁,也在分论坛中围绕面向终端用户的基础网络(XQUIC)、面向开发者的 IDE 定制化研发框架(OpenSumi)、终端应用研发框架(ICE)、面向扩展设计的企业级低代码开放技术体系(LowCodeEngine)等实践经验进行了分享。
7 写在最后
通过 2022 首届阿里巴巴开源开放周 Alibaba Open Source Week,阿里巴巴向业界分享了很多自身在开源中积累的实践经验,以及社区治理经验;同时,也通过自身链接了业内的技术专家及开源社区的负责人等,为开发者、开源爱好者们带来了极具价值和意义的内容。我们期待阿里巴巴为业界提供更多好的开源项目、最佳实践等内容,也期待第二届阿里巴巴开源开放周的到来!
如果您想了解阿里巴巴开源开放周更多精彩内容,欢迎来阿里巴巴开源官网:https://opensource.alibaba.com/collection/osweek2022 查看完整回放、获取分享资料。