平台象限
采纳
24. Colima
Colima 现在是我们在 macOS 上替代 Docker Desktop 的首选方案。我们持续在几个项目中使用它来提供 Docker 容器运行时的 Lima VM,在 macOS 上配置 Docker CLI,并处理端口转发和挂载卷。Colima 可以配置为使用 containerd 作为其运行时,这也是大多数托管的 Kubernetes 服务上的运行时,可以提高重要的开发到生产环境的一致性。
试验
25. CloudEvents
事件是事件驱动架构或无服务器应用中常见的机制。然而,生产者或云提供商通常以不同形式支持它们,这阻碍了跨平台和基础架构的互操作性。CloudEvents 是一个描述事件数据的通用格式的规范,旨在提供服务、平台和系统之间的互操作性。它提供了多种编程语言的 SDK,因此您可以将规范嵌入到应用程序或工具链中。我们的团队不仅将其用于跨云平台的目的,还用于领域事件规范等其他场景。CloudEvents 由云原生计算基金会(CNCF)托管,现在作为孵化项目运行,已经获得了越来越多的行业关注。
26. DataOps.live
DataOps.live 是一个自动化 Snowflake 环境的数据平台。受 DevOps 实践启发,DataOps.live 可以像在其他网络平台一样在数据平台中实施持续集成和持续交付 (CI/CD),自动化测试, 可观测性和代码管理。我们的团队正在用它来管理数据产品的全生命周期,包括代码和数据的开发、分支、部署。通过它的自动化环境管理,能够轻易建立、修改、自动销毁基于特征分支的环境。它的声明式标准 (SOLE) 能力也值得关注,因其可以优化开发者体验。它能使团队构建数据产品的时间从几个月变为几天。我们的团队成功将 DataOps.live 用于生产环境, 这也是我们推荐在使用 Snowflake 时使用这一平台的原因。
27. Google Cloud Vertex AI
自从我们第一次提出 Google Cloud Vertex AI 以来,AI 领域已经发生了重大进展。自 2023 年 5 月以来,Google 推出了多项服务和功能来丰富这一领域。这些新增功能包括 Model Garden,一个拥有100多个预训练模型的仓库;Generative AI Studio,一个旨在快速探索和原型生成 AI 模型的控制台;以及 Vertex AI Extensions ,提供完全托管的开发人员工具,通过 API 连接 AI 模型和实时数据或操作。该平台已经发展到提供 GenAI 模型和集成支持,我们非常期待能更广泛地使用它。
28. Immuta
自从我们上次介绍了 Immuta 以来,我们的团队在使用这个数据安全平台方面已经积累了丰富的经验。它的亮点包括能够将订阅和数据策略定义为代码、版本控制以及自动部署这些策略到更高的环境中。它基于属性的访问控制(ABAC) 允许我们将标签关联到数据源;如果用户与相同的标签关联,就会获得访问权限。通过利用 Immuta 和 Snowflake 的集成,我们已经能够以自助方式自动授权对数据产品或数据集的访问。当“用户”请求访问数据产品或数据集时,一旦获得批准,数据产品标签将被关联到“用户”作为属性。由于“用户”的属性与数据源上的标签匹配,因此根据 Immuta 的全局订阅策略,访问权限将自动授予。值得一提的是 Immuta 的数据掩码策略,它通过对个人身份信息(PII)进行掩码和限制来保护数据隐私。可以使用行级安全策略来定义对更细粒度的敏感信息的访问,以确保用户只能访问他们被授权查看的特定数据。我们对 Immuta 非常满意,这也是为什么我们将其列入“试验”的原因:它提供了良好的开发者体验,使大型组织更容易管理数据策略。
29. Lokalise
Lokalise 是一个全自动的本地化平台,它支持特定上下文的翻译。我们的团队在ETL流程或开发工作流中使用Lokalise API来翻译可本地化的内容。Lokalise支持多种文件格式的可本地化字符串。一个值得强调的方面是它支持上传整个文件,其中每个键-值对都被视为单独的记录并被翻译。在底层,我们利用了Lokalise与Google MT的集成来处理翻译。Lokalise 的Web界面提供了便捷的访问方式,供人工审阅员验证翻译结果,或者根据需要简化、重新表达翻译内容。在过去,我们曾介绍过类似的工具,例如Phrase。我们的团队在使用Lokalise方面有很好的体验,建议您评估该平台是否适用于协作翻译工作流程。
30. Orca
Orca 是一个专有的云安全平台,用于识别、优先级排序和修复安全风险和合规问题。它支持主流的云提供商和混合设置。Orca 拥有广泛的安全查询和规则,以持续监控已部署的工作负载,检测配置错误、漏洞和合规性问题。它支持云虚拟机、无服务器函数、容器以及已部署工作负载的 Kubernetes 上部署的应用。这些内置的安全规则会定期更新,以跟上不断演进的合规标准和威胁向量。由于 Orca 无需代理,因此提供了良好的开发者体验,并且易于设置。另一个显著的特点是它促进了安全的左移。我们的团队使用 Orca CLI 来扫描容器镜像和 IaC 模板,以检测漏洞和配置错误,作为预提交钩子或 CI/CD 工作流的一部分。它还持续监控和扫描容器仓库(如 AWS ECR),以查找已发布镜像中易受攻击的基础镜像或脆弱的操作系统依赖项。根据我们团队的经验,Orca 提供了从开发到生产的安全状态的统一视图,因此我们将其放入试验阶段。
31. Trino
Trino 以前被称之为 PrestoSQL,是一个专为面向大数据交互式分析查询而设计的开源分布式 SQL 查询引擎。经过优化后,它可以在本地或者云上环境运行,并支持对 Hive、Cassandra、关系型数据库、甚至专有数据存储等多种不同的数据源进行查询。它支持基于密码的认证、LDAP 和 OAuth 的身份验证机制,同时具备在 catalog、schema 和 table 级别授予权限和访问控制的能力。我们的团队根据可视化、报告或机器学习用例等消费模式,使用资源组进行管理和限制资源分配。基于 JMX 的监控提供了丰富的指标集,帮助实现在查询或用户级别进行成本分配。我们的团队将 Trino 用作跨各种数据源的数据访问网关,当涉及到查询极大规模的数据时,Trino 对我们的团队来说是一个可靠的选择。Trino起源于2015年11月首次在Radar上亮相的Presto项目,具体可参考Facebook project 。
32. Wiz
Wiz 是日渐成熟的云安全平台领域里又一竞争者,它能让用户在一个平台上预防、检测和应对安全风险和威胁。Wiz 能对尚未部署到生产环境的构建产物(容器镜像、基础设施代码)以及生产工作负载(容器、虚拟机和云服务)的错误配置、漏洞和泄漏的机密数据进行检测并发出警报。它还能将发现的问题置于特定客户的云环境的上下文中,使响应团队能够更好地了解问题并确定修复优先级。我们的团队在使用 Wiz 时获得了良好的体验。他们发现 Wiz 正在快速发展并不断增加新的功能。值得称赞的是,由于 Wiz 能持续扫描变化,团队因此能够比使用一些其他类似工具更快地发现风险和威胁。
评估
33. ActivityPub
随着微型博客平台领域的剧变,ActivityPub 协议逐渐名声鹊起。ActivityPub 是一个用于分享诸如帖子、出版物和日期等信息的开放协议。它可以用来实现一个社交媒体平台,但其关键优势在于能够实现不同社交媒体平台之间的协同工作能力。我们预计 ActivityPub 将在社交媒体领域扮演重要角色,但更加对其在其他领域可能发挥的作用感到好奇。一个例子就是最近 GitLab 提出对合并请求增加 ActivityPub 支持。
34. Azure Container Apps
Azure 容器应用是一种 Kubernetes 命名空间托管服务。该服务通过消除 Kubernetes 集群和底层基础架构组件的复杂维护需求来简化容器化工作负载的部署,从而减轻了运维和管理负担。然而,在考虑使用该工具时需要小心谨慎:当前处于开发阶段,它在 Azure 门户中展示的功能有些不一致;在与标准 Terraform Azure 插件集成时遇到了困难,该插件在匹配 Azure 容器应用的功能方面进展缓慢。综上所述,我们建议仔细评估这个工具。
35. Azure OpenAI Service
伴随对生成式 AI 的巨大关注,许多访问主流模型的解决方案应运而生。如果正在考虑或正在使用 Azure ,那么我们推荐评估 Azure OpenAI 服务 。它通过 REST API 、Python SDK 以及基于 Web 的界面提供对 OpenAI 的 GPT-4、GPT-35-Turbo 和嵌入模型的访问。这些模型可以适应如内容生成、汇总、语义搜索和自然语言到代码的转换的任务,也可以通过少量学习和超参数的定制进行微调。与 OpenAI 自己的 API 相比,Azure OpenAI 服务受益于 Azure 企业级的安全性和合规性,同时也在更多的区域可用,哪怕每个较大的地理区域的可用性是有限的。
36. ChatGLM
在英语世界中,有许多新兴的大语言模型(LLM)。虽然这些模型通常经过多种语言的预训练,但它们在其他语言中的表现可能不如英语。清华大学开发的 ChatGLM 是一个开放的双语语言模型,基于通用语言模型架构,针对中文会话进行了优化。由于中文在词语划分和语法方面较英语更为复杂,因此拥有一个针对中文进行优化的 LLM 非常重要。我们的团队在为呼叫中心开发中文情感检测应用时发现,ChatGLM 在准确性和鲁棒性方面都优于其他 LLM。考虑到许多 LLM 因授权或地区限制而无法在中国使用,ChatGLM 成为了为数不多的开源选择之一。
37. Chroma
Chroma 是一个开源的向量存储和嵌入数据库,可用于增强由大语言模型(LLMs)驱动的应用程序。通过促进 LLMs 中的领域知识的存储和利用,Chroma 弥补了 LLMs 通常缺乏内部存储器的不足。特别是在文本到文本应用中,Chroma 可以自动生成单词嵌入并分析它们与查询嵌入之间的相似性,从而大大简化操作。它还提供了存储自定义嵌入的选项,促进了自动化和定制化的融合。鉴于 Chroma 能够增强由 LLM 驱动的应用程序的功能,我们建议团队对 Chroma 进行评估,挖掘其潜力,改进将领域知识集成到此类应用程序中的方式。
38. Kraftful
用户体验(UX)研究平台,比如 Dovetail,为组织提供了一个工具,帮助他们了解和改善客户体验。通过这个工具,企业能够迅速、轻松地通过收集和分析来自客户反馈、调查、访谈等渠道的数据,深入洞察客户的需求、偏好和行为。情感分析、客户分割、市场研究、数据分析和洞见生成是产品开发中有价值的任务,而这些正好是大语言模型擅长的领域,因此我们看到了它在产品开发领域存在巨大的颠覆潜力。
Kraftful 是一个自诩为产品构建者副驾驶的工具,现在已经处于领先地位。它目前仅处于测试阶段,您需要提供邮箱才能访问其功能。我们已经试用过它并取得了很好的效果。您可以将30多种用户反馈来源连接到这个平台,它可以分析数据并识别功能请求、常见投诉、用户喜欢的产品特点,甚至列出您的竞争对手。为了获取更多细节,您可以像向 ChatGPT 或 Google Bard 提问一样,这里的好处是它针对您的数据进行了优化。一旦您确定了要从用户反馈中解决的问题,Kraftful 会基于所有基础数据(包括验收标准)为您生成用户故事,即使对经验丰富的产品经理和业务分析师来说它也是一个出色的助手。
39. pgvector
随着生成式人工智能应用的兴起,我们观察了一种储存和有效搜索嵌入 (embeddings) 向量相似性的模式。pgvector 是一个用于 PostgreSQL 的开源向量相似性搜索插件。我们非常喜欢它,因为它能够让我们在 PostgreSQL 中搜索 embeddings,而无需仅为了相似性搜索而将数据转移到另一个存储中。尽管目前已有几个专门的向量搜索引擎,但我们还是希望你能评估一下 pgvector。
40. Pinecone
Pinecone 是一个完全托管的、对开发人员友好的、云原生的向量数据库。它提供了简单的API,而无需处理基础设施方面的繁琐工作。Pinecone 可在数十亿向量数据的规模上,提供过滤后的查询结果,且延迟较低。我们的团队发现,对于存储团队知识库或服务台门户内容等使用场景,相较于针对对复杂的 LLM 进行微调,使用数据库提供商,特别是 Pinecone 会更便利,且上手很快。
41. wazero
wazero 是使用 Go 编写的一个零依赖的 WebAssembly(WASM) 运行时。尽管运行时本身与语言无关,我们仍想对 Go 开发者们强调 wazero, 因为它提供了一种很方便的方式, 使用任何 符合标准的语言 编写的 wasm 模块来扩展你的 Go 应用程序。它不依赖于 CGO, 所以你可以很容易地将你的 Go 应用程序交叉编译到其他平台。尽管在选择 WASM 运行时 的时候你有很多候选项, 但我们仍认为 wazero 值得评估.