【Rust日报】Luminal:在 Rust 中编译快速 GPU 内核

2024-05-10 16:46:19 浏览数 (2)

Piccolo - 主要用 Safe Rust 编写的 Stackless Lua 解释器

https://kyju.org/blog/piccolo-a-stackless-lua-interpreter/

你好!我最近(终于!)完成了一篇计划好的博客文章,介绍 Lua 运行时piccolo,我想在这里分享它。这不是一个新项目,我之前已经谈过它,但它最近又恢复了积极的工作,而且我以前从未有机会在一个我可以指出的地方公开地真正正确地谈论过它。

这并不是一个使用piccolo或贡献的广告piccolo,而是关于无堆栈解释器、垃圾收集、解释器设计和(某种程度上)写给协程的情书的想法的集合。它也是一个演示piccolo及其独特之处,并且博客文章上有一些示例供您在实时 REPL 中尝试。

Luminal:在 Rust 中编译快速 GPU 内核

大家好!几个月前我发布了有关 Luminal 的文章,从那时起我们在CUDA 和 Metal 编译器方面取得了重大进展。对于那些不知道的人来说,Luminal 是一个深度学习库,它使用可组合编译器来实现高性能。它完全用 Rust 编写,比同类 ML 框架简单几个数量级。最近,我们一直致力于提高 Nvidia 和 Apple GPU 的性能,这促使我们编写能够动态生成内核的编译器。这些内核编译一次并运行多次,并且由于整个计算图在编译时已知,因此我们可以非常积极地进行内核优化。

我们正在添加更多功能(autograd 已在几周前上线,因此现在可以进行培训!),因此如果您想了解更多信息, 请查看博客文章和存储库!

Maelstrom:一个封闭的、集群的 Rust 测试运行器(而且速度很快)

Maelstrom 是一个开源 Rust 测试运行器,构建在通用集群作业运行器之上。Maelstrom 将您的 Rust 测试打包到密封的微容器中,然后将它们分发到任意大的测试运行器集群上或在您的本地计算机上运行。您可以使用 Maelstrom 来运行测试,因为:

  • 这很容易。Maelstrom 可以作为货物测试的直接替代品,因此在大多数情况下,它都能正常工作。
  • 这是可靠的。Maelstrom 在自己的轻量级容器中密封地运行每个测试,消除了由测试间或隐式测试环境依赖性引起的混乱错误。
  • 它是可扩展的。Maelstrom 可以作为集群运行。您可以添加更多工作机器以线性增加测试吞吐量。
  • 它很快。在大多数情况下,即使不使用集群,Maelstrom 也比货物测试更快。
  • 很干净。Maelstrom 有一个从头开始的无根容器实现(不依赖 Docker 或 RunC),经过优化以降低开销并快速启动。
  • 这是生锈的。整个项目是用 Rust 编写的。

我们从 Rust 测试运行程序开始,但 Maelstrom 的底层作业执行系统是通用的。我们将在不久的将来添加对其他语言测试框架的支持。我们还为喜欢冒险的用户提供了运行任意作业的工具,可以使用命令行工具或基于 gRPC 的 SDK。

欢迎反馈和提问!感谢您尝试一下。

https://maelstrom-software.com/

https://github.com/maelstrom-software/maelstrom

From 日报小组 时光

0 人点赞