当下大语言模型（LLM）应用的架构介绍

2024-09-29 20:02:26 浏览数 (3)

想要构建你的第一个大语言模型应用？这里有你需要了解的一切，以及你今天就能开始探索的问题领域。

LLM 应用架构

我们的目标是让你能够自由地使用大语言模型进行实验、打造自己的应用，并挖掘那些尚未被人注意的问题领域。为此，GitHub 的两位机器学习领域的专家——高级研究员 Alireza Goudarzi 和首席工程师 Albert Ziegler，一起探讨了当下大语言模型的前沿架构。

在这篇文章中，我们将详细介绍五个构建大语言模型应用的关键步骤、当前大语言模型应用的新兴架构，以及一些你现在就可以着手研究的问题领域。

使用大语言模型或任何机器学习（ML）模型来构建软件，其过程与传统软件开发截然不同。最明显的区别在于，开发者需要处理数据集、嵌入技术和参数权重，而不是单纯将源代码编译成二进制文件来执行命令，以便生成一致而准确的输出。毕竟，大语言模型的输出结果具有概率性，无法像常规程序那样产生可预测的输出。

你可以通过以下链接查看图表的详细数据：点击图表可以放大并保存。

下面，我们来详细解读一下构建大语言模型应用的五个关键步骤。

0 人点赞