LLM_字节宝

LLM主要类别架构

LLM 编码架构模型数据

2024-06-04

大模型的不足与解决方案

在前面三个章节呢，为大家从技术的角度介绍了大模型的历程与发展，也为大家介绍了目前主流的大模型的一些特点。在平时的使用中呢，我们也能够感受得到大模型非常的强大，但不可否认的是大模型也存在着一些不足的部分，具体...

LLM 大模型知识引擎 agent aigc chatgptLangChain 人工智能体

2024-06-03

国内外主流大模型（LLM）都具有哪些特点？

该章节呢，我们主要是看一下关于国内外主流的大语言模型，通过它们都具备哪些特点，来达成对多模型有一个清晰的认知。对于 "多模型" 的 "多" ，大家一定要有个概念，很多小伙伴只知道 "ChatGPT" ，或者是只知道国内的一些大模型，...

大模型知识引擎人工智能 agent aigc LLM

2024-06-03

5分钟速通大语言模型（LLM）的发展与基础知识

这一章节呢，主要是为大家介绍一下AI大模型相关的一些背景和基础知识。大家可以看到这一章节的标题是 "5分钟速通大语言模型（LLM）的发展与基础知识" ，相较于唬人的标题，大家肯定更关心的是接下来主要讲哪些内容呢？...

agent aigc chatgpt LLM 大模型知识引擎

2024-06-02

大语言模型--Llama3新特性

词表大小从32000增加到128256，这也是导致参数量从7B增至8B的主要原因。更大的词表使得模型涵盖的语言更多、更加通用

pytorch huggingface-transformers LLM

2024-05-29

Gaia - 一个使用Rust实现的Local LLM服务解决方案

最近发现一个不错的项目，Gaia （https://github.com/GaiaNet-AI/gaianet-node），它的功能是：

rust local 服务解决方案 LLM

2024-05-29

LLM 大模型学习必知必会系列(八)：10分钟微调专属于自己的大模型

提示: 因为自我认知训练涉及到知识编辑, 建议对MLP加lora_target_modules. 你可以通过指定--lora_target_modules ALL在所有的linear层(包括qkvo以及mlp)加lora. 这通常是效果最好的....

model 模型研发 LLM global

2024-05-26

LLM 大模型学习必知必会系列(五)：数据预处理(Tokenizer分词器)、模板（Template）设计以及LLM技术选型

在模型训练过程中，数据及数据处理是最为重要的工作之一。在当前模型训练流程趋于成熟的情况下，数据集的好坏，是决定了该次训练能否成功的最关键因素。...

模型设计数据数据预处理 LLM

2024-05-26

AI写作惊现黑马！Weaver Ultra碾压数倍体量LLM，竟在WriteBench超越GPT-4？人机协作新篇章已开启！

在AI写作的新纪元里，一个名为Weaver的大型语言模型系列正引领着创作潮流。凭借创新的数据合成与微调手法，Weaver不仅轻松击败了数倍体量的通用LLMs，更在严苛的WriteBench测试中独领风骚。这究竟是何方神圣？答案是——Weav...

gpt 论文数据人机协作 LLM

2024-05-24

一键融合多个AI大模型，FuseLLM让你轻松拥有‘全能大模型’！

随着AI技术的飞速发展，大语言模型如LLaMA和Mistral等已成为行业内的热门话题。然而，创建全新的大语言模型不仅成本高昂，而且可能导致新旧模型之间的能力冗余。为了解决这一问题，中山大学和腾讯AI Lab的研究者们带来了一个...

模型 LLM 开源部署架构