最新 最热

大模型的不足与解决方案

在前面三个章节呢,为大家从技术的角度介绍了大模型的历程与发展,也为大家介绍了目前主流的大模型的一些特点。在平时的使用中呢,我们也能够感受得到 大模型 非常的强大,但不可否认的是 大模型也存在着一些不足的部分,具体...

2024-06-03
2

国内外主流大模型(LLM)都具有哪些特点?

该章节呢,我们主要是看一下关于国内外主流的大语言模型,通过它们都具备哪些特点,来达成对多模型有一个清晰的认知。对于 "多模型" 的 "多" ,大家一定要有个概念,很多小伙伴只知道 "ChatGPT" ,或者是只知道国内的一些大模型,...

2024-06-03
2

5分钟速通大语言模型(LLM)的发展与基础知识

这一章节呢,主要是为大家介绍一下AI大模型相关的一些背景和基础知识。大家可以看到这一章节的标题是 "5分钟速通大语言模型(LLM)的发展与基础知识" ,相较于唬人的标题,大家肯定更关心的是接下来主要讲哪些内容呢?...

2024-06-02
2

大语言模型--Llama3新特性

词表大小从32000增加到128256,这也是导致参数量从7B增至8B的主要原因。更大的词表使得模型涵盖的语言更多、更加通用

2024-05-29
4

Gaia - 一个使用Rust实现的Local LLM服务解决方案

最近发现一个不错的项目,Gaia (https://github.com/GaiaNet-AI/gaianet-node),它的功能是:

2024-05-29
1

LLM 大模型学习必知必会系列(八):10分钟微调专属于自己的大模型

提示: 因为自我认知训练涉及到知识编辑, 建议对MLP加lora_target_modules. 你可以通过指定--lora_target_modules ALL在所有的linear层(包括qkvo以及mlp)加lora. 这通常是效果最好的....

2024-05-26
3

LLM 大模型学习必知必会系列(五):数据预处理(Tokenizer分词器)、模板(Template)设计以及LLM技术选型

在模型训练过程中,数据及数据处理是最为重要的工作之一。在当前模型训练流程趋于成熟的情况下,数据集的好坏,是决定了该次训练能否成功的最关键因素。...

2024-05-26
3

AI写作惊现黑马!Weaver Ultra碾压数倍体量LLM,竟在WriteBench超越GPT-4?人机协作新篇章已开启!

在AI写作的新纪元里,一个名为Weaver的大型语言模型系列正引领着创作潮流。凭借创新的数据合成与微调手法,Weaver不仅轻松击败了数倍体量的通用LLMs,更在严苛的WriteBench测试中独领风骚。这究竟是何方神圣?答案是——Weav...

2024-05-24
1

一键融合多个AI大模型,FuseLLM让你轻松拥有‘全能大模型’!

随着AI技术的飞速发展,大语言模型如LLaMA和Mistral等已成为行业内的热门话题。然而,创建全新的大语言模型不仅成本高昂,而且可能导致新旧模型之间的能力冗余。为了解决这一问题,中山大学和腾讯AI Lab的研究者们带来了一个...

2024-05-24
1