推理_字节宝

首页 / 技术

技术指南：5分钟零成本实现本地AI知识库搭建

你一定经历过各种通用大模型一本正经胡说八道的时候吧，AI一通丝滑输出让人真假难辨，防不胜防。这种情况被称为AI幻觉。

数据库本地数据库大模型推理

2024-09-03

3

使用vLLM加速大语言模型推理

vLLM 是一个快速且易于使用的库，用于 LLM 推理和服务，和 HuggingFace 无缝集成。区别于 chatglm.cpp 和 llama.cpp，仅是在 GPU 上的模型推理加速，没有 CPU 上的加速。...

LLMvLLM 推理加速

2024-03-13

2