ChatGLM-6B微调推理实战

2024-08-24 14:09:52 浏览数 (2)

ChatGLM-6B是一个由清华大学和智谱AI联合研发的开源对话语言模型，它基于General Language Model（GLM）架构，具有62亿参数，并支持中英双语问答。结合模型量化技术，用户可以在消费级的显卡上进行本地部署。在INT4量化级别下，最低只需6GB显存即可运行。

运行环境：

⭐️环境安装：

使用 pip 安装依赖：`pip install -r requirements.txt`，其中 `transformers` 库版本推荐为 `4.27.1`，但理论上不低于 `4.23.1` 即可。

⭐️代码调用方式：

代码语言：javascript复制

>>> from transformers import AutoTokenizer, AutoModel
>>> tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True)
>>> model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()
>>> model = model.eval()
>>> response, history = model.chat(tokenizer, "你好", history=[])
>>> print(response)
你好


	

模型 数据 技巧 量化 浏览器 


	




	
 0 人点赞





		上一篇：分享雷军22年前编写的代码






最新文章

更多»


		在 C# 中获取操作系统相关信息
		AI 检索器(AI Retriever)：RAG的重要组成部分，超强的商业优势
		基于知识库、工作流的智能体实践
		前端性能优化
		玩转腾讯混元 | 腾讯混元大模型AIGC系列产品技术有奖征文活动
		Docker/DockerHub 国内镜像源/加速列表（长期维护 0926更新）
		Safari浏览器统一字体之自定义CSS样式表
		蓝牙耳机丢了，我花几分钟写了一个小程序，找到了！
		#HarmonyOS NEXT#写了一个好用的语音播报demo
		【Docker项目实战】使用Docker部署myspeed网络测速工具
		





热门手册

更多»




Svn




Ruby




Python




Php




Nodejs




Mysql




Linux




Jquery




Javascript




Java




Html




Git


 	






推荐教程

更多»


		




设计模式、高可用性、高弹性、运维、监控与自动化



		




前后端分离的思考与实践



		




Susy 2 入门教程



		




让web app更快的HTML5最佳实践



		




Stack Overflow 揭秘程式开发者15 个不为人知的秘密



		




MySQL 5.7版本新特性连载



		




Redis 基础教程



		




架构之重构的12条军规



		




learnyounode 简体中文版



		




代码之谜







网站相关

关于字节宝
用户协议
网站地图
文章存档



常用链接

教程大全
文档大全
技术文章
字节宝手机版



官方APP

字节宝
Python字节宝
Java字节宝
字节宝工具箱



联系我们

帮助中心
商务合作QQ：3111859717







下载App




关注公众号




Copyright©2023 字节宝
	|


违法和不良信息举报电话：|举报邮箱：3111859717@qq.com