最新 最热

Nvidia-NCCL-GPU集合通信接口简介_源码笔记

nccl: NVIDIA Collective Communications Library (NCCL) 集合通信接口

2023-11-24
2

Milvus 2.3.功能全面升级,核心组件再升级,超低延迟、高准确度、MMap一触开启数据处理量翻倍、支持GPU使用!

Milvus 2.3.0 不仅包含大量的社区呼声很高的新功能,还带来了诸如 GPU 支持、Query 架构升级、更强的负载均衡、调度能力、新的消息队列Arm 版本镜像、可观测性、运维工具升级等能力,这标志着 Milvus 2.x 系列从 product...

2023-11-22
2

无法获得NVIDIA H100 GPU时该怎么办?

11月20日消息,英伟达(NVIDIA)推出的“Hopper”H100 GPU是目前全球AI巨头极力争夺的“战略资源”,但是由于供应量有限,很多订单都已经排到了2024年。这也迫使一些AI厂商选择考虑其他替代方案,当然H100高昂的价格也是一个影响...

2023-11-20
2

高通发布第三代骁龙7:GPU性能大涨50%,配备骁龙8系同款三ISP

此次高通发布的第三代骁龙7,采用了台积电4nm制程工艺,CPU为4大核+4小核设计,由1个2.63 GHz核心、3个2.40 GHz核心和4个1.80 GHz核心组成。官方表示,其CPU性能相比第一代骁龙7提升了15%。...

2023-11-20
1

Rust 与 GPU 编程的现状与前景探究

话说,程序员三大浪漫,操作系统、编译器和图形处理。Rust 语言已经攻陷了其中两大浪漫,操作系统和编译器,那么图形处理呢?Rust 语言还能“浪”起来吗?...

2023-11-20
1

S-LoRA:一个GPU运行数千大模型成为可能

一般来说,大语言模型的部署都会采用「预训练 — 然后微调」的模式。但是,当针对众多任务(如个性化助手)对 base 模型进行微调时,训练和服务成本会变得非常高昂。低秩适配(LowRank Adaptation,LoRA)是一种参数效率高的微调方法...

2023-11-16
2

【腾讯云 HAI域探秘】基于ChatGLM和StableDiffusion的小学一年级语文教学方案创作实践与经验分享

然后,需要申请内测资格(可能需要一两天,需要耐心等待一下,或者可以去群里找工作人员加急一下),点击申请内测资格

2023-11-15
1

芯片界地震!国产GPU狂飙,英伟达霸权终结者?

目前,国内已经进入大模型的规模化商用阶段,而大模型非常“吃”GPU。但是,由于美国限制,英伟达的GPU供应不上了。

2023-11-14
1

大厂突发裁员,国内GPU行业再起波澜

GPU巨头摩尔线程遭遇裁员,行业风波中的挑战与机遇。事件背景为摩尔线程老板发表全员公开信介绍相关情况。

2023-11-09
1

OpenAI大佬甩出「喵喵GPT」调戏黑客!分享ChatGPT成功的秘密:极限压榨GPU资源

一个30人的团队,完成了这个地球上最受欢迎的产品的发布和维护。他们成功的经验和失败的教训,简直如金子一般珍贵。

2023-11-08
2