gpu_字节宝

Nvidia-NCCL-GPU集合通信接口简介_源码笔记

nccl: NVIDIA Collective Communications Library (NCCL) 集合通信接口

2023-11-24

Milvus 2.3.功能全面升级，核心组件再升级，超低延迟、高准确度、MMap一触开启数据处理量翻倍、支持GPU使用！

Milvus 2.3.0 不仅包含大量的社区呼声很高的新功能，还带来了诸如 GPU 支持、Query 架构升级、更强的负载均衡、调度能力、新的消息队列Arm 版本镜像、可观测性、运维工具升级等能力，这标志着 Milvus 2.x 系列从 product...

数据处理 gpu mmap 数据索引

2023-11-22

无法获得NVIDIA H100 GPU时该怎么办？

11月20日消息，英伟达（NVIDIA）推出的“Hopper”H100 GPU是目前全球AI巨头极力争夺的“战略资源”，但是由于供应量有限，很多订单都已经排到了2024年。这也迫使一些AI厂商选择考虑其他替代方案，当然H100高昂的价格也是一个影响...

gpu nvidia 服务器工作性能

2023-11-20

高通发布第三代骁龙7：GPU性能大涨50%，配备骁龙8系同款三ISP

此次高通发布的第三代骁龙7，采用了台积电4nm制程工艺，CPU为4大核＋4小核设计，由1个2.63 GHz核心、3个2.40 GHz核心和4个1.80 GHz核心组成。官方表示，其CPU性能相比第一代骁龙7提升了15%。...

gpu 产品设计系统性能

2023-11-20

Rust 与 GPU 编程的现状与前景探究

话说，程序员三大浪漫，操作系统、编译器和图形处理。Rust 语言已经攻陷了其中两大浪漫，操作系统和编译器，那么图形处理呢？Rust 语言还能“浪”起来吗?...

渲染 rust gpu 编程后端

2023-11-20

S-LoRA：一个GPU运行数千大模型成为可能

一般来说，大语言模型的部署都会采用「预训练 — 然后微调」的模式。但是，当针对众多任务（如个性化助手）对 base 模型进行微调时，训练和服务成本会变得非常高昂。低秩适配（LowRank Adaptation，LoRA）是一种参数效率高的微调方法...

gpu 服务模型内存 LoRa

2023-11-16

【腾讯云 HAI域探秘】基于ChatGLM和StableDiffusion的小学一年级语文教学方案创作实践与经验分享

然后，需要申请内测资格（可能需要一两天，需要耐心等待一下，或者可以去群里找工作人员加急一下），点击申请内测资格

GPU云服务器腾讯云HAI ChatGLM gpu stablediffusion AI绘图

2023-11-15

芯片界地震！国产GPU狂飙，英伟达霸权终结者？

目前，国内已经进入大模型的规模化商用阶段，而大模型非常“吃”GPU。但是，由于美国限制，英伟达的GPU供应不上了。

gpu 产品华为模型芯片

2023-11-14

大厂突发裁员，国内GPU行业再起波澜

GPU巨头摩尔线程遭遇裁员，行业风波中的挑战与机遇。事件背景为摩尔线程老板发表全员公开信介绍相关情况。

gpu 行业线程芯片研发

2023-11-09

OpenAI大佬甩出「喵喵GPT」调戏黑客！分享ChatGPT成功的秘密：极限压榨GPU资源

一个30人的团队，完成了这个地球上最受欢迎的产品的发布和维护。他们成功的经验和失败的教训，简直如金子一般珍贵。

黑客 chatgpt gpt gpu openai

2023-11-08

4 5 6 7 8

Nvidia-NCCL-GPU集合通信接口简介_源码笔记

Milvus 2.3.功能全面升级，核心组件再升级，超低延迟、高准确度、MMap一触开启数据处理量翻倍、支持GPU使用！

无法获得NVIDIA H100 GPU时该怎么办？

高通发布第三代骁龙7：GPU性能大涨50%，配备骁龙8系同款三ISP

Rust 与 GPU 编程的现状与前景探究

S-LoRA：一个GPU运行数千大模型成为可能

【腾讯云 HAI域探秘】基于ChatGLM和StableDiffusion的小学一年级语文教学方案创作实践与经验分享

芯片界地震！国产GPU狂飙，英伟达霸权终结者？

大厂突发裁员，国内GPU行业再起波澜

OpenAI大佬甩出「喵喵GPT」调戏黑客！分享ChatGPT成功的秘密：极限压榨GPU资源

热门文章

热门手册