最新 最热

使用vLLM加速大语言模型推理

vLLM 是一个快速且易于使用的库,用于 LLM 推理和服务,和 HuggingFace 无缝集成。区别于 chatglm.cpp 和 llama.cpp,仅是在 GPU 上的模型推理加速,没有 CPU 上的加速。...

2024-03-13
0

Nvidia ASAP(加速交换和数据包处理)技术简介

ASAP: NVIDIA accelerated switching and packet processing (ASAP2) 加速网络交换和数据包处理技术

2024-01-02
0

在腾讯云 EMR 上使用 GooseFS 加速大数据计算服务

GooseFS 是腾讯云对象存储团队近期面向下一代云原生数据湖场景推出的存储加速利器,提供与 HDFS 对标的 Hadoop Compatible FileSystem 接口实现,可为云上的大数据计算任务提供:...

2021-08-25
0

CDN配置方式(以腾讯云为例)

CDN的全称是Content Delivery Network,即内容分发网络。CDN是构建在现有网络基础之上的智能虚拟网络,依靠部署在各地的边缘服务器,通过中心平台的负载均衡、内容分发、调度等功能模块,使用户就近获取所需内容,降低网络拥塞...

2021-08-20
0