最新 最热

RDMA MellanoxCX-4 网卡RoCE/IB带宽测试

本文仅用于分享记录学习RDMA/RoCE v2网络协议的一些基础内容。如有错误,欢迎评论区留言。

2024-05-30
2

标准网卡慢慢失宠了,智能网卡(SmartNIC)才是未来!

网络技术和硬件设备的不断发展已经改变了数据中心和云计算的格局。随着虚拟化、微服务架构的不断激增,以及移动设备和云服务的高度利用率,网络工作负载的增加速度已经远远超过了传统数据中心CPU的处理速度。这使得寻找...

2023-11-12
2

阿里大佬力荐K8s项目实战笔记!图文并茂带你深度解析Kubernetes

当我们尝试去理解 Kubernetes 集群工作原理的时候,控制器肯定是一个难点。这是因为控制器有很多,具体实现大相径庭;且控制器的实现用到了一些较为晦涩的机制,不易理解。但是,我们又不能绕过控制器,因为它是集群的“大脑”。...

2022-10-28
2

玩转腾讯云!手把手教你用RunInstances接口创建CVM时给公网IP和弹性网卡打标签

导语 | 本文推选自腾讯云开发者社区-【技思广益 · 腾讯技术人原创集】专栏。该专栏是腾讯云开发者社区为腾讯技术人与广泛开发者打造的分享交流窗口。栏目邀约腾讯技术人分享原创的技术积淀,与广泛开发者互启迪共成...

2022-09-19
3

TKE集群节点max-pod是如何配置的

使用tke集群部署服务的时候,经常会遇到一种情况,就是pod一种pending无法成功调度到节点上,查看事件提示报错

2022-08-15
2

腾讯云容器网络介绍

在实现该网络模型时,为了应对不同的使用场景,TKE(Tencent Kubernetes Engine)提供了 Global Router 和 VPC-CNI 两种网络模式。本文中,我们将通过这两种模式下数据包的转发流程来分析这两种模式各自的实现原理。本文还会对...

2022-08-01
2

multi-network ns在Underlay下的应用-妙手篇

接着上篇《multi-network ns在Underlay下的应用-本手篇》,我们来聊聊基于 multiple network ns 的妙手级应用:Underlay 。

2022-06-20
1

GPU 分布式 AI 训练加速引擎 TACO-Training 容器方案首发!

冯克环,腾讯云异构计算研发工程师,专注于云上 AI 训练加速相关技术,对 GPU 虚拟化、GPU 训练加速有深厚的积累,目前负责腾讯云 AI 训练加速相关技术的研发以及性能优化工作。 张锐,腾讯云网络虚拟化研发工程师,在之前的工作...

2021-11-26
2

GPU 分布式 AI 训练加速引擎 TACO-Training 容器方案首发!

背景 随着 AI 模型规模的越来越大,训练数据的越来越多,用户对模型的迭代效率也要求越来越高,单个 GPU 的算力显然无法满足大部分业务场景,使用单机多卡或多机多卡训练成为趋势。单机多卡训练场景的参数同步借助目前 NVIDI...

2021-11-26
1

QPS 最高提升 91% | 腾讯云 TKE 基于 Cilium eBPF 提升 k8s Service 性能

朱瑜坚,腾讯云后台工程师,主要负责腾讯云 TKE 容器网络的构建和相关网络组件的设计、开发和维护工作。张浩,腾讯云高级工程师,主要负责容器网络多个组件的开发和维护,也关注调度、服务网格等领域。 前言 Kubernetes 已经成...

2021-07-05
2