Nvidia
Nvidia网络文档: https://docs.nvidia.com/networking/software/index.html
学习目录: https://nvdam.widen.net/s/wlbgbqr7cj/nvidia-learning-training-course-catalog
DOCA纠删码编程指南:
https://docs.nvidia.com/doca/sdk/erasure-coding-programming-guide/index.html
Nvidia在线研讨会(视频教程): https://www.nvidia.cn/about-nvidia/webinar-portal
Nvidia深度学习学院: https://www.nvidia.com/en-us/training/online/
Nvidia深度学习培训中心: https://www.nvidia.cn/training/
Mellanox学院: https://academy.nvidia.com/
DPU
DOCA文档汇总: https://docs.nvidia.com/doca/sdk/index.html
DOCA与UCX编程指导: https://docs.nvidia.com/doca/sdk/ucx-programming-guide/index.html
DPU_BSP手册: https://docs.nvidia.com/networking/display/bluefielddpubspv420
DOCA与RDMA编程手册: https://docs.nvidia.com/doca/sdk/rdma-programming-guide/index.html
DOCA核心编程指南: https://docs.nvidia.com/doca/sdk/doca-core-programming-guide/index.html
DOCA参考应用汇总(概览): https://docs.nvidia.com/doca/sdk/applications-overview/index.html
DOCA_PCC(可编程拥塞控制): https://docs.nvidia.com/doca/sdk/pcc/index.html
在 BlueField DPU 上使用 NVIDIA DOCA 开发应用程序简介: https://www.nvidia.com/en-us/on-demand/session/other2022-dc0511/
热门互联网络技术
第30届IEEE热互连研讨会: https://hoti.org/
技术视频: https://www.youtube.com/@hoti-hotinterconnectssympo5358/videos
议题: https://hoti.org/program/
Hot Interconnects 是最先进的硬件和软件架构的研究人员和开发人员的首要国际论坛,...
Hot Interconnects 是最先进的硬件和软件架构以及各种规模互连网络实现的研究人员和开发人员的首要国际论坛,范围从多核片上互连到系统、集群、数据中心内的互连 和云。 业界和学术界的领导人出席了这一年度会议。 这种氛围提供了大量与该领域前沿人士互动的机会。
主题包括跨领域问题,涵盖计算机系统、网络技术和高性能互连网络的通信协议。 本次会议特别针对这些领域的令人兴奋的新技术和产品创新。
欢迎来到第 30 届 IEEE 热互连研讨会。 HotI30 将以虚拟方式举行。 IEEE Hot Interconnects 是最先进的硬件和软件架构以及各种规模互连网络实现的研究人员和开发人员的首要国际论坛,范围从多核片上互连到系统集群内的互连和数据互连。 中心。 工业界和学术界的领导者出席会议,与该领域最前沿的人士进行互动。
我们的目标是解决数据中心网络和超级计算社区的问题。 我们希望您能加入我们,不仅从内容中受益,还从本次活动始终提供的绝佳交流机会中受益
加速器互连 几乎所有新兴的高价值应用程序,尤其是那些位于边缘的应用程序,都使用加速器而不是 CPU 来实现其基本功能。 此外,在任何规模的集群中,包括边缘集群,都会采用多个加速器来满足此类应用程序的动态需求。 这些加速器可以是同一类型(作为池),也可以是不同类型。 但与 CPU 的情况一样,系统的性能几乎总是受到 I/O 或互连的限制。 因此,我们想要探索加速器的互连如何不仅避免成为瓶颈,更重要的是使加速器协同工作以实现新的应用程序并彻底改变计算架构。 该小组将探讨最具创新性的加速器互连方法,以充分利用这些令人惊叹的加速器的功能。
性能
P99 CONF 大会(P99分位数, 极致)是面向工程师和由工程师举办的跨行业虚拟活动,以低延迟、高性能设计为中心, 突出低延迟、高性能分布式计算所需的工程挑战和创造性解决方案
P99大会: https://www.p99conf.io/on-demand/
HPC高性能计算
Mochi 项目是阿贡国家实验室、洛斯阿拉莫斯国家实验室、卡内基梅隆大学和 HDF 集团之间的合作。 该项目的目标是探索一种软件定义的存储方法,用于组合存储服务,为极端规模的科学应用程序提供新级别的功能、性能和可靠性
Mochi(麻薯): https://mochi.readthedocs.io/en/latest/
Linux
linux内核文档: https://www.kernel.org/doc/html/latest
linux内存管理: https://www.kernel.org/doc/gorman/html/understand/
centos_内核编译: https://wiki.centos.org/HowTos
linux内核makefile和官方文档: https://www.kernel.org/doc/html/latest/kbuild/makefiles.html
https://docs.kernel.org/kbuild/makefiles.html
https://youjiali1995.github.io/categories/
https://www.scylladb.com/
https://www.scylladb.com/blog/
linux内核: http://www.kerneltravel.net/
linux内核博客: https://blog.csdn.net/hu1610552336?type=blog
linux内核社群: https://www.sohu.com/a/395455440_467784
linux文件系统: https://www.kernel.org/doc/Documentation/filesystems/vfs.txt
linux内核CLK(中国Linux内核开发者大会): http://ckernel.org/
linux内核文档: https://linux-kernel-labs.github.io/refs/pull/183/merge/labs/device_model.html
systemtap教程汇总: https://github.com/lichuang/awesome-systemtap-cn
中文档: https://spacewander.gitbooks.io/systemtapbeginnersguide_zh/content/4_3_UserSpaceStackBacktraces.html
探测点: https://linux.die.net/man/3/stapprobes
官方示例: https://sourceware.org/systemtap/examples/
bpftrace:
官方教程,指南: https://github.com/iovisor/bpftrace/blob/master/docs/reference_guide.md
动态调试: https://www.kernel.org/doc/html/v4.14/admin-guide/dynamic-debug-howto.html
中国Unix操作系统: http://blog.chinaunix.net/os.html
函数调用栈: https://ivanzz1001.github.io/records/post/linux/2017/10/18/linux-function_callstack_part1
linux内核: https://ivanzz1001.github.io/records/post/kernel/2020/03/31/kernel_intro_part1
存储(Storage)
华为存储: https://e.huawei.com/cn/material/MaterialList?id={A246BE8A-D1A6-4AA6-852F-16AD3C4BC7AA}
存储技术最前线: nvme, ceph, spdk, 虚拟化汇总
IO子系统全流程
SSD存储汇总:
存储随笔: https://mp.weixin.qq.com/template/article/1688888165/index.html
nvme: https://mp.weixin.qq.com/mp/homepage?__biz=MzIwNTUxNDgwNg==&hid=1&sn=b8edd088ef636f736518b201f697cc9d&devicetype=iOS16.3.1&version=18002038&lang=zh_CN&nettype=WIFI&ascene=7&session_us=gh_b79997f0dcfa&fontScale=94&scene=1
存储随笔《NVMe专题》大合集: https://memory-logger.blog.csdn.net/article/details/76136138
闪存和存储: https://www.techtarget.com/searchstorage/resources/Flash-memory-and-storage
存储之道: https://blog.51cto.com/alanwu/category4
Nvmeof
NvidiaNvmeof配置视频: https://academy.nvidia.com/en/videos/
数据库(DB)
redis_rocksdb_leveldb_scylladb_raft: https://youjiali1995.github.io/categories/
rocksdb
rocksdb博客: https://rocksdb.org/blog/
Ceph
ceph博客: https://ceph.io/en/news/blog
ceph专栏(黑桃): https://ivanzz1001.github.io/records/categories/#ceph
ceph专栏(): https://www.dovefi.com/post/
ceph专栏(知乎): https://www.zhihu.com/column/c_1661407683897901056
ceph管理手册(红帽): https://access.redhat.com/documentation/en-us/red_hat_ceph_storage/1.3/html/administration_guide/index
ceph原理rocksdb_bluestor两阶段2PC事务WAL等: https://www.zhihu.com/people/allincache/posts
ceph内部原理(读写详细流程): https://bean-li.github.io/tags/#ceph
Ceph学习——Librbd块存储库与RBD读写流程源码分析(RBD): https://blog.csdn.net/CSND_PAN/article/details/78728743
DAOS
项目计划: https://daosio.atlassian.net/wiki/spaces/DC/pages/4836661105/Roadmap
设计文档: https://daosio.atlassian.net/wiki/spaces/DC/pages/4806836263/Resources
晓兵技术杂谈: https://cloud.tencent.com/developer/article/2344030
SPDK
spdk技术文章: https://spdk.io/cn/articles/
吴斌spdk_ceph计算机: https://rootw.github.io/archive/
DPDK
dpdk官方博客: https://www.dpdk.org/blog
网络(Network)
RDMA
mojo-rdma代码优化技巧(提升性能): https://www.rdmamojo.com/2013/06/08/tips-and-tricks-to-optimize-your-rdma-code/
rdma杂谈_技术原理: https://www.zhihu.com/column/c_1231181516811390976
nvidia_mlx_RDMA编程指导: https://docs.nvidia.com/networking/display/RDMAAwareProgrammingUM/Glossary
https://docs.nvidia.com/networking/display/RDMAAwareProgrammingUM/Programming Examples Using IBV Verbs
RoCE无损和有损以及Mellanox网卡新功能: https://cloud.tencent.com/developer/article/2304247
UCX(统一通信X)
UCX-UCT统一通信传输层3-服务端和客户端调用栈详解(及相关)_源码解读: https://cloud.tencent.com/developer/article/2353126
编码(code)
google c 编码规范: https://google.github.io/styleguide/cppguide.html
计算机
计算机经典书籍一千本: https://gitee.com/mphyatyh/CS-Books
龙蜥社区: https://openanolis.cn/
其他
范老师博客汇总-云计算-虚拟化-容器
腾讯云沙龙活动: https://cloud.tencent.com/developer/salon/activities
腾讯tvp(Techo TVP开发者峰会—— 数据的冰与火之歌),2021-04-24 周六 09:30-17:40: https://cloud.tencent.com/developer/salon/salon-1406
tvp文章: https://cloud.tencent.com/developer/article/1820349
rdma mellanox ofed驱动编译安装部署: https://github.com/opencurve/curve-meetup-slides/blob/9d17e0eb42df2bee0ec8c7a6c6aaf95a340028f5/PrePaper/2023/CurveBS RDMA&SPDK 部署指南.md
智东西公开课: https://apposcmf8kb5033.pc.xiaoe-tech.com/
分布式数据库: https://www.zhihu.com/column/c_1165316856901668864
单元测试框架对比: http://www.throwtheswitch.org/comparison-of-unit-test-frameworks
晓兵(ssbandjl)
https://logread.cn/post/study/summary/
博客
https://cloud.tencent.com/developer/user/5060293/articles
https://cloud.tencent.com/developer/user/5060293/video
https://logread.cn
https://blog.csdn.net/ssbandjl