最近在拜读许老师的《大数据处理框架Apache Spark设计与实现》,之前看豆瓣评分很高,阅读了一下果然通俗易懂,在这里记录一下相关的笔记,补充了一些个人理解,如有不对还请指正。参考链接:https://github.com/JerryLead/Spark...
在分布式系统中,雪花 ID 是一种常用的唯一 ID 生成算法。它通过结合时间戳、机器码和自增序列来生成 64 位整数 ID,可以保证 ID 的唯一性和顺序性。
版本控制系统是指对软件开发过程中各种程序代码、配置文件及说明文档等文件变更的管理系统
VMWare下centos7在下载好HBase并解压配置环境后运行jps后缺少HMaster在确定安装和环境配置上没问题后开始逐渐查找问题
完整文章清移步知乎,这个是最近有空时逐步走读了下vllm的流程,还不包含paged attention的实现具体解析,后续有空会把这paged attention这一节的 kernel 实现细节补一下...
这个系列是对DeepSpeed的教程做一下翻译工作,在DeepSpeed的Tutorials中提供了34个Tutorials。这些Tutorials不仅包含配置DeepSpeed完成分布式训练的标准流程,还包含一些DeepSpeed支持的一些Feature比如低比特优化器,Zero...
分布式、微服务、集群和SOA(面向服务的架构)是现代软件架构中的一些重要概念,它们之间有一些联系和关系,但又有一些区别。下面是它们之间的关系解释:...
分布式算法是并行算法的一个子类型,通常同时执行,算法的不同部分在独立的处理器上同时运行,并且对算法的其他部分正在做什么的信息有限。开发和实施分布式算法的主要挑战之一是在面对处理器故障和不可靠的通信链路时成功...
在JVM中,可以使用同步锁或Lock锁,在多线程并发的情况下保证同一时间只有一个线程修改共享变量或执行代码块。然而,随着现代应用程序基本上都基于分布式集群来实现的趋势,传统Java锁在分布式环境中使用时就显得无能为力。...
由于MySQL 源码编译单机耗费的时间过于长,最近MySQL 变成8.0.27 以后编译时间明显更耗时了,并且办公室内有多余的空闲机器。