最新 最热

[源码解析] PyTorch 分布式之弹性训练(4)---Rendezvous 架构和逻辑

在前面的文章之中,我们已经学习了PyTorch 分布式的基本模块,介绍了官方的几个例子,我们接下来会介绍PyTorch的弹性训练,本文是第四篇,看看Rendezvous 的结构和总体逻辑。...

2021-12-28
0

[源码解析] PyTorch 分布式之弹性训练(2)---启动&单节点流程

在前面的文章之中,我们已经学习了PyTorch 分布式的基本模块,介绍了官方的几个例子,我们接下来会介绍PyTorch的弹性训练,本文是第二篇,重点关注的是如何启动弹性训练,并且可以对系统总体架构有所了解。...

2021-12-24
0

kubernetes集群证书更新

kubeadm配置的集群默认的证书是1年,到期后证书升级是个很麻烦的事情。,该脚本可将kubeadm生成的证书有效期更新为10年

2021-12-23
0

Kubernetes - 集群备份和恢复

②kubeasz 项目创建的集群,需要备份 CA 证书文件,以及 ansible 的 hosts 文件

2021-12-23
0

在现有 Kubernetes 集群上安装 KubeSphere

KubeSphere是在 Kubernetes 之上构建的企业级分布式多租户容器管理平台,提供简单易用的操作界面以及向导式操作方式,在降低用户使用容器调度平台学习成本的同时,极大减轻开发、测试、运维的日常工作的复杂度,旨在解决 Kub...

2021-12-23
0

更新一个10年有效期的 Kubernetes 证书

使用 kubeadm 安装 kubernetes 集群非常方便,但是也有一个比较烦人的问题就是默认的证书有效期只有一年时间,所以需要考虑证书升级的问题,本文的演示集群版本为 v1.16.2 版本,不保证下面的操作对其他版本也适用,在操作之前...

2021-12-23
0

使用easzup 快速部署一个 kubernetes的高可用集群

如果提示kubectl: command not found,退出重新ssh登录一下,环境变量生效即可

2021-12-23
0

分布式模式14-State Watch

来源: https://martinfowler.com/articles/patterns-of-distributed-systems/

2021-12-21
0

APISIX架构分析:如何动态管理Nginx集群?

开源版 Nginx 最为人诟病的就是不具备动态配置、远程 API 及集群管理的能力,而 APISIX 作为 CNCF 毕业的开源七层网关,基于 etcd、Lua 实现了对 Nginx 集群的动态管理。...

2021-12-20
0

关于 Kubernetes 的 Secret 并不安全这件事

K8s 提供了 Secret 资源供我们来保存、设置一些敏感信息,比如 API endpoint 地址,各种用户密码或 token 之类的信息。在没有使用 K8s 的时候,这些信息可能是通过配置文件或者环境变量在部署的时候设置的。...

2021-12-18
1