如何克服第2天Kubernetes的技能差距

2020-09-07 14:36:24 浏览数 (1)

客座文章最初由Emily Omier在Nirmata博客上发表

https://nirmata.com/2020/07/09/how-to-overcome-the-day-2-kubernetes-skills-gap/

在企业IT的“旧时代”,大多数工程师都是高度专业化的。举例来说,每个人都是网络或存储方面的专家,但是大多数人对他们专业领域之外的软件堆栈部分没有普遍的了解。构建系统范围和跨功能的技能是留给高级架构师角色的。对于开发人员、操作工程师以及存储、网络和安全专家来说都是如此。

DevOps的主要目标之一是打破孤岛,并鼓励个人发展更广泛的技能组合,其中可能包括在一个领域中非常深入的专业知识,但也包括对制作企业应用程序工作过程中所需要进行的其他一切的基本了解。这对于应用程序生命周期的每个阶段都很重要,但对于第2天的操作尤其如此。当应用程序投入生产,避免停机是必不可少的。这需要知识来快速有效地进行故障排除。

这一广泛的技能集对于Kubernetes平台工程师(或集群管理员或平台操作员,看你希望如何称呼Kubernetes专家)至关重要。因为Kubernetes是一个管理网络、安全、存储和计算的平台,所以负责配置和管理Kubernetes的人员至少需要了解这些东西是如何工作的,以及它们是如何在云原生环境中具体工作的。

然而,现实是,大多数组织很难找到“DevOps工程师”或任何拥有足够技能的人来成功地管理Kubernetes。这是导致Kubernetes技能差距持续存在的部分原因:不仅个人需要更多地了解Kubernetes,而且组织必须深入了解Kubernetes与基础设施的其他方面进行交互和管理的方式。

你需要什么?

Kubernetes不仅迫使工程师在他们通常的专业领域之外建立技能,它还完全改变了许多领域的范式,因此即使是专家也必须重新学习如何在Kubernetes中工作。

让我们先谈谈存储。调试或排除存储问题的Kubernetes管理员不仅需要了解存储在遗留(legacy)环境中如何工作,还需要了解Kubernetes如何通过持久卷(PV)和持久卷声明(PVC)连接和编排存储。这些概念是Kubernetes特有的,因此即使是经验丰富的存储专家也必须重新学习这些概念,才能成功地管理Kubernetes上的存储问题。

Kubernetes中的网络也有所不同,这也是Kubernetes管理员需要了解的。管理员需要了解DNS如何在Kubernetes集群中工作,以及如何使用CNI将集群与中央网络连接。了解网络策略的工作方式、它们对安全性和弹性的影响以及组织应该执行哪些类型的策略也很重要。

Kubernetes和容器的安全性与遗留环境中的安全性非常不同。安全性的重点不能放在维护应用程序的安全边界上,而应该放在确保容器镜像没有漏洞、确保配置尽可能安全以及防止应用程序使用root特权运行。

有效地构建和操作集群的能力取决于团队是否能够理解存储、网络和总体安全性,以及它们与Kubernetes的具体关系。这需要大量的专业知识,而这正是大多数个人和组织所缺乏的。

爆炸的复杂性

除了迫使工程师在更广泛的领域开发专门知识外,微服务、容器和Kubernetes还显著增加了系统的复杂性。工程师不仅必须熟悉网络、存储和安全性,而且还必须处理不断增健口服液的临时容器。他们必须管理成百上千个此类容器的监视、日志记录、故障排除和更新,这些容器通常在多个云环境和本地环境中。

许多公司认为,因为他们的概念证明是成功的,他们已经知道如何在生产中运行Kubernetes。组织常常低估了大规模的Kubernetes和容器的复杂性,并低估了操作Kubernetes所需的专业技术和工具的数量。

缩小技能差距

减少操作技能差距需要组织做两件事。

集中的专业知识

组织可以构建由Kubernetes专家组成的小型中央团队,这些专家负责配置和操作Kubernetes,并支持需要帮助的开发人员,充当平台工程师和内部顾问。这减少了需要成为Kubernetes专家的人数,但仍使组织能够获得Kubernetes的专门知识。

集中安全性和基础设施管理

只有当这些Kubernetes管理员能够控制整个组织的Kubernetes基础设施(理想情况下是通过单个平台)时,才能创建一个小的专家团队。这使得中心团队可以为组织处理与Kubernetes相关的所有事情,而应用程序开发和操作可以安全地分散到具有较少Kubernetes专业知识的工程师那里。中央平台允许Kubernetes团队创建和执行治理策略,因此开发人员不需要知道应该如何配置Kubernetes的细节。

像Nirmata这样的中心和开放平台可以帮助中心团队尽可能地实现自动化,对工程组织的其他部分实施保护,并在第二天的操作中克服技能差距。要了解更多,请查看我们的特性获得概述。

https://nirmata.com/product/#features

0 人点赞