2022 年 DevOps 路线图|Medium
【 文章来源 】https://faun.pub/devops-roadmap-2022-340934d360f9
DevOps 技能需求量很大,并且需要不断学习需要让自己与市场需求保持同步。这篇文章是为了分享可以帮助你的笔记。
从根本上强大的网络技术
了解 HTTP/2、QUIC 或 HTTP3、第 4 层和第 7 层协议、mTLS、代理、DNS、BGP 等概念,负载平衡的工作原理、IP 表、Internet 的工作原理、IP 地址和方案,最后是网络设计。
掌握操作系统基础知识,尤其是 Linux
由于大多数系统(VM、容器等)都运行 Linux,因此从上到下了解这一点很重要。学习调度、systemd 接口、init 系统、cgroups 和命名空间、性能调优,并掌握命令行实用程序 — awk、sed、jq、yq、curl、ssh、openssl 等。
CI/CD
如果你仍然喜欢詹金斯,那很好。但是,世界已经转向云原生管道。从概念上讲,这个空间没有太大变化,但你可以看看 Github Actions、Tekton 等。如何更好地发布?了解各种部署策略,例如蓝绿和金丝雀。
容器化和虚拟化
除了流行的 Docker 运行时,尝试 containerd、podman 等并了解如何容器化应用程序、如何实现容器安全性、如何在 Kubernetes 中运行和编排 VM,请参阅 KubeVirt 项目。
容器编排
Kubernetes 现在是运行容器的事实上的标准。网上有很多学习 Kubernetes 的内容。专注于配置最佳实践、应用程序设计、安全性和调度。设置集群现在变得微不足道,但第二天的操作性问题,例如设置、监控、日志记录、CI/CD、如何扩展集群、成本优化和安全性是人们可能期望你提出的一些问题。
大规模可观测性
大多数工程师都知道 Prometheus Grafana 堆栈或类似堆栈。趋势表明,从性能和成本的角度来看,许多组织正在整合他们的 Kubernetes 集群和可观测性,这很有帮助。了解 Prometheus 的高级配置和架构,以及如何扩展它们。研究 Thanos、Cortex、VictoriaMetrics、Datadog 和 Loki 等技术。连续分析工具,例如 Parca、潜望镜、超跟踪和具有开放遥测的分布式跟踪。诸如 Istio 之类的服务网格是云原生配方中的一种流行成分。
平台团队作为产品团队
平台团队的功能越来越像一个集中的产品团队,专注于他们内部的平台客户,如开发人员和测试人员。目标是改善工作方式并为团队带来一些秩序。尝试即兴解决开发人员和 QA 团队面临的问题。你是其他团队的推动者,而不是在一个中心团队中承担所有工作,而是指导开发团队承担典型的 DevOps 职责。这样你就可以扩大规模并且不会过度烧伤自己。
安全
在许多小型组织中,安全是二等公民。产品功能被赋予了更多的优先权。但是,由于越来越复杂的攻击和各种严格的合规要求,公司正在适应左移安全策略。端到端加密、强大的 RBAC、IAM 策略、治理和审计、NIST、CIS、ISO27001 等基准的实施很常见。容器安全、策略即代码、云治理和供应链安全是热门话题。
编程
DevOps 或 SRE 角色现在正在考虑开发人员的跨领域关注点,并创建有助于在执行标准的同时提高生产力的工具。制作高质量的平台组件需要良好的软件工程实践和技能。
我不能对此给予足够的压力。优秀的组织正在寻找具有良好编程经验的平台工程师。这在站点可靠性工程中也很重要,您需要精通编程,能够阅读、理解和调试他人编写的代码,并在必要时对其进行修复。
Python 和 Golang 是最流行的。我的建议是 Golang,因为它具有强大的并发性、严格的类型检查、在各种组织中的采用、工具链以及许多主要项目都是使用 Golang 构建的特性,因此通过 Python 学习是有意义的。
您可以尝试一些简单的事情:
用您的编程语言编写 CLI。
学习编写 REST API 并与数据库交互
并行性和并发性
基础设施即代码
Terraform 是项目中的标准。一旦你理解了这个概念,就很容易适应任何其他工具,因为它们中的大多数都是基于 DSL 的。
云
大多数云以相同的方式工作。因此,如果您熟悉一种云,您可以轻松地与其他云提供商合作。专注于如何以高度可用、弹性、安全且经济高效的方式使用云原生组件设计应用程序。
技术写作
您可能想知道为什么我在讨论 DevOps 时要谈论技术写作。很多人对此并没有给予足够的重视,但这对于你如何与其他团队进行沟通和合作非常重要。工作的未来是远程的,电子邮件、闲散/团队、聊天是与他人交谈和传达想法的主要渠道。
您可能会定期创建诸如运行手册、事后分析、RFC、架构决策记录和软件设计文档等文档。一个清晰、易于理解的文档可以创造奇迹。它可以帮助您节省您和读者的时间并提高整体生产力。建议你阅读这篇文章。
现场可靠性工程
DevOps 和 SRE 之间的界限越来越窄。在某些组织中,同一个人可能同时担任这两个角色。了解 SLI、SLO 和错误预算以及 SRE 实践背后的概念。每个组织的做法都不一样,所以我不建议将其他人的文化复制粘贴到您的团队中。参考 Google SRE 文化。
结论
就个人而言,我很高兴能在今年跟随。这不是一个确定的列表,因为它会随着时间而变化。
服务网格——Istio、Cilium Sidecarless 网格、Tetrate 和 Solo 的 Gloo 网格产品。
如何提高开发人员的生产力?它是文化、自动化和工具的混合体。
SRE 平台——蜂窝,Last9。
DevPortals——再次与提高生产力和弥合知识差距的动机相关联。
可观测性——诸如开放遥测、超跟踪、灭霸、VictoriaMetrics、Vector 等技术。
安全性——供应链安全、代码签名、加强云安全。
Golang——提高当前技能。
无服务器计算和事件驱动架构
Web3 — 了解与 DevOps 和基础设施相关的环境
保持好奇心并不断学习。持续一口大小的学习很容易,您可以在全职工作的同时进行。如果您仍有任何疑问,请随时与我预约时间。我很乐意提供帮助。
评论