数据人成长交流的一站式服务平台

网站首页 > 数据编程 正文

数字化转型的组织:DevOps持续学习与改进文化的重要性??

nandi88 2024-09-27 12:01:28 数据编程 47 ℃

前言

  • 持续学习与改进文化是在精益创业,DevOps模式里均重点强调的组织文化
  • 管理方法论及模式都会涉及组织文化,管理工具,组织协作的结构框架及通用模版等;如果只有工具,模版的落地,都仅仅是克隆了模样而缺少了灵魂;

建设持续学习文化的价值

  • 弥补静态预防工具的不足:

静态预防只记录了当前的理解及经验,无法覆盖所有的可能的结果

  • 建设自愈性组织:

持续地从危机或预演中总结经验和知识;有利于提升组织的自我愈合能力

  • 提升质量管理能力:

动态学习在复杂的系统中防患于未然,从而避免错误的发生

  • 建立有安全感的实践学习文化:

鼓励事前事后理性分析,进行风险评估;强调「分析/总结/沉淀」而非责任认定


DevOps组织建设持续学习和改进文化的方式

1. 逐步降低事故的容忍率:
随着团队不断地学习了如何看待问题并解决,就要逐步降低事故的容忍率;通过持续的优化及改进,捕捉到更隐蔽的信号;最终培养出,更具有解决问题能力的团队


2. 在生产环境中进行混沌工程:
通过在生产环境中引入故障;是提高可恢复性的一种方式;混沌工程通过观察组织系统在受控的故障异常测试中的行为变化,系统性地发觉组织弱点,并针对性地改进,从而提升整体的运营性;建立系统抵御失控条件能力的信心【DevOps常见的有异地容灾,失败迁移;常见的开源工具有Netflix的Chaos-Monkey(混乱的猴子)https://github.com/Netflix/SimianArmy/wiki/Chaos-Monkey】


3. 定期举行故障演练日:

  • 演练日的目标是帮助团队模拟及演练事故,使其具备实战的能力;通过构建事故场景,让团队在计划的时间内消除所有的异常;
  • 并创建必要的监控程序和故障切换程序,总结出故障所需要进行的操作,并编写成手册;将有意识的行动转变为下意识的行动

4.通过经验分享进行持续的学习:

1. 技术会议
2. 信息平台(包括聊天软件;及自动化功能)
3. 创建全公司共享的单一代码仓库(每个用户都可以方便地访问到所有的最新代码,不需要协调;同时可以融合工程师多元的专业知识;如果无法建立单一代码仓库,就必须找到另一种维护程序库的方式,例如搭建一个公司内部的PYPI库)
4. 通过企业Wiki知识库分享经验(通过将架构,测试,部署和基础设施维护的管理标准及流程的文章分享到企业的Wiki系统中,可以让经验及知识更好地分享)

Tags:

最近发表
标签列表