关于研发效能
上周六参加了南京 GTLC,听了陈东老师的分享《研发效能的度量体系建设实践》的分享,受益匪浅,整理了一些笔记,方便以后查阅。
为什么要有度量体系?
现在企业都在讲“降本增效”,但是怎么降本,怎么增效,无从下手,本质还是缺少数字化手段,缺少数据支撑。 而建立度量体系目的是将研发人员的工作量化,可视化,为绩效评估,产能提升提供参考,替代纯拍脑袋做决策的方式。
度量体系需要什么样的指标?
有四个维度的指标: 响应力,质量, 产能和成本。
按照以客户为中心的原则,这四个指标的重要性排序是: 质量 > 响应力 > 产能 > 成本。
编者说: 作为 To B 的公司来说,质量和响应力确实是两个最关键的指标,也是影响客户体验的指标。 质量反应的是系统的稳定性,响应力反应的是响应客户的速度。
其中质量和响应力是两个互补的指标。 如何理解呢?试想一下,如果质量没有做到位,系统不稳定,天天出 bug,研发都忙于救火,后续需求的响应又怎么能够及时?只有系统做稳定,后面还有足够的精力和时间响应,而只有能够及时响应处理问题,系统的稳定性才能得到更好的提升。
度量指标如何细化和挑选?
如果将响应力和质量指标再进行细化,那么
响应力指标又可以分解成需求的按时完成率 + 需求的交付时长。
质量指标又可以分解成故障数量+故障时长。
如果再往下拆解,我们可以按工作流程为度量建立研发流程的度量。
其中关于缺陷密度,缺陷逃逸率和故障数量这三个指标做进一步的说明。
缺陷密度: 如果用(加权缺陷数➗代码行数)来度量,势必会带来负面导向,比如变相鼓励工程师增加代码行数来降低缺陷密度,因此这里的缺陷密度指标采用(加权缺陷数➗工作量), 工作量是功能点+代码行的均衡评估结果(这种评估方式下,一个简单功能点用 1000 行代码实现显然是不被鼓励的)
缺陷逃逸率: 因为在预发环境,灰度环境和生产环境出现的缺陷都能被客户感知到,所以这个缺陷逃逸率定义为(生产缺陷数➗(测试缺陷数+发布缺陷数),其中发布缺陷数为预发,灰度,生产三个环境的发现的缺陷之和
故障数量:简单的数量统计指标稀疏,且指标滞后,不利于后续的观测和统计。 因此拆解为时间响应力(紧急告警的处理时间)+ 事件处理时长 + 事件复盘分析完成时长 + 事件改进项完成时长。 这些指标便于后续的跟踪改进,也方便对事件的生命周期进行响应力和质量的管理。
度量体系如何落地?
工具+流程+组织,来构建度量体系。
指标的调优 + 系统的支撑 + 能力的培养 + 流程的优化。
第一,要建立原则。要遵循价值导向,体现痛点,比如以客户为中心的原则。还有可以从团队工作流程切入,分层设计,持续迭代。
第二,建立整体架构。有对外的结果指标(核心是质量和响应力),也有对内的支撑指标(产能和成本)、
第三是指标的选取和调优。 尽量选择客观的指标,尽量能覆盖全局,需要有一些制衡的指标,需要可以频繁观测的指标。
第四是系统的搭建。 通过工具和系统实现度量工作的系统化,可视化和自动化,比如在流程流转时能够自动采集数据,记录工时,比如用机器分析替代人工分析,再比如不达标时的邮件提醒等。
第五是日常的运营。确认责任主体,做周期性的跟进,和部门的绩效绑定。
编者说: 对于小团队或者初创团队来说,现在没有人力去构建一套完整的度量体系和自研一套系统,但是其方法论我认为是适用的,数字化提供了一个新的技术管理观察视角,而本质的目的是为了更好的支撑业务,更好的体现和评估技术团队的价值。 后续我尝试在平时的团队管理里去推行这套方法论,摸索出一套适合自身的度量体系。
------全文完------
讲师的 PPT 可以关注“TGO 鲲鹏会”公众号下载。
版权声明: 本文为 InfoQ 作者【hackstoic】的原创文章。
原文链接:【http://xie.infoq.cn/article/836a9556e2107400789023616】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论