关于研发效能

作者：hackstoic

上周六参加了南京 GTLC，听了陈东老师的分享《研发效能的度量体系建设实践》的分享，受益匪浅，整理了一些笔记，方便以后查阅。

为什么要有度量体系？

现在企业都在讲“降本增效”，但是怎么降本，怎么增效，无从下手，本质还是缺少数字化手段，缺少数据支撑。而建立度量体系目的是将研发人员的工作量化，可视化，为绩效评估，产能提升提供参考，替代纯拍脑袋做决策的方式。

有四个维度的指标：响应力，质量，产能和成本。

按照以客户为中心的原则，这四个指标的重要性排序是：质量 > 响应力 > 产能 > 成本。

编者说：作为 To B 的公司来说，质量和响应力确实是两个最关键的指标，也是影响客户体验的指标。质量反应的是系统的稳定性，响应力反应的是响应客户的速度。

其中质量和响应力是两个互补的指标。如何理解呢？试想一下，如果质量没有做到位，系统不稳定，天天出 bug，研发都忙于救火，后续需求的响应又怎么能够及时？只有系统做稳定，后面还有足够的精力和时间响应，而只有能够及时响应处理问题，系统的稳定性才能得到更好的提升。

如果将响应力和质量指标再进行细化，那么

响应力指标又可以分解成需求的按时完成率 + 需求的交付时长。

质量指标又可以分解成故障数量+故障时长。

如果再往下拆解，我们可以按工作流程为度量建立研发流程的度量。

其中关于缺陷密度，缺陷逃逸率和故障数量这三个指标做进一步的说明。

缺陷密度：如果用（加权缺陷数➗代码行数）来度量，势必会带来负面导向，比如变相鼓励工程师增加代码行数来降低缺陷密度，因此这里的缺陷密度指标采用(加权缺陷数➗工作量), 工作量是功能点+代码行的均衡评估结果（这种评估方式下，一个简单功能点用 1000 行代码实现显然是不被鼓励的）

缺陷逃逸率：因为在预发环境，灰度环境和生产环境出现的缺陷都能被客户感知到，所以这个缺陷逃逸率定义为（生产缺陷数➗（测试缺陷数+发布缺陷数），其中发布缺陷数为预发，灰度，生产三个环境的发现的缺陷之和

故障数量：简单的数量统计指标稀疏，且指标滞后，不利于后续的观测和统计。因此拆解为时间响应力（紧急告警的处理时间）+ 事件处理时长 + 事件复盘分析完成时长 + 事件改进项完成时长。这些指标便于后续的跟踪改进，也方便对事件的生命周期进行响应力和质量的管理。

工具+流程+组织，来构建度量体系。

指标的调优 + 系统的支撑 + 能力的培养 + 流程的优化。

第一，要建立原则。要遵循价值导向，体现痛点，比如以客户为中心的原则。还有可以从团队工作流程切入，分层设计，持续迭代。

第二，建立整体架构。有对外的结果指标（核心是质量和响应力），也有对内的支撑指标（产能和成本）、

第三是指标的选取和调优。尽量选择客观的指标，尽量能覆盖全局，需要有一些制衡的指标，需要可以频繁观测的指标。

第四是系统的搭建。通过工具和系统实现度量工作的系统化，可视化和自动化，比如在流程流转时能够自动采集数据，记录工时，比如用机器分析替代人工分析，再比如不达标时的邮件提醒等。

第五是日常的运营。确认责任主体，做周期性的跟进，和部门的绩效绑定。

编者说：对于小团队或者初创团队来说，现在没有人力去构建一套完整的度量体系和自研一套系统，但是其方法论我认为是适用的，数字化提供了一个新的技术管理观察视角，而本质的目的是为了更好的支撑业务，更好的体现和评估技术团队的价值。后续我尝试在平时的团队管理里去推行这套方法论，摸索出一套适合自身的度量体系。

------全文完------

讲师的 PPT 可以关注“TGO 鲲鹏会”公众号下载。

发布于: 刚刚阅读数: 5

关注

还未添加个人签名 2017.11.24 加入

TGO深圳会员，某创业公司技术负责人, 专注领域：架构设计/技术管理/区块链/投资

发布

暂无评论