准「AI 时代」下,如何衡量程序员的工作效率和生产力?
近 20 家科技、金融和制药公司实施了新的研发效能管理方法,并取得了令人鼓舞的初步结果。
客户报告的产品缺陷减少 20%-30%;
员工体验分数提高 20%;
客户满意度评分提高 60 个百分点。
大模型和 AIGC 技术催生了软件研发的新范式,也让研发管理的复杂度急剧攀升。尽管有研究称,Copilot X 和 ChatGPT 等生成式 AI 工具有望将开发者完成任务的速度提高两倍,但在引入合适的 AI 应用和工具之前,研发管理者们可能首先要回答,「如何判断 AI 工具确实为组织提效产生了助力? 」
准「AI 时代」下,「AI + 研发效能」很可能成为企业构建核心竞争力的角逐高地。而如何科学、全面且准确地衡量开发者和研发团队的工作效率与生产力正是研发效能治理中的重要命题。
麦肯锡在最近的一次研究中,对现有的两组生产力指标模型进行拓展和补充,构建了端到端的开发者工作效率与生产力视图。报告称,该方法很容易通过调查问卷或沉淀在研发管理工具中的过程数据进行部署,无需引入大量的技术堆栈或工具设备。
麦肯锡:开发者工作效率与生产力视图
基于 DORA 指标和 SPACE 指标,麦肯锡拓展补充了 4 个以机会为中心的度量指标(Opportunity-focused metrics),并按照系统级、团队级和个人级对所有指标进行分类和归集,最终得到能够确定如何改进产品交付方式以及明确改进价值的开发者工作效率与生产力视图。
01 DORA 指标
DORA 指标由谷歌的 DevOps 研究与评估团队经多年的调研与分析总结提出,是技术领域最接近标准的量化管理框架,它们在衡量研发成果方面表现出色。
DORA 指标涉及吞吐量和稳定性两个方面,包含部署频率、变更前置时间、服务恢复时间和变更失败率四个关键指标。 当 DORA 指标返回的结果不理想时,就意味着需要调查问题的原因,而这通常需要花很长时间。
02 SPACE 指标
SPACE 指标由 GitHub 和 Microsoft Research 提出,用于增强 DORA 指标。SPACE 是满意度(Satisfaction)、绩效(Performance)、活动(Activity)、沟通(Communication)和效率(Efficiency)的缩写;其中每个维度都包含若干个适用于个人、团队或系统级别的不同指标。
Satisfaction and well-being 满意度和幸福感
Performance 绩效
Activity 活动
Communication and collaboration 沟通和协作
Efficiency and flow 效率和流程
将个人视角(特别是开发者的幸福感)考虑在内,SPACE 指标能很好地说明组织是否得到优化。
03 机会导向指标
麦肯锡从多个视角对研发过程进行了细致入微的观察,并提出四个机会导向指标:研发内/外循环耗时、开发者速率指数、贡献分析和人才能力得分。
研发内/外循环耗时:Inner/outer loop time spent
报告指出,为了确定需要改进的具体领域,完整的软件开发流程可以视为两个循环。研发内循环包括与创建产品直接相关的活动:编码、构建和单元测试;外循环则包括开发人员将代码推向生产所必须完成的其他任务:集成、集成测试、发布和部署。
于开发者而言,内循环是构建产品,直接产生价值的过程,而外循环虽然必要,但却充满了繁杂琐事。因此从生产力和个人体验的角度来看,企业应尽可能改进外循环的工具和自动化,以便让开发者能在内循环活动上投入更多时间。其中,顶级科技公司的目标是让开发者将多达 70% 的时间花在内循环活动上。
2. 开发者速率指数:Developer Velocity Index
开发者速率指数(Developer Velocity Index,DVI)研究是一项衡量企业技术、工作实践和组织支持程度的调查。
DVI 涉及 3 大方面、13 个能力领域的 46 项驱动因素,并由这 46 项影响因子加权平均而得,可与同行进行对标。 这种比较有助于发现特定的机会领域,如待办事项管理、测试或者安全性和合规性等方面。
3. 贡献分析:Contribution analysis
评估个人对团队待办事项的贡献(从 LigaAI 等研发管理工具中获取数据,并使用专有算法对数据进行标准化)有助于揭示阻碍团队能力优化的趋势,并使团队领导者对产出有清晰的预期,从而提高绩效表现。
此外,它还有助于管理者辨析个人技能提升或培训的机会,重新思考团队内的角色/任务分配。例如,质量保证测试人员是否有足够的工作可做。
4. 人才能力得分:Talent capability score
该得分是基于行业标准能力地图,对特定组织的个人知识、技能和能力的总结。理想情况下,组织应追求「钻石分布」,即大多数开发人员处于中等能力范围。这样有助于洞悉辅导和提高技能的机会,在极端情况下,可能需要重新思考人才战略。
# 写在最后
上周,OpenAI 公布了 GPTs、Assistants API 和 GPT-4 Turbo 模型等一系列关键技术和产品更新,让 AI 圈再次沸腾。
几乎可以预见的,基于大模型的 AIGC 技术和应用会逐步融入开发者和研发团队的日常工作,成为团队基因的一部分。面对来势汹汹的 AI 浪潮,研发管理者正迫切地需要建立科学的度量指标体系,以更直观地洞察开发者和研发团队的工作效率与生产力。或许,这样就能更清晰地回答:
影响程序员发挥出最佳水平的障碍是什么?
文化和组织在多大程度上影响了开发者创作伟大作品的能力?
如何知道程序员的时间和精力是否花在了真正推动价值的活动上?
如何知道组织是否拥有所需的所有开发人才?
LigaAI 将持续分享研发效能管理、研发管理实践干货、技术管理成长进阶等内容,欢迎关注我们。 别忘了点击 LigaAI-新一代智能研发协作平台,可以试用我们的产品哟~~~~~~
版权声明: 本文为 InfoQ 作者【LigaAI】的原创文章。
原文链接:【http://xie.infoq.cn/article/c4c9a77249e4a6b619aa9ad6e】。未经作者许可,禁止转载。
评论