写点什么

LeSS 敏捷框架高效生产力实践

作者:俞凡
  • 2023-03-12
    上海
  • 本文字数:6074 字

    阅读完需:约 20 分钟

每个团队可能都有一套适合自己的敏捷方法,本文介绍了 ResponseTap 工程团队通过采用 LeSS 框架、引入准备周,从而提升迭代冲刺研发效能的实践。原文: LeSS Agile, More Productive — Part 1: Pain, LeSS Agile, More Productive — Part 2: Promise, LeSS Agile, More Productive — Part 3: Productivity


我们在 ResponseTap 一直使用基于 Scrum 的敏捷方法论(Agile Scrum Methodology) ,但却逐渐演变成我们自己的敏捷风格,这真的让人很痛苦。


接下来我们会讲述 ResponseTap 工程团队如何采用LeSS框架重新为混乱的流程带来秩序的故事。



我们的痛点:


  • 多年不断发展的软件开发流程

  • 每个人都有不同的想法

  • 马上就做(JFDI, Just Focus and Do It)




我们的敏捷


记不清有多少次听到这样的对话了。


这个新功能很紧急,能不能跳过测试,更快发布?


或者...


我们不能让流程成为阻碍,如果不修复这个错误,"客户 A"就会取消订单!


还有其他一千种表达方式: 我想让你做的事情太重要了,不能因为"流程"而放慢速度。 这些对话通常以某人说出下面这句貌似正确的话结束:


好吧,这看起来一点都不敏捷!


这就是问题所在,对于团队中的许多人来说,敏捷意味着无论何时我们都应该去做我们认为应该做的事情。这听起来很敏捷,但一段时间后就变成了混乱,这当然不是敏捷方法论。


我们过去经常这么处理: 这个流程很尴尬,无法处理 X 情况,所以我们会改变流程。当过了一个迭代周期后,遇到了类似情况,我们就再次改变流程。


不出意外的话,不久之后,流程就会变得复杂、矛盾,而且很难帮助我们交付软件。对快速交付、快速行动和适应变化的热情蒙蔽了我们的判断,使我们陷入困境。


争论越来越多...



我们无意中营造了一个没有确定性的环境,即使相似的的问题曾经出现过,也必须重新解决每个问题,因为我们没有确定可靠的模式。


没人喜欢这样。


我们只是例行公事的改变流程,试图为每个场合和每种可能性制定一个规则,从而迷失在复杂性中,并对支离破碎的流程失去了信心。


可以猜到后面会发生什么。我们都是充满激情的人,都想把工作做好,都想做出令人惊叹的产品。对于如何解决这个问题,我们都有自己的看法。


经常会发生同样的争论:


  • 预估的意义是什么?(我们的预估太不一致了!)

  • 是否应该在同一个迭代冲刺(sprint)中进行缺陷调查和修复?

  • 在一个 sprint 中能容纳多少东西?

  • 什么是用户故事(User Story)?


大家真的非常沮丧,甚至有一些人离开了团队。


JFDI 共和国



人人喜欢JFDI,不是吗?现在就做这件事,不要问问题。


对于缺陷,对于特性请求,甚至对于大型项目,我们都有 JFDI……想象一下这种场景……


但是,为什么?


那时候我们经常问这个问题,为什么要把所有的时间都花在突然从天而降的工作上?这个问题在当时很难回答,但事后看来,答案很简单:


待办列表(Backlog) —— 我们没有一个健康的待办列表。尽管我们在待办列表中有项目,但缺乏客观的预估方法,这意味着我们无法确定优先级。对于新的工作,也没有可靠方法来理解它相对于待办列表中其他项目的优先级。


依据门槛(Threshold of Evidence) —— 对于被认为非常重要,需要立即启动的项目,只有很少的支持依据,如果某位公司高层说这件事很重要,那就足够了。有时候,在初创公司这是可以接受的,尤其是如果领导层有良好的直觉。但对于成长型企业来说,可能具有难以置信的破坏性。


现在回想起来,这显然是管理工程团队的愚蠢方式。但是,这很难抗拒,因为我们没有办法证明 JFDI 对生产力有多大的影响。


无法证明 JFDI 如何影响工作速度,我们没有数据。





放松一下,再试一次


很明显,我们需要停一下,寻找解决方案。


Nexus


我们首先尝试的是Nexus,一种 Scrum 扩展方法,但几个月后,我们的问题依然没有解决。不是说这种方法不好,如果多给它点时间,Nexus 很可能已经解决了我们的问题。然而,我们觉得这种方法对我们的团队并不自然,因此我们继续寻找。


LeSS 框架


2018 年夏天,我们发现了 LeSS 框架。LeSS 在我们团队取得了巨大成功,使我们的生产效率更高、更可靠、交付速度更快。最重要的是,我们更快乐了:)





开始之前


我们曾经尝试修复被破坏的流程,但收效甚微。这次我们下定决心一定要成功。


我们制定了计划。


彻底改变


最初的困难在于如何逐步引入新框架,逐步采用新方法是件很困难的事情,我们需要彻底改变。


我们设置了改变的日期: 2018 年 9 月 17 日


逐步推进


在 sprint 中反复出现的一个问题是没有足够时间完成优化,只是致力于解决那些没有被正确理解的工单,因此造成如下后果:


  • 处理工单花费的时间比预期要么更多,要么更少

  • Sprint 要么时间太紧,要么不饱和


如果不解决这个问题,那注定要失败。所以,我们做了一些极端的事情,引入了准备周(Walk Weeks) 的概念。



在每 3 周的 sprint 之前,进行 1 周的准备,在此期间,我们会做任何需要做的事,为即将到来的 sprint 做准备。


准备被认为是一种临时措施,一种达到目的的手段。通过给自己这个准备时间,我们相信可以构建一个良好的待办列表。这确实有点违反直觉,放慢速度,从而帮助我们加快速度。


这并非一帆风顺,但是非常成功。我们能够利用准备时间调整好状态,事实上我们只实践了 4 次准备周,就觉得可以不需要准备周了。


教育,教育,教育


如果不相信所做的事情,就不可能取得成功。我们需要对这个框架抱有信心,需要理解相关流程。


作为一个团队,我们在一起研究框架,学习涉及到的原则,沟通每个人以及各自团队的期望。


坚定的决心


在努力保持一致(坚定遵循流程)和做出明智务实决定(被动反应)之间,是一条很难走的羊肠小道。



我们之前做出了错误的选择,反应太过积极,因此所做的任何事情都缺乏一致性。


尽管我们想要避免再次掉入这个陷阱,但对于古板的始终遵循流程的态度也非常谨慎。


因此我们制定了一些规则,试图做到两者兼顾:


  • 没有什么是神圣不可侵犯的,但同样也不应该因为一时兴起而做出改变。 改变需要证据来支持(例如,为什么这种改变会让事情变得更好?)不能仅仅因为你不同意或不喜欢某件事而改变,你需要付出努力来证明改变会如何带来改善。

  • 在 Sprint 中不进行改变。 拍脑袋的改变很少是好主意。通过将变更推迟到 sprint 结束(在回顾会议中讨论),给自己更多时间来详细考虑相关影响。


基线(Baseline)


预估是我们最大的问题和争论之一,其本身就是一个主题,所以现在不深入讨论。但是,我们预估的单位是点,而不是时间。


预估最有用的东西之一是基线。如果没有某种框架或系统来帮助进行预估,那么很可能只能拍脑袋,我们也有类似问题,因此我们的预估和盲猜差不多。



我们回顾了一些旧工单,挑出了一些典型案例,通过将它们按相对大小排列,能够建立一组基线示例工单。所以当我们下次收到一张工单,感觉看起来像 5,就可以回头看看基线,决定是不是 5,还是因为今天感觉有点乐观。


我们定期检查基线,以确保仍然相关性,并添加新的示例。


测量


如果不去测量,怎么知道有没有进步呢?怎么判断什么是好的什么是坏的?


有没有曾经听到或读到有人说:


测量所有东西(Measure everything)!


额,如果什么测量都没有(就像我们一样),怎么能理解这句话呢?


我不会这么说。当然,这可以作为一种愿望,但不是一个有用的实际起点。


我们的经验是,需要弄清楚什么是重要的,并进行测量。在这个过程中,我们在理解产出方面遇到了问题,无法定义交付了多少工作、能否改进,以及有没有变得更糟。


你怎么想的?


当我们谈论交付时,真正关心的是交付的点数。所以我们测量点数: 每次 sprint 承诺的点数和实际完成的点数。但我们知道,并不是所有 sprint 都一样(圣诞节对我们来说就是个低效的时间段)。因此,我们也记录每个 sprint 有多少人日。


例如,我们交付了 100 个点,每人每天交付 2 个点。


小心


大多数人不喜欢打卡,甚至有些人对此非常反感,因此我们不计时。基本上如果没有生病或者度假,就都算作 1 个人天。


魔法数字


每人每天的点数


这个指标可以解决请假、大工单、中断等问题。通过记录一次 sprint 完成的点数和人天,可以展示实际效率,从而可以客观看到是否在总体上有所提高。


另一个重要因素是在哪个级别定义度量。我们实际上是在团队层面收集这些数据(因为这样更容易),但我们并不关心每个团队的指标,只在部门层面关心总体上每人每天的点数。


不是全部


有太多对话都是从一个话题开始,又以另一个话题结束。我们一直不善于解决特定问题,因为我们总是被一堆其他相关问题分散注意力。


举例来说,如果 sprint 完成的点数较少,我们会认为不好。这跟我们不擅长预估有关,但将关注点转移到其他事情上并不能帮助我们从不好的 sprint 中吸取教训。


我们尽量避免这些问题。我们承认问题可能存在,也应该正视问题,但它们会分散我们对眼前问题的注意力。


例如,我们可能在预估时有问题,但并不意味着可以错过 sprint 目标。这是一件简单的事情,但它需要纪律来保持注意力。


各就各位


就这样,我们准备好开始新的冒险了!它将把我们带到哪里?成功了吗?下面会找到答案。





Sprint 1: 开始


在 sprint 之前,我们进行为期一周的调整,完善待办事项列表,以确保即将到来的 3 周 sprint 的工单处于良好状态,我们不希望一开始就被定义不清的工单所困扰。


第一次 sprint 很难避免拍脑袋,我们显然不知道团队速度会是多少,所以在 sprint 阶段只添加自认为可以交付的工单。


因为我们有 171 个人日,因此承诺了 105 个点。3 周后,交付了 92 个点。


0.54


在 Sprint 1 期间,每人每天能完成 0.54 个点,好还是不够好?由于没有可供比较的东西,因此无法确定。


我们所知道的是,第一个 sprint 总是很棘手,我们需要学会窍门并习惯这个过程。我们还进行了回顾会议,在回顾中发现总体上大家对新流程抱有积极的态度。


我们怀着乐观的心情进入下一次迭代。


Sprint 2,3,4: 一致性



每次 sprint 前都有一周的准备。事实证明,这种方法真的很有帮助,让我们有足够时间进行适当的准备,并建立一个健康的待办事项列表。


在每一次 sprint 之前,我们分别承诺要完成 148 点、137 点和 114 点,并且实现了 100%的交付。


有趣的是,每次的人日都不一样: 155、143 和 113。尽管如此,指标出奇的一致。在这些 sprint 中,每人每天完成了 0.97、0.97 和 1.02 分,表现出了明显的一致性。


连续 3 次实现 sprint 目标让我们怀疑是不是对自己太放松了,没有尽可能督促自己。然而,我们坚持自己的模式,决定不做任何草率的改变。我们做得很好,然而即将迎来第一个真正的挑战……


Sprint 5: 减速带



准备周变得越来越容易了,我们打算认真考虑是不是可以不需要准备周了。


第 5 个准备周正好赶上圣诞节假期,因此第 5 个 Sprint 开始于圣诞节后的第一周。


我们决定把准备周留到圣诞节,因为大多数团队成员都休假了,反正也做不了什么。当所有人都回到办公室时,我们直接进入 sprint 阶段。


紧张


第一周很艰难,很明显我们在圣诞准备周时没有为 sprint 做好准备。事后看来,我们不应该按时开始 sprint,因为根本没有准备好。


第二周开始,sprint 变得更加困难。团队之间存在交叉依赖,意味着他们会互相牵制,这给跨团队沟通带来了很大压力,这很糟糕,不可避免的引发了相当大的紧张状态。


艰难的决定


这次 sprint 只能兑现其承诺的一小部分。让团队在这种紧张状态下再呆两周是没有意义的,所以我们做出了一个艰难的决定,取消了 sprint。


所有未完成的工单被放回待办列表中,将 Sprint 5 的第二周改为准备周。我们要求自己在这周结束前把待办列表恢复到健康状态,这样就可以在下一周开始新的 sprint。


我们做了回顾,尽管经历了噩梦般的一周,仍然很乐观。我们意识到,问题在于未能妥善解决圣诞节假期的中断问题,事实上整个流程仍在正常运行。


Sprint 6: Run, Forrest! Run!



Sprint 5 回顾中的另一个讨论点是准备周。尽管 Sprint 5 很痛苦,但我们相信在 Sprint 6 开始时,状态已经足够好了,可以放弃准备周。就这么定了,从现在开始,我们要冲刺,冲刺,再冲刺。


我们承诺要在 Sprint 6 中完成 99 点,结果完成了 98 点。然而,我们的神奇数字已经下降到每人每天 0.85 点。


我们在回顾会上讨论了效率的变化。因为放弃了准备周,所以必须在 sprint 期间找到时间来细化我们的待办列表。在 Sprint 6 中,我们会抽空做这件事,事后来看,这相当具有破坏性。


分配细化时间


我们决定试着解决这个问题。Scrum 告诉我们,应该能够通过分配大约 10%的 sprint 时间来管理待办事项的细化,因此我们决定为每个 sprint 设置 3 个 3 小时会议来完成细化,希望这将为交付工单留出足够时间。


Sprint 7, 8, 9 and 10: 完全有效!



这些 sprint 覆盖了 12 周的时间,在这段时间里,我们效率非常高!尽管员工人数有所波动,但这些 sprint 实现了 1.6、1.37、1.26 和 1.41 的平均人效,不仅表现一致,而且还更有效率!


用于待办列表细化的时间分配系统工作得非常好。在回顾会上得到一些反馈后,我们决定如果把细化会议改成 4 个稍短一点的 2 小时会议,而不是原来的 3 个 3 小时会议,那就更好了。


健康的待办列表


理论上并不影响我们的 sprint 效率(正面或负面),但实际上确实有影响。真是个好主意!我们的待办列表一直徘徊在 150-200 点左右。这还不错,但我们想要足够 2-3 个 sprint 的待办列表,而 150 点只够一个 sprint 的。


变更为 4 个 2 小时的细化时间可能不会影响 sprint 效率,但会让健康的待办列表不断增加,到 Sprint 10 结束时,达到了 300 点。


Sprint 11: 别指望了!



到 Sprint 10 结束时,我们感觉很好,沾沾自喜,冒险已经进行了 8 个月,并且取得了成功。


但软件开发是残酷的,当你自认为已经掌控全局时,某些习惯会将你绊倒!


在 Sprint 11,我们的研效跌到了每人每天只有 0.63 个点。哎哟!


坚持到底


我们非常沮丧。在结束之前,我们就知道 sprint 并不顺利。尽管如此,我们现在有强烈信念,相信所做的是正确的,所以没有恐慌。


我们发现,两支团队最终都完成了比通常在 sprint 中完成的大得多的工单,我们是有意这么做的,分割工单意味着很强的依赖性,这正是在 Sprint 5 中伤害到团队的东西。


我们意识到这个问题只是由一个小错误引起,因此没有做任何改变。工单之间可以有强烈的依赖关系,这比大量工单要好。需要做的改变是,确保有强烈依赖的工单只被放入一个团队的 sprint 中。


成长!


这是一个简单问题的简单解决方案,但这个场景确实证明了我们在这段时间内的成长。如果没有这次冒险,我们肯定会有一些冗长痛苦的讨论,从用户故事的定义,到团队专业化,再到如果我们做错了,为什么要费心预估,以及中间的一堆其他争论。在这方面我们有了明显进步。


继续前进!


这并不是冒险的结束,生活还在继续,流程还在改进,但这个小故事即将结束了。我想给大家分享一些帮助我们扭转交付流程的经验:


  • 坚定不移: 如果有些东西被破坏了,就做出一些改变,但不要变得太多、太快。

  • 保持耐心: 冰冻三尺,非一日之寒。需要时间来证明自己,要有耐心。

  • 目标明确: 做出改变是因为你对会发生什么有深思熟虑的假设,无论如何要避免一时兴起或因为某人投入了感情而做出改变。

  • 使用回顾: 确保将讨论推迟到回顾阶段,在可能的情况下,避免持续争论。要在合适的时间和地点做事后诸葛亮!

  • 要有勇气: 做出决定需要勇气,必须向别人证明这些决定是正确的。这很难,但值得。




你好,我是俞凡,在 Motorola 做过研发,现在在 Mavenir 做技术工作,对通信、网络、后端架构、云原生、DevOps、CICD、区块链、AI 等技术始终保持着浓厚的兴趣,平时喜欢阅读、思考,相信持续学习、终身成长,欢迎一起交流学习。

微信公众号:DeepNoMind

发布于: 2023-03-12阅读数: 2
用户头像

俞凡

关注

公众号:DeepNoMind 2017-10-18 加入

俞凡,Mavenir Systems研发总监,关注高可用架构、高性能服务、5G、人工智能、区块链、DevOps、Agile等。公众号:DeepNoMind

评论

发布
暂无评论
LeSS敏捷框架高效生产力实践_敏捷开发_俞凡_InfoQ写作社区