写点什么

10 万字干货:《数字业务连续性提升最佳实践》免费领取|TakinTalks 社区

  • 2023-04-21
    浙江
  • 本文字数:2429 字

    阅读完需:约 8 分钟

一分钟精华速览

首刊限版 400 本,没有电子版下载。100 本作为社区福利,免费领取,领完即止!不加印。



为什么会有这本刊物?

TakinTalks 社区是由业内专家共同发起的、专注业务稳定性提升的技术交流平台。面向技术管理者和一线从业者,定期探讨行业前沿的技术,分享最新的、可参考的、可落地的实战经验。

我们主张技术人要关注技术,更要关注技术和代码带来的业务价值。正是由于业务的某些强烈需求,才推动技术的发展与落地,所以业务连续性应是所有技术团队都应该关注的共同目标。本刊正是在这个大前提下策划完成。社区联合了多家头部企业的技术团队,从业务视角去审视技术的落地效果,也从各种不同的技术角色视角,去看技术对业务连续性的贡献和支撑。

这是一本什么样的刊物?

2022 年初到现在,在走访了数百位技术管理者、交流了上千位社区粉丝后,经过整整 1 年的筹备,社区首刊终于出炉,在今天和大家见面了!本期首发特刊 10 万余字,足有 152 页之多!

第一批小范围发布的 300 本,仅仅 2 天已经被各家技术支持单位几乎抢定一空!一周前的粉丝群预热中,也再次掀起了一波“预定”热潮,大家的需求度之高,确实远超我们的预期。



今天《数字业务连续性提升最佳实践》

正式公开发布!


作为首刊特发版本,只公开限量发布 400 本。其中,预留的 100 本作为社区福利送给社区读者,赠送完就结束,后续不再加印!请注意,每家企业的同一个技术团队,只限领取 1 本。免费申领!

实物长什么样?














行业专家怎么评价它?

杨德华——TakinTalks 稳定性社区发起人

“太阳底下没有新鲜事。今天的任何一个问题,你扒掉它的外壳,都有一个可能并不新鲜的内核。” 我个人深以为然,尤其 TakinTalks 社区成立以来,与数百位技术管理者和一线专家深度交流后,我更坚定地认为,历史就是最好的老师,别人在实践中总结的经验就是最好的教材。个人提升认知,需要和更多牛人在一起,在别人的实践和思考中去找到可以学习的对象,优秀者对我们潜移默化的影响,是巨大的。

王海清——中国信通院 混沌工程实验室负责人

系统稳定性保障是现代软件开发中最难以解决的问题之一,也是保障用户体验的重要因素。掌握系统稳定性保障技术,不仅可以提高软件开发的效率,还可以提高软件的质量和可靠性。研究和推广“稳保”技术也是中国信通院混沌工程实验室一直专注的工作。本案例集锦是一本系统稳定性保障领域最佳实践的汇总,旨在帮助读者掌握系统稳定性保障技术体系,了解系统稳定性保障的基本方法,以及如何在实际开发中应用这些技术。适合软件开发人员、测试工程师、系统管理员、运维工程师等从事系统开发、测试、运维等工作的人员阅读。案例是经验的积累,也是成功的源泉。希望这些优秀案例能够给读者带来灵感和启示,帮助更多稳定性领域从业人员在工作中取得更好的成果。

戚勇——中国联通软研院 运营保障与调度中心总经理

在数字化经济时代,业务连续性对于企业来说至关重要。作为中国联通,我们深知业务中断对客户体验和品牌形象带来的影响。《数字业务连续性最佳实践》提供了最新的实践和见解,它介绍了大量的工具和技术,详细讲解了如何构建维护稳定和可靠的高可用性系统,涵盖故障防范、故障感知、故障止损、故障复盘等方面的内容,为企业带来了宝贵的指导和帮助。我们相信这本刊物将为中国联通及其他企业提供有价值的信息,帮助企业更好地应对数字业务中断的挑战,保障业务连续性,提升客户满意度和品牌影响力。

张观石——《SRE 原理与实践》作者、前虎牙 SRE 负责人

系统可靠性、业务连续性不可能依靠某个大招一蹴而就,而是需要各方面能力都做到足够优秀。我在《SRE 原理与实践:构建高可靠性互联网应用》一书中提到出了 6 种能力——可靠性设计能力、观测能力、修复能力、反脆弱能力、保障能力、管理能力。本刊正是在多个能力方向上的实战探索合集,收录了十几家中大型企业的经验精华。案例中包括了负载均衡、应用、数据、大数据、计算平台,所讲的方法涉及了故障治理、容灾、混沌工程、容量、压测、监控告警等等。经过编委会专业而又精心的编排,相信对读者具有很好的参考作用。

是否有电子版?

社区刊物为限量纸质版,暂时不考虑电子版公开下载。

内容有哪些亮点?

  • B 站在数据库故障治理方面做了什么?

  • 美图在“818”A 级 818 故障前、故障后都做了啥?

  • 中国人寿在落地无侵入压测中遇到了哪些难点?

  • 微盟全链路压测遇到了哪些挑战,都是怎么解决的?

  • 美图压测监控一体化平台建设前后,工作流程有哪些差别?

  • 去哪儿落地混沌工程的阶段路线是怎么设计的?

  • 去哪儿大规模演练遇到了哪些典型问题?

  • B 站的监控告警平台目标和指标是怎么设定的?

  • 阿里云亿级调用量下是怎么做预警治理的?

  • B 站高可用方案是怎么做的?怎么起作用的?

  • 浙江移动 1W+微服务系统是怎么保障的?

  • B 站大型活动的应急预案是怎么做的?

  • 怎么有效降低故障的影响?

  • 故障后的复盘该怎么进行?

  • 复盘有哪些关键流程?怎么落地?

谁对本刊有贡献?

编委会:(排名不分先后)

杨德华 TakinTalks 社区发起人

陆学慧 杭州数列科技 CTO

陈 阳 亚马逊云资深数据库专家

武安闯 哗哩哔哩业务 SRE 负责人

朱仕智 去哪儿网高级技术总监

吕 帆 哔哩哔哩直播 B&C 端架构组 leader

石 鹏 美图高级运维经理

联合作者:(排名不分先后)

王志广 哔哩哔哩数据库负责人

熊军军 中国人寿 寿险研发中心高级工程师

张维功 前得物稳定性测试团队 Leader

赵金龙 微盟非功能测试负责人

陈潮兵 美图系统研发技术专家

史军艇 浙江移动 SRE 架构师

付亚南 去哪儿网资深质量保障专家

李成武 阿里云弹性计算管控 SRE

李道兵 品道科技高级技术总监

孟 闯 哈啰技术风险负责人

怎么免费领取?

免费申领人必须符合以下条件:

1、CTO、SRE、架构师、质量、业务、研发、测试、运维等技术部门相关职位;

2、稳定性相关项目负责人;(请提供名片或者工牌)

3、朋友圈转发本文;

4、邮费到付。

如您满足以上条件,请您联系社区小伙伴



不符合免费申领条件?

我们准备了 20 本纸质版,作为社区特别福利。

参与抽奖步骤如下:

1、朋友圈转发本文;

2、截图给社区小伙伴,获取抽奖链接;(4 月 26 日统一开奖)

3、邮费到付。

参与抽奖活动,请您联系社区小伙伴


用户头像

公众号:TakinTalks稳定性社区 2020-03-03 加入

聚焦SRE和故障的技术交流社区

评论

发布
暂无评论
10万字干货:《数字业务连续性提升最佳实践》免费领取|TakinTalks社区_TakinTalks稳定性社区_InfoQ写作社区