TDSQL | ‘‘微盟式’’SaaS,让商业变得更智慧
在助力企业数字化转型的共同目标下,越来越多的服务商正走向更加紧密的合作。而面对海量数据爆发式的成长,以往单一的 SaaS 产品很难直接满足企业的业务需求,在某些场景下,无论是性能、安全还是稳定性,都面临着各种各样的问题。
日前,拥有多种企业特性的微盟 SaaS 工具却屡次获得用户认可,这是怎么做到的?以下将带来微盟余成真先生的分享实录:
微盟做为中国领军企业云端商业及营销解决方案 SaaS 提供商,现有员工超过 1 万人,入驻商户超过 300 多万家,在商业产品这块 SaaS 类云产品,能够为用户提供精准营销服务。
SaaS 是一种全新的通过 Internet 提供软件服务的模式,主要面向企业级客户。微盟业务特色是营销数字化,通过多样营销插件,赋能企业实现数字化运营 ,让商业变得更智慧。业务多样及复杂性,也使得数据库面临诸多挑战,而微盟很多核心的接口都是毫秒级别的响应,落地到数据库可能就是几毫秒甚至纳秒级别。
稳定、高可用也是 DBA 提供数据库服务基本能力,高可用依赖于云数据库能力,实现了异地多活、双活的架构,通过对高可用应用厂商调研,包括通过边缘业务实际演练,都证明这种高可用架构是非常成功的。
其次是微盟对数据安全追求,数据安全是微盟极度重视的重点项目之一,我们严格要求对于人员安全、数据库安全进行长期治理。比如说微盟数据库分类分级、线上数据查询精确授权、故障数据库备份场景演练、运维操作风险控制等等,都是属于微盟治理项目的内容。
最后一块海量数据库运维带来的挑战,因为微盟涉及到数据库实例数量多、类型多,业务线多,管理好这些原数据是 DBA 做好工作的先决条件,也是做好精细化运维的基础数据。有了这些数据,可以将一些数据库使用问题、巡检报告的风险分析,及时传导给业务域,去进行数据治理,降低故障,从而打磨出一个稳定、高可用产品。
比如说腾讯云 MySQL 的优化,主要通过硬件选型、参数、服务器进行优化,以此达到选型优化目的。同时还有业务 SQL 优化,前面讲到微盟核心接口都是毫秒级别响应,所以对于业务 SQL 是要长期治理,微盟也形成了一套自己的 SQL 优化跟进机制。扩展:并不是说完成所有优化,业务就满足了,高 QPS 读也是需解决的实际问题,用云原生数据库 TDSQL-C 来解决读能力扩展问题。众所周知,社区版 MySQL 对数据延迟不可控,而微盟现在用云原生数据库 TDSQL-C 解决了延迟不可控的问题。
因为微盟使用了扩展的只读能力,使业务应用只读的场景变得更多,同时提升了资源使用率,这也是一种降本的表现,云原生数据库 TDSQL-C 在极速扩缩容、海量存储应用上是非常便捷的。
微盟还使用一款产品是 TDSQL-H,这种产品可以解决某些业务 AP 类查询资源使用高的痛点,通过数据传输工具 DTS 或 CDC,将 TP 与 AP 场景进行无缝结合,实现全场景使用闭环。
数据库性能优化目标总结起来是三点:降本、增效、达标。通过不断 SQL 优化,不仅使数据库服务本身更加稳定,也降低资源使用率,能够精确资源配置,达到降配降本目的。在增效这块,微盟对实例进行打标签,根据实例标签属性:重要实例、非重要实例、核心实例、高流量实例等等,为实例扩缩容提供一些依据,也为运维资源分配提供重要理论数据,实现重点资源重点运维,达到运维增效的目的。
前面讲到优化,可能带来最直观效果就是告警数量的减少,告警数量减少意味数据库服务的达标。在优化过程中,微盟也衍生出很多治理方案及项目,比如说做慢 SQL 的治理,包括去定位 DBA 跟进人等。
监控和告警治理方面,监控是依赖于腾讯云 API 接口做本地数据落地,监控治理可对业务域监控数据输出,微盟基于需求监控数据可以动态形成各种各样报表,比如说实例可以基于监控数据进行全资源风险巡检,可以动态多维度查看本地监控数据,去看 TOP 级 QPS、CPU 应用实例,达到掌控优化整个集群目的,同时对外我们也可以提供数据监控接口的能力,还能监测云监控本身服务的高可用。
在告警治理这块,微盟将云上告警落到本地,这样可以对业务域进行定向维度告警,同时也可以做基于资源、时间维度、业务维度、告警指标维度的全方向实例分析,最终目的是为服务稳定做保障。这种告警也打通至内部监控系统,比如和 cat 去做耦合,形成了全链路业务告警联动,可以通过 DBA 视角去审视业务影响情况。
SRE 运维解决方案是建立一套专业、可用的数据库管理平台,这也是各大公司已经完成或者正在做的产品。而微盟这套平台解决的是实例全生命周期管理,还有工单自动化能力,也能提供运维人员对数据库的运营能力。
高可用这一块,依赖于云数据库能力,云数据库消除了自建数据库高可用组件的运维压力。在多可用区建设方面,微盟的 DBA 角色转换为需求提出者、方案验证者、可用产品的使用者。通过云数据库高可用架构原理推演及线上边缘业务真实故障演练,也证明了多可用区的故障转移能力,同时微盟也在计划进行周期性全实例多活可用性演练。
**数据安全是微盟重点关注方向,微盟解决方案是通过定义规范化流程来保证安全,这里列举 4 个面来阐述微盟规范流程建设:**操作 SOP 流程、应急预案流程、报告总结规范、权限收敛规范。主要是通过抽象 DBA 日常运维工作事项,来进行流程化、标准化定义。从而使得每种运维操作具有清晰操作步骤、验收流程、回滚方案,能够极大的降低运维人员操作风险、使各方能监控执行的各种状态、能预知操作的风险点,达到保证数据操作安全的目的。
运维安全有两个点做阐述,一是系统风控,二是制度风控。比如说授权机制、权限分类级别、权限控制、账号权限回收、操作流程风控等等,微盟也有一套危机应急预案,在数据的恢复、还原方面;微盟在制度上面也做了很多工作,比如面试流程、人员离职流程,包括在平时工作中也会跟进运维或者 DBA 人员工作状态,也定期向所有运维人员去做制度法律的宣讲。
最后,聊一下对于云数据库使用的未来畅想。关于 TDSQL 产品前面介绍了很多,我这里也列了两点,第一点就是并行查询,据我所知,有厂商实现了并且部署在线上使用 ,并行查询理论可以提高百倍查询速度,这对用户来讲吸引力非常大,相信腾讯云厂商也是有能力把这块给到我们的企业用户。
另外一块就是 HTAP 场景,因为 SaaS 行业的特殊性,对于 AP 类查询功能会越来越多,查询时效也会越来越高,而对于 AP 型数据库的要求,则是希望 TDSQL 这一系列产品最终实现一体化,让用户能够通过一个简单的配置或者一个简单的购买就能实现 HTAP 的能力。
评论