五面阿里拿下飞猪事业部 offer,腾讯 Redis 压轴笔记
微服务的发展
微服务倡导将复杂的单体应用拆分为若干个功能简单、松耦合的服务,这样可以降低开发难度、增强扩展性、便于敏捷开发。当前被越来越多的开发者推崇,很多互联网行业巨头、开源社区等都开始了微服务的讨论和实践。
微服务落地存在的问题
虽然微服务现在如火如荼,但对其实践其实仍处于探索阶段。很多中小型互联网公司,鉴于经验、技术实力等问题,微服务落地比较困难。
如著名架构师 Chris Richardson 所言,目前存在的主要困难有如下几方面:
单体应用拆分为分布式系统后,进程间的通讯机制和故障处理措施变的更加复杂。
系统微服务化后,一个看似简单的功能,内部可能需要调用多个服务并操作多个数据库实现,服务调用的分布式事务问题变的非常突出。
微服务数量众多,其测试、部署、监控等都变的更加困难。
随着 RPC 框架的成熟,第一个问题已经逐渐得到解决。例如 springcloud 可以非常好的支持 restful 调用,dubbo 可以支持多种通讯协议。关注公众号码猿技术专栏获取更多面试资源。
对于第三个问题,随着 docker、devops 技术的发展以及各公有云 paas 平台自动化运维工具的推出,微服务的测试、部署与运维会变得越来越容易。
而对于第二个问题,现在还没有通用方案很好的解决微服务产生的事务问题。分布式事务已经成为微服务落地最大的阻碍,也是最具挑战性的一个技术难题。
ACID
原子性(Atomicity):?一个事务的所有系列操作步骤被看成是一个动作,所有的步骤要么全部完成要么一个也不会完成,如果事务过程中任何一点失败,将要被改变的数据库记录就不会被真正被改变。
一致性(Consistency):?数据库的约束 级联和触发机制 Trigger 都必须满足事务的一致性。也就是说,通过各种途径包括外键约束等任何写入数据库的数据都是有效的,不能发生表与表之间存在外键约束,但是有数据却违背这种约束性。所有改变数据库数据的动作事务必须完成,没有事务会创建一个无效数据状态,这是不同于 CAP 理论的一致性"consistency".
隔离性(Isolation):?主要用于实现并发控制, 隔离能够确保并发执行的事务能够顺序一个接一个执行,通过隔离,一个未完成事务不会影响另外一个未完成事务。
持久性(Durability):?一旦一个事务被提交,它应该持久保存,不会因为和其他操作冲突而取消这个事务。很多人认为这意味着事务是持久在磁盘上,但是规范没有特别定义这点。
一致性理论
分布式事务的目的是保障分库数据一致性,而跨库事务会遇到各种不可控制的问题,如个别节点永久性宕机,像单机事务一样的 ACID 是无法奢望的。
另外,业界著名的 CAP 理论也告诉我们,对分布式系统,需要将数据一致性和系统可用性、分区容忍性放在天平上一起考虑。
两阶段提交协议(简称 2PC)是实现分布式事务较为经典的方案,但 2PC 的可扩展性很差,在分布式架构下应用代价较大,eBay 架构师 Dan Pritchett 提出了 BASE 理论,用于解决大规模分布式系统下的数据一致性问题。关注公众号码猿技术专栏获取更多面试资源。
BASE 理论告诉我们:可以通过放弃系统在每个时刻的强一致性来换取系统的可扩展性。
CAP 理论
在分布式系统中,一致性(Consistency)、可用性(Availability)和分区容忍性(Partition Tolerance)3 个要素最多只能同时满足两个,不可兼得。其中,分区容忍性又是不可或缺的。
一致性:分布式环境下,多个节点的数据是否强一致。
可用性:分布式服务能一直保证可用状态。当用户发出一个请求后,服务能在有限时间内返回结果。
分区容忍性:特指对网络分区的容忍性。
举例:Cassandra、Dynamo 等,默认优先选择 AP,弱化 C;HBase、MongoDB 等,默认优先选择 CP,弱化 A。
BASE 理论
核心思想:
基本可用(?Basically?Available):指分布式系统在出现故障时,允许损失部分的可用性来保证核心可用;
软状态(?Soft state):指允许分布式系统存在中间状态,该中间状态不会影响到系统的整体可用性;
最终一致性(?Eventual consistency):指分布式系统中的所有副本数据经过一定时间后,最终能够达到一致的状态;
原子性(A)与持久性(D)必须根本保障;
为了可用性、性能与降级服务的需要,只有降低一致性( C ) 与 隔离性( I ) 的要求;
酸碱平衡(ACID-BASE Balance);
BASE 是对 CAP 中 AP 的一个扩展
一致性模型
数据的一致性模型可以分成以下三类:
强一致性:数据更新成功后,任意时刻所有副本中的数据都是一致的,一般采用同步的方式实现。
弱一致性:数据更新成功后,系统不承诺立即可以读到最新写入的值,也不承诺具体多久之后可以读到。
最终一致性:弱一致性的一种形式,数据更新成功后,系统不承诺立即可以返回最新写入的值,但是保证最终会返回上一次更新操作的值。
分布式系统数据的强一致性、弱一致性和最终一致性可以通过 Quorum NRW 算法分析。
本地事务
在单个数据库的本地并且限制在单个进程内的事务
本地事务不涉及多个数据来源
分布式事务典型方案
两阶段提交(2PC, Two Phase Commit)方案;
本地消息表 (eBay 事件队列方案);
TCC 补偿模式;
分类:
两<typo id="typo-2498" data-origin="阶段型" ignoretag="true">阶段型</typo>
补偿型
异步确保型
最大努力通知型
服务模式:
可查询操作
幂等操作
TCC 操作
可补偿操作
最后
小编精心为大家准备了一手资料
以上 Java 高级架构资料、源码、笔记、视频。Dubbo、Redis、设计模式、Netty、zookeeper、Spring cloud、分布式、高并发等架构技术
【附】架构书籍
BAT 面试的 20 道高频数据库问题解析
Java 面试宝典
Netty 实战
算法
BATJ 面试要点及 Java 架构师进阶资料
评论