写点什么

五面阿里拿下飞猪事业部 offer,腾讯 Redis 压轴笔记

用户头像
极客开源
关注
发布于: 刚刚

微服务的发展

微服务倡导将复杂的单体应用拆分为若干个功能简单、松耦合的服务,这样可以降低开发难度、增强扩展性、便于敏捷开发。当前被越来越多的开发者推崇,很多互联网行业巨头、开源社区等都开始了微服务的讨论和实践。

微服务落地存在的问题

虽然微服务现在如火如荼,但对其实践其实仍处于探索阶段。很多中小型互联网公司,鉴于经验、技术实力等问题,微服务落地比较困难。


如著名架构师 Chris Richardson 所言,目前存在的主要困难有如下几方面:


  • 单体应用拆分为分布式系统后,进程间的通讯机制和故障处理措施变的更加复杂。

  • 系统微服务化后,一个看似简单的功能,内部可能需要调用多个服务并操作多个数据库实现,服务调用的分布式事务问题变的非常突出。

  • 微服务数量众多,其测试、部署、监控等都变的更加困难。


随着 RPC 框架的成熟,第一个问题已经逐渐得到解决。例如 springcloud 可以非常好的支持 restful 调用,dubbo 可以支持多种通讯协议。关注公众号码猿技术专栏获取更多面试资源。


对于第三个问题,随着 docker、devops 技术的发展以及各公有云 paas 平台自动化运维工具的推出,微服务的测试、部署与运维会变得越来越容易。


而对于第二个问题,现在还没有通用方案很好的解决微服务产生的事务问题。分布式事务已经成为微服务落地最大的阻碍,也是最具挑战性的一个技术难题。

ACID

  • 原子性(Atomicity):?一个事务的所有系列操作步骤被看成是一个动作,所有的步骤要么全部完成要么一个也不会完成,如果事务过程中任何一点失败,将要被改变的数据库记录就不会被真正被改变。

  • 一致性(Consistency):?数据库的约束 级联和触发机制 Trigger 都必须满足事务的一致性。也就是说,通过各种途径包括外键约束等任何写入数据库的数据都是有效的,不能发生表与表之间存在外键约束,但是有数据却违背这种约束性。所有改变数据库数据的动作事务必须完成,没有事务会创建一个无效数据状态,这是不同于 CAP 理论的一致性"consistency".

  • 隔离性(Isolation):?主要用于实现并发控制, 隔离能够确保并发执行的事务能够顺序一个接一个执行,通过隔离,一个未完成事务不会影响另外一个未完成事务。

  • 持久性(Durability):?一旦一个事务被提交,它应该持久保存,不会因为和其他操作冲突而取消这个事务。很多人认为这意味着事务是持久在磁盘上,但是规范没有特别定义这点。

一致性理论

分布式事务的目的是保障分库数据一致性,而跨库事务会遇到各种不可控制的问题,如个别节点永久性宕机,像单机事务一样的 ACID 是无法奢望的。


另外,业界著名的 CAP 理论也告诉我们,对分布式系统,需要将数据一致性和系统可用性、分区容忍性放在天平上一起考虑。


两阶段提交协议(简称 2PC)是实现分布式事务较为经典的方案,但 2PC 的可扩展性很差,在分布式架构下应用代价较大,eBay 架构师 Dan Pritchett 提出了 BASE 理论,用于解决大规模分布式系统下的数据一致性问题。关注公众号码猿技术专栏获取更多面试资源。


BASE 理论告诉我们:可以通过放弃系统在每个时刻的强一致性来换取系统的可扩展性。

CAP 理论

在分布式系统中,一致性(Consistency)、可用性(Availability)和分区容忍性(Partition Tolerance)3 个要素最多只能同时满足两个,不可兼得。其中,分区容忍性又是不可或缺的。



  • 一致性:分布式环境下,多个节点的数据是否强一致。

  • 可用性:分布式服务能一直保证可用状态。当用户发出一个请求后,服务能在有限时间内返回结果。

  • 分区容忍性:特指对网络分区的容忍性。


举例:Cassandra、Dynamo 等,默认优先选择 AP,弱化 C;HBase、MongoDB 等,默认优先选择 CP,弱化 A。

BASE 理论

核心思想:


  • 基本可用(?Basically?Available):指分布式系统在出现故障时,允许损失部分的可用性来保证核心可用;

  • 软状态(?Soft state):指允许分布式系统存在中间状态,该中间状态不会影响到系统的整体可用性;

  • 最终一致性(?Eventual consistency):指分布式系统中的所有副本数据经过一定时间后,最终能够达到一致的状态;

  • 原子性(A)与持久性(D)必须根本保障;

  • 为了可用性、性能与降级服务的需要,只有降低一致性( C ) 与 隔离性( I ) 的要求;

  • 酸碱平衡(ACID-BASE Balance);


BASE 是对 CAP 中 AP 的一个扩展

一致性模型

数据的一致性模型可以分成以下三类:


  • 强一致性:数据更新成功后,任意时刻所有副本中的数据都是一致的,一般采用同步的方式实现。

  • 弱一致性:数据更新成功后,系统不承诺立即可以读到最新写入的值,也不承诺具体多久之后可以读到。

  • 最终一致性:弱一致性的一种形式,数据更新成功后,系统不承诺立即可以返回最新写入的值,但是保证最终会返回上一次更新操作的值。


分布式系统数据的强一致性、弱一致性和最终一致性可以通过 Quorum NRW 算法分析。

本地事务


  • 在单个数据库的本地并且限制在单个进程内的事务

  • 本地事务不涉及多个数据来源

分布式事务典型方案

  • 两阶段提交(2PC, Two Phase Commit)方案;

  • 本地消息表 (eBay 事件队列方案);

  • TCC 补偿模式;


分类:


  • 两<typo id="typo-2498" data-origin="阶段型" ignoretag="true">阶段型</typo>

  • 补偿型

  • 异步确保型

  • 最大努力通知型


服务模式:


  • 可查询操作

  • 幂等操作

  • TCC 操作

  • 可补偿操作

最后

小编精心为大家准备了一手资料




以上 Java 高级架构资料、源码、笔记、视频。Dubbo、Redis、设计模式、Netty、zookeeper、Spring cloud、分布式、高并发等架构技术


【附】架构书籍


  1. BAT 面试的 20 道高频数据库问题解析

  2. Java 面试宝典

  3. Netty 实战

  4. 算法



BATJ 面试要点及 Java 架构师进阶资料



本文已被CODING开源项目:【一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码】收录

用户头像

极客开源

关注

还未添加个人签名 2021.03.18 加入

还未添加个人简介

评论

发布
暂无评论
五面阿里拿下飞猪事业部offer,腾讯Redis压轴笔记