写点什么

架构师第十一周作业

用户头像
_
关注
发布于: 2020 年 12 月 06 日

作业一:

(至少完成一个)

导致系统不可用的原因有哪些?保障系统稳定高可用的方案有哪些?请分别列举并简述。

原因:硬件故障,软件 bug,系统发布,并发压力,网络攻击,外部灾害


方案:

解耦:高内聚,低耦合的组件设计原则;面向对象基本设计原则;面向对象设计模式;领域驱动设计建模

隔离:业务与子系统隔离;微服务与中台架构;生产者与消费者隔离;虚拟机与容器隔离

异步:多线程编程;反应式编程;异步通信网络编程;事件驱动异步架构

备份:集群设计;数据库复制:cap 原理

failover 失效转移:数据库主主失效转移;负载均衡失效转移;如何确认失效,需要转移?zookeeper 选主服务器的方式;设计无状态的服务


事务补偿

传统事务的 acid

原子性 atomicity,一致性 consistency,隔离性 isolation,持久性 durability

分布式事务的 base

基本可用 basic availability,软状态 soft-state,最终一致性 eventual consistency

事务补偿:通过执行业务逻辑逆操作,使事务回滚到事务前状态

                                                                                       

重试

远程服务可能由于线程阻塞,垃圾回收或者网络抖动,而无法及时返还响应,调用者可用通过重试的方式修复单词调用的故障

上游调用者超时时间要大于下游调用者超时时间之和


熔断

当某个服务出席那故障,响应延迟或者失败率增加,继续调用这个服务会导致调用者请求阻塞,资源消耗增加,进而出现服务级联失效,这种情况下使用断路器阻断对故障服务的调用

断路器三中状态:关闭,打开,半开


限流

在高并发的场景下,如果系统的访问量超过了系统的承载能力,可以通过限流对系统进行保护。限流是指对进入系统的用户请求进行流量限制,如果访问量超过了系统的最大处理能力,就会丢弃一部分的用户请求,保障整个系统可用,保证大部分用户是可以访问系统的。这样虽然有一部分用户的请求被丢弃,产生了部分不可用,但还是好过整个系统崩溃的,所有的用户都不可用要好


降级

有一些系统功能是非核心的,但是它也给系统产生了非常大的压力,比如说在电商系统中有确认收货这个功能,即便我们不去确认收货,系统也会超时自动确认收货。

但实际上确认收货这个操作是一个非常重的操作,因为它会对数据库产生很大的压力:它要进行更改订单状态,完成支付确认,并进行评价等一系列操作。如果再系统高并发的时候去完成这些操作,那么会对系统雪上加霜,使系统的处理能力更加恶化。

解决办法就是在系统高并发的时候,比如像淘宝双 11 的时候,当天可能整天系统都处于一种极限的高并发的访问压力之下,这时候就可以将确认收货,评价这些非核心的功能关闭,将宝贵的系统资源留下来,给正在购物的人,让他们去完成交易


异地多活

如果整个数据中心都不可用,比如说数据中在所在的城市遭遇了地震,机房遭遇了火灾或者停电,这样的话,不管我们的设计和系统多么高可用,系统依然是不可用的

为了解决这个问题,同时也为了提高系统的处理能力和改善用户体验,很多大型互联网应用都采用了异地多活的多机房架构策略,也就是说将数据中心分布在多个不同地点的机房里,这些机房都可以对外提供服务,用户可以连接任何一个机房进行访问,这样诶各级防都可以提供完整的系统服务,即使某一个机房不可使用,系统爷不会宕机,依然保持可用。


请用你熟悉的编程语言写一个用户密码验证函数,Boolean checkPW(String 用户 ID,String 密码明文,String 密码密文),返回密码是否正确 boolean 值,密码加密算法使用你认为合适的加密算法。



用户头像

_

关注

还未添加个人签名 2018.09.17 加入

还未添加个人简介

评论

发布
暂无评论
架构师第十一周作业