作业 - 第 4 周
互联网系统的挑战
高并发、大流量
高可用
海量数据
网络情况复杂
安全环境恶劣
需求变更快,版本迭代频繁
业务渐进式发展
应对挑战技术方向
垂直伸缩
通过升级硬件和网络吞吐能力可以实现垂直伸缩。由于不需要改变应用架 构,所以通常 被认为是最简单的短期伸缩性方案。
通过使用 RAID(独立冗余磁盘阵列)增加 I/O 吞吐能力。
通过切换到 SSD(固态硬盘)改善 I/O 访问速度。
通过增加内存减少 I/O 操作 。
通过升级网络接口或者增加网络接口提高网络吞吐能力。
更新服务器使用更多处理器或者更多超线程。
垂直伸缩的缺点
达到某个程度后,增加计算能力需 要的更多的花费。
垂直伸缩有物理极限。
操作系统的设计或者应用程序自身 制约着垂直伸缩最多只能达到某个 点。
水平伸缩
水平伸缩是指通过增加服务器提升计算能力的一类架构方法。 是互联网系统采用的技术方案。
水平伸缩被认为是伸缩性的圣杯,水平伸缩可以克服垂直伸缩带来的单位计算成本随计 算 能力增加而迅速飙升的问题。
另外,水平伸缩总是可以增加更多服务器,这样,就不会像垂直伸缩那样遭遇到单台服 务器的极限。
互联网架构模式
每一个模式描述了一个在我们周围不断重复发生的问题以及该问题解决方案的核心。这 样,你就能一次又一次的使用该方案而不必做重复工作。 模式的关键在于模式的可重复性,问题与场景的可重复性带来解决方案的可重复使用。
互联网架构模式就是试图去描述那些为解决互联网系统高性能、高可用、易扩展、可伸 缩、安全等目标,被很多互联网应用重复使用的一些解决方案,这些解决方案是互联网 软件系统的重要组成部分。
分层
分层是企业应用系统中最常见的一种架构模式,将系统在横向维度上切分成几个部分, 每个部分负责一部分相对比较单一的职责,然后通过上层对下层依赖和调用组成一个完 整的系统。
分割
如果说分层是将软件在横向方面进行切分,那么分割就是在纵向方面对软件进行切分。 系统越大,功能越复杂,服务和数据处理的种类也越多,将这些不同的功能和服务分割 开来,包装成高内聚低耦合的模块单元,一方面有助于软件的开发和维护;另一方面, 便于不同模块的分布式部署,提高网站的并发处理能力和功能扩展能力。
分布式
对于大型网站,分层和分割的一个主要目的是为了切分后的模块便于分布式部署,即将 不同模块部署在不同的服务器上,通过远程调用协同工作。分布式意味着解决同样的问 题可以使用更多的计算机,计算机越多,CPU、内存、存储资源也就越多,能够处理的 并发访问和数据量就越大。
分布式应用和服务
分布式静态资源
分布式数据和存储
分布式计算
集群
使用分布式虽然已经将分层和分割后的模块独立部署,但是对于用户访问集中的模块, 比如网站的首页,还需要将独立部署的服务器集群化,即多台服务器部署相同应用构成 一个集群,通过负载均衡设备共同对外提供服务。
缓存
缓存就是将数据存放在距离计算最近的位置以加快处理速度。缓存是改善软件性能的第 一手段,现代 CPU 越来越快的一个重要因素就是使用了更多的缓存,在复杂的软件设计 中,缓存几乎无处不在。大型网站架构设计在很多方面都使用了缓存设计。
CDN
反向代理
本地缓存
远程缓存
异步
计算机软件发展的一个重要目标和驱动力是降低软件耦合性。事物之间越少直接关系, 那么就越少被彼此影响,越可以独立发展。大型网站架构中,系统解耦合的手段除了前 面提到的分层、分割、分布等手段,还有一个重要手段是异步,就是将一个业务操作分 成多个阶段,每个阶段之间通过共享数据而不是直接调用的方法进行协作。
提高系统可用性
加快网站响应速度
消除并发访问高峰
冗余
互联网应用需要 7×24 小时连续运行,但是服务器总有可能会出现故障,特别是服务器规 模比较大的时候,服务器宕机是必然事件。要想保证在服务器宕机的情况下网站依然可 以继续服务,数据不会丢失,就需要一定程度的服务器冗余运行,数据冗余备份。
自动化
在无人值守的情况下网站可以正常运行,一切都可以自动化是网站的理想状态。目前互 联网的自动化架构设计主要集中在运维方面。
安全
互联网的开放特性使得其从诞生起就面对巨大的安全挑战,网站在安全架构方面也积累 了许多模式:通过密码和手机校验码进行身份认证;登录、交易等操作需要对网络通讯 进行加密,网站服务器上存储的敏感数据如用户信息等也进行加密处理;为了防止机器 人程序滥用网络资源供给网站,网站使用验证码进行识别;对于常见的用于攻击网站的 XSS 攻击,SQL 注入,进行编码转换等相应处理;对于垃圾信息、敏感信息进行过滤; 对转账交易等重要操作根据交易模式和交易信息进行风险控制。
评论