模块五作业
1.计算性能预估
1.1.用户行为建模和性能估算
评论微博可分为发评论和看评论两个动作。评论微博是一个写多读少的业务,假设平均每天每人发 10 个评论,则每天的评论量 25 亿条。
大部分的人评论微博和看微博时间相同,集中在早上 8:00~9:00 点,中午 12:00~13:00,晚上 20:00~22:00,假设这几个时间段发评论总量占比为 60%,则这 4 个小时的平均发微博的 TPS 计算如下:
25 亿 * 60% / (4 * 3600) = 100 K / s。
2.非热点事件时的高性能计算架构
2.1.业务特性分析
发评论是一个典型的写操作,因此不能用缓存,可以用负载均衡。
看评论是一个读操作,因此使用多级缓存架构。
2.2.架构分析
a)用户量过亿,应该要用多级负载均衡架构,覆盖 DNS -> F5 -> Nginx -> 网关的多级负载均衡。
b)请求量过亿,应该要用分布式缓存架构,采用写缓冲技术处理。
c)考虑写评论用户量和请求量都过亿,所以评论微博需要拆分出独立服务。评论微博和看评论不需要拆分,因为评论微博和看评论动作非常接近,用户发完评论希望立刻看到。
2.3.架构设计
1. 负载均衡算法选择
发评论的时候依赖登录状态,登录状态一般都是保存在分布式缓存中的,因此发评论的时候,将请求发送给任意服务器都可以,这里选择“轮询”或者“随机”算法。
2. 业务服务器数量估算
发评论涉及几个关键的处理:内容审核(依赖审核系统)、数据写入存储(依赖存储系统)、数据写入缓存(依赖缓存系统),因此按照一个服务每秒处理 500 来估算,完成 100K/s 的 TPS,需要 200 台服务器,加上一定的预留量,总共需要 250 台服务器。
注:评论微博架构主要参考写微博和看微博架构设计。
3.热点事件时的高可用计算架构
3.1.业务特性分析
热点事件发生后,绝大部分评论微博请求(包括写评论和看评论)都落在了导致热点事件发生的那一条微博上面。
3.2.架构分析设计
主要采用预防为主的思路进行分析
a)热点微博评论高并发写入请求。由于评论丢失会引起用户投诉,因此尽量少丢弃请求,考虑用“写缓冲算法”。
b)很明显,热点事件微博评论存在缓存热点问题,可以考虑“多副本缓存”,由于原有的缓存架构已经采用了“应用内的缓存",总体上来看,缓存热点问题其实不一定很突出。
版权声明: 本文为 InfoQ 作者【Geek_1d37ea】的原创文章。
原文链接:【http://xie.infoq.cn/article/9c0ba86466420be8942cd6ace】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论