模块四作业
【作业要求】
基于模块 4 第 6 课的估算结果和 Redis sentinel 的初步方案设计,完善考试试卷存储方案,具体包括:
• 完善 Redis 的数据结构设计,明确具体使用哪种 Redis 数据结构。
• 设计具体的读写流程(可以文字描述也可以序列图描述,序列图要有文字辅助说明)。
• 对照模块 4 第 6 课的性能估算结果,计算 Redis sentinel 集群的服务器数量和性能。
【提示】
1. 性能可以有一定冗余。
2. 如果对 Redis sentinel 不熟悉,请参考官方文档:https://redis.io/topics/sentinel。
1. 性能估算
1.1 存储量估算
假设每门学科每年 2 次考试,每个学生平均一学期 20 门课,考试采取机考的方式,每门考试的答案 20 判断题、20 选择题、4 道大题(答案 200 字以内),考试结果永久保存,在校学生能够看到自己曾经的考试结果,则考试结果记录的存储量为:
在校学生:1000 万 * 20(课)* 2(考试次数) * 1000(答案)* 2(学期) * 3(只有前三年考试)= 2.4T。
离校学生:每年 250 万,存储量为 0.6T。
1.2 请求量估算
假设学校的考试都安排在某一个月内,考试的时候请求试卷,提交答案,中间答题过程浏览器本地完成,由于考试集中在上午 4 小时和下午 4 小时,且请求试卷集中在考试开始的前 1 分钟,提交答案集中在考试结束前的 30 分钟,因此估算如下:
请求试卷:1000 万 * 20(课)/ 20(周末不考试) / 4(每天 4 堂考试)/ 1 分钟 = 250 万请求/分钟 ≈ 5 万/每秒。
提交试卷:1000 万 * 20(课)/ 20(周末不考试) / 4(每天 4 堂考试)/ 30 分钟 = 1700/每秒。
2. 数据结构设计
Redis 数据结构使用 string 存储
Key:学校 ID+年份+科目 ID+考试次数
Value:使用 json 格式存储试卷内容
3. 设计读写流程
老师上传试卷:老师在考试 3 天前将试卷上传至管理后台,此时按照设计的 Key 保存试卷。
考试请求试卷:按照 Key 向 Redis 获取试卷。
提交试卷:将结果用 json 提交至 HBase。
4. 计算集群服务器数量与性能
4.1 存储量估算
截至 2020 年 6 月 30 日,全国高等学校共计 3005 所,在校大学生数量为 3285.3 万人,我们预计用户为 1000 万人折合 1000 所学校,按 1500 所学校来算,试卷数为 1500*20*2*2*3=36 万。因此估算如下:
每年试卷存储量:40 万*512k=20M*10000 ≈ 200G
试卷考虑保留 5 年,故试卷总存储量:200G*5≈1T
4.2 服务器数量估算
存储要求:单台服务器可提供 128G 存储,故需要 8 台。
QPS 要求:单台服务器可提供 QPS 为 5w/s,1 台性能已经足够
考虑 Redis Sentinel 至少需要 3 台,并且考虑 1.5 倍冗余,所以使用 5 台 128G 服务器。
评论