架构师训练营 作业四
考试行为建模和性能估算
假设每门学科每年 2 次考试,每个学生平均一学期 20 门课,考试采取机考的方式,每门考试的答案 20 判断题、20 选择题、4 道大题(答案 200 字以内),考试结果永久保存,在校学生能够看到自己曾经的考试结果。
则考试结果记录的存储量为: 在校学生:1000 万 * 20(课)* 2(考试次数) * 1000(答案)* 2(学期) * 3(只有前三年考试)= 2.4T 离校学生:每年 250 万,存储量为 0.6T
假设学校的考试都安排在某一个月内,考试的时候请求试卷,提交答案,中间答题过程浏览器本地完成,由于考试集中在上午 4 小时和下午 4 小时,且请求试卷集中在考试开始的前 1 分钟,提交答案集中在考试结束前的 3 分钟。
因此估算如下:
请求试卷:1000 万 * 20(课)/ 20(周末不考试) / 4(每天 4 堂考试)/ 1 分钟 = 250 万请求/分钟 ≈ 5 万/每秒
提交试卷: 1000 万 * 20(课)/ 20(周末不考试) / 4(每天 4 堂考试)/ 30 分钟 = 1700/每秒
存储架构及数据结构分析
因为仅存放考试试卷,所以单机能存储所有数据;
负责考试试卷下发,没有写入压力,单机能支持写性能;
峰值读请求为 50K/s,单机支撑读性能困难;
需要自动切换,使用 redis 的哨兵模式,自动切换。
redis 集群使用 1 主+4 从,共 5 台服务器。
试卷字段类型使用 string 类型。
key:科目 id+时间 time
value: 试卷内容 string
考试结构字段类型用 list 类型。
key:学号 id+科目 id
value:答卷结果 list
读写流程
开考前 10 分钟推送试卷到考生本地电脑。交卷后的数据写入 redis,当日考试结束后,用 kafka 讲考卷结果入 mysql 或者 hadoop 数据库。
服务器数据及性能
redis 的读性能在 1 万以上 10 万以内,考虑到冗余,使用 1 主+4 从,5 台服务器。
评论