关于千万级学生系统考试的思考
针对考试试卷设计建议选择字符串作为存储。
选择原因:
基于试卷的数据特点,单张试卷文字内容并不大,而且一但确定之后数据具有不可变性。
基于读取效率,列表存储虽然可以按照题目一条条保存,但是读取效率没有字符串高。
2. 1) 教师端:教师创建试卷,不同页码数据保存不同的列表中,页码作为主键创建列表,题目加入列表。学生考核哪张试卷,直接按学生学号写入 reids。
2)学生端: 学生按照学号请求业务服务器,业务服务器通过学号从 redis 获取当前学生的考卷 id,再通过考卷 id 和页码获取题目信息,服务端把考题转成 json 返回客户端。学生提交答题情况,由于 redis 存在数据丢失风险,不考虑使用 redis 存储答题结果。
假假设学校的考试都安排在某一个月内,考试的时候请求试卷,提交答案,中间答题过程浏览器本地完成,由于考试集中在上午 4 小时和下午 4 小时,且请求试卷集中在考试开始的前 1 分钟,提交答案集中在考试结束前的 30 分钟,因此估算如下:• 请求试卷:1000 万 * 20(课)/ 20(周末不考试) / 4(每天 4 堂考试)/ 1 分钟 = 250 万请求/分钟 ≈ 5 万/每秒。• 提交试卷: 1000 万 * 20(课)/ 20(周末不考试) / 4(每天 4 堂考试)/ 30 分钟 = 1700/每秒
每个学生一天参加 4 场考试,每场考试分为 A\B 两张试卷。存储考生信息加考卷信息并不需要太多内存,单机 4g 内存足够了,主要问题就是峰值 5 万 QPS。
下面是官方给出双核处理器单机处理能力,GET 每秒大约可处理 20 万笔、列表处理能力 100 条数据内大约可处理 4 万笔。
Redis version 2.4.2
Default number of connections, payload size = 256
The Linux box is running SLES10 SP3 2.6.16.60-0.54.5-smp, CPU is 2 x Intel X5670 @ 2.93 GHz.
Test executed while running Redis server and benchmark client on the same CPU, but different cores.
Using a unix domain socket:
按照序列图请求,一个学生至少需要请求两次 redis 才能获取题目信息,一次参加的试卷,一次是试卷题目。按照官方数据 1 台服务器就能满足。但是单台服务器存在极大风险,机器出故障将会影响到学生考试。建议至少搭建 2 台服务器,组成 2 主 2 从 2 哨兵的方案。
评论