AI测试平台实战:自动化评分与多模型对比评测深度解析_测试人_InfoQ写作社区