AI系统功能测试怎么做?从“正确性断言”到“上下文边界”_测试人_InfoQ写作社区