从OpenAI Agents到Claude Design、Qwen3.6,AI应用测试该盯哪些问题_测试人_InfoQ写作社区