从 OpenAI Agents 到 Claude Design、Qwen3.6,AI 应用测试该盯哪些问题?_测吧(北京)科技有限公司_InfoQ写作社区