微调后的Qwen3-4B在多项基准测试上战平或胜过GPT-OSS-120B_AI_Baihai IDP_InfoQ写作社区