写点什么

SLM

0 人感兴趣 · 1 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/c5/c5467f25d3a424ab1641a9d7acb13b0d.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

微调后的 Qwen3-4B 在多项基准测试上战平或胜过 GPT-OSS-120B

编者按: 如果你正在为边缘计算、本地部署或资源受限场景寻找高效的语言模型解决方案,你是否曾困惑:在众多小型语言模型(SLM)中,哪一个才是微调的最佳起点?是否真的存在“小而强”的模型,能在微调后媲美甚至超越规模大数十倍的教师模型?

SLM_SLM技术文章_InfoQ写作社区