通义 R1-Omni 模型：通过音视频判断人物情绪；Google 开源端侧多模态模型 Gemma 3，最小 1B 参数丨日报_RTE开发者社区