百度百舸开源全模态训练框架 LoongForge:一套代码跑通 GPU 与昆仑芯,多模态训练提速 45%_VLA_Baidu AICLOUD_InfoQ写作社区