0 人感兴趣 · 3 次引用
VLE基于预训练文本和图像编码器的图像-文本多模态理解模型:支持视觉问答、图文匹配、图片分类、常识推理等
中文多模态医学大模型智能分析X光片,实现影像诊断,完成医生问诊多轮对话
多模态大模型的时代来了吗?
公众号【后台技术汇】
某某某技术有限责任公司架构师
行动就在当下。
🏆 InfoQ写作平台-签约作者 🏆
提供全面深入的云计算技术干货