混合合成先验增强表格基础模型 Mitra
表格数据支撑着医疗、金融、电子商务和科学等领域的核心决策。传统机器学习方法(如随机森林和 XGBoost)通常需要为每个数据集单独训练模型,跨分布迁移能力有限。受大语言模型启发,表格基础模型(TFMs)可通过上下文学习(ICL)实现单模型多任务泛化。
作为某机构自动机器学习框架 AutoGluon 的最新组件,Mitra 采用基于 ICL 的范式进行训练。该模型完全在合成数据上预训练,这些数据由精心设计的先验分布混合生成,包括结构因果模型(描述变量间因果关系的图结构与概率方程)以及梯度提升树、随机森林等树模型。这种设计解决了真实表格数据有限且异构的挑战。
Mitra 框架核心特点:
采用二维注意力机制,同时处理行和列的特征交互
预训练阶段通过数百万合成任务学习推理模式
推理时仅需少量支持集示例即可预测查询集标签
在 TabRepo、TabZilla 等主流基准测试中,Mitra 在分类和回归任务上均超越 TabPFNv2 等现有 TFMs,其决策边界相比基线模型更规则且连续。可视化实验显示,在二维正弦棋盘数据上,Mitra 的决策碎片化程度显著低于对比模型。
该模型已作为 AutoGluon 1.4 版本组件开源,支持研究者扩展先验空间和自适应混合策略。评估表明,有效的合成先验需满足:(1) 实际任务性能优异 (2) 分布多样性防止过拟合 (3) 包含独特数据模式。更多精彩内容 请关注我的个人公众号 公众号(办公 AI 智能小助手)或者 我的个人博客 https://blog.qife122.com/公众号二维码

办公AI智能小助手
评论