星环科技自动特征工程论文被 ICA3PP2020 接收
日前,星环科技AI算法团队《可扩展的分布式自动特征工程关系数据集算法》被ICA3PP 2020接收。
该论文总结了人工智能产品数据挖掘过程领域特征挖掘的痛点,形成了可行的方法论,展示了星环科技在AutoAI领域的实力。
该论文在ICA3PP 2020会议进行了报告,被收录在《并行处理的算法和架构》,在CSDN的“百万人学AI”自动机器学习主题板块下和广大从业人员进行探讨,同时在某航天学术会议上结合时序问题引起了关注,文中的方法论已经集成进了星环科技人工智能平台Sophon的工作中,赋能智能化自动化数据挖掘类型业务。
由此星环科技团队成功提出了一种针对多表数据的自动特征工程算法——DAFEE(关联数据表的可伸缩分布式自动特征工程引擎),利用BFS和DFS相结合的混合搜索策略,在搜索整个关联数据集的同时递归式地生成和筛选出有价值的特征,以供更加深入的分析和建模工作。
此外,还对改方法进行了分布式计算上的优化,有效地增强了其计算的可扩展性,使其能够更好地应对真实场景下的海量数据。实验结果表明DAFEE的效果相比当前最好的算法可提升近一成,分布式的可扩展性平均提升一半以上。
星环科技人工智能产品Sophon是一款一站式人工智能平台,用户可以快速完成从特征工程、模型训练到模型上线的机器学习全生命周期开发工作,在诸多行业实现了落地。
原文链接:星环科技自动特征工程论文被ICA3PP2020接收
评论