写点什么

关河因果将机器学习融合逻辑规则,突破黑盒壁垒

作者:6979阿强
  • 2022 年 6 月 22 日
  • 本文字数:1570 字

    阅读完需:约 5 分钟

关河因果将机器学习融合逻辑规则,突破黑盒壁垒

机器学习特别是深度学习,以神经网络为代表,发展至今,在很多任务上获得了很大的成功。在有足够多标注数据的情况下,神经网络往往效果惊人。但是,当标注数据匮乏时,神经网络的性能就会大打折扣。此外,神经网络作为黑盒缺少可解释性以及难以融入外部知识的问题也一直为人所诟病。与之对应的,规则(rule)通常是指语义明确、能描述数据分布所隐含的客观规律或领域概念、可写成“若…,则…”形式的逻辑规则。


规则可从训练数据中学习出一组能用于对未见示例进行判别的规则,也可以是由人类专家基于领域知识构建,具备着良好的可解释性,可用于没有任何数据的冷启动场景,并且可以通过规则的增删和修改来快速应对目标任务的变化。与神经网络这样的“黑盒模型”相比,规则学习具有更好的可解释性,能使用户更直观地对判别过程有所了解。


另一方面,数理逻辑具有极强的表达能力,绝大多数人类知识都能通过数理逻辑进行简洁的刻画和表达。因此,规则学习能更自然的在学习过程中引入领域知识。但不可否认的是,规则在任务中达到和神经网络等黑盒模型同等的泛化能力。因而在数据资源丰富的场景下难以达到和神经网络相近的效果。为了结合两者的优点,近年来如何将规则更好地融入神经网络成为了一个重要的研究方向


对于智能决策领域而言,机器学习、深度学习可以带来一定增长点,不过要成为突破口比较难,毕竟模型对业务来说是个黑盒子,无法解释。就目前现状而言,模型更多用于辅助决策,还无法放心地仅通过模型预测值就真正否决掉一个用户或判断是否欺诈、是否逾期等。人们往往更相信直观可见的“证据”、人为积淀的经验、亦或通过现有知识基础推理衍生出的可解释性结论。从这个角度上看,一个融入逻辑规则的可解释的机器学习决策引擎很有可能是智能决策领域的突破口。逻辑规则与机器学习可以在以下 3 个方面结合形成突破。


**1、通过逻辑规则提取相关特征,从关系角度丰富特征工程,提升模型效果,使决策更精准高效。**数据决定了模型的上限,特征宽表则从各个纬度去刻画数据特征,在机器学习过程中,特征工程的构建是建模最重要的环节之一。常规的行为类、交易类、时序类、高频类等特征很容易从数据中挖掘,而关联类特征则需要数据分析师在脑海中推演可能的关联情况和关系网络构成,且需要通过多次 join 来验证,涉及三度及其以上的多度关联时,无论是脑海推演过程抑或 join 逻辑都比较复杂。如果有精确的逻辑规则,可以通过其直接抽取关联特征,可以一定程度上提高模型的表现。


**2、机器学习模型提供学习结果,丰富和增强逻辑规则,使逻辑规则更精确。**机器学习的本质是通过学习历史数据和经验得到未来的预测结果,通过学习而得到的预测结果本质也是一种“知识”,只是这类知识的准确性是个概率值。当我们将机器通过学习而得来的知识输入到规则中,与已有的规则重新结合,在一定程度上丰富和增强已有的逻辑规则,可以使逻辑规则泛化性更强。


**3、机器学习与逻辑规则进行交叉验证,互相提高效果,最后得到一个可解释性的泛化能力强的结果。**具体做法是通过机器学习模型得到正负样本,并将正负样本的样本再输入到规则中进行验证,调整规则。或者是训练数据通过规则验证,为机器学习模型训练产生足够多标注数据节省标注成本,从而提高模型的能力。同时,也可以规则产生的结果,机器学习模型来验证;反之,机器学习模型的预测结果,规则验证。


关河因果分析系统将机器学习融合逻辑规则,支持从数据中自动发现规则,并可以将规则应用于新的数据产生实例,用户可在关河因果官网申请试用。


关河因果支持将多源异构数据抽取转化为图数据,根据行业特性进行自动特征工程,实现对实体间隐含关系、异常关系等深度挖掘,高效、灵活、智能地从数据中推测出事件因果,实现对预测、推荐和决策的支撑。目前已经在传统工业制造、新能源、生物制药、金融、电信运营商、电商等多个行业领域形成商业化应用。

发布于: 刚刚阅读数: 4
用户头像

6979阿强

关注

还未添加个人签名 2021.06.11 加入

还未添加个人简介

评论

发布
暂无评论
关河因果将机器学习融合逻辑规则,突破黑盒壁垒_数据分析_6979阿强_InfoQ写作社区