写点什么

【数据挖掘概论】数据挖掘的简单描述

作者:晴天
  • 2022 年 8 月 04 日
  • 本文字数:786 字

    阅读完需:约 3 分钟

数据挖掘概要:


数据挖掘的起源、定义及目标:


数据挖掘:Data Mining,从现有的大量数据,收集其中不明显,之前未知,可能有用的知识


大量数据有多大。假设平均每个人有 1.5 张信用卡,每个人每个人消费 10 次,银行一共 150 万人,由于台湾的线上支付不发达,使用信用卡支付有优惠,大多人有很多信用卡,最大的银行号称有千万级的用户。所以 1.5 张和 150 万都是很保守的估计,就依据这些保守的估计,银行每个月可以产生 2250 万消费记录,每年越有 2 亿 7 千万的消费记录。


数据挖掘就是在这里面挖掘客户消费形态和规则。


数据挖掘的例子:


盗刷团伙:以前美国有一些盗刷集团会向一些游民花费 1 万元购买他们的身份信息,然后向办取一张有五万额度信用卡,以四万的价格卖给另一个消费者,另一个消费者能获得五万的消费金额。用完就可以将卡扔掉。银行会损失 5 万。在在美国那边非常的猖獗,于是银行开展了一个会议,把很多专家召集起来,让他们继续讨论,于是得到了 10 个黄金法则,如果满足黄金法则其中一条,就说明是盗刷集团。于是银行开始实施这些规则,结果盗刷集团不仅没有得到控制,还更加猖獗了。


这个时候有一个银行职员,进行了数据挖掘,结果发现百分之 80 的盗刷卡中的第一笔订单小于 1 美元。(之前未发现,可能有用的情况)于是叫来专家确定是不是真的是一个定律。然后得到心理学,经济学等专家的肯定。最后把这一条规则作为判定盗刷卡的准则。


数据挖掘的目标:建立决策模型,哪一类的用户对我的产品感兴趣。根据过去的行动来预测未来的行为


数据挖掘的发展历程


1960 年:数据收集:放在磁盘,软盘,硬盘


1980 年:数据查询:数据库(SQL 语言)


1990 年:数据统计:数据仓库(OLAP)(整体趋势)


2000 年:数据分析:数据挖掘。

银行最早引入数据挖掘:用来营销,信用风险


数据挖掘在政府部门以及各行业的应用


利用公司员工的数据来分析评估顾客信用。


本次课程教学:银行业,零售业,政府,等


各行各业都有数据挖掘的需求

发布于: 刚刚阅读数: 3
用户头像

晴天

关注

还未添加个人签名 2022.08.02 加入

还未添加个人简介

评论

发布
暂无评论
【数据挖掘概论】数据挖掘的简单描述_八月月更_晴天_InfoQ写作社区