数据挖掘在银行中应用
来源:网络 时间:2022-03-19
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)15-0017-03
目前,国内金融市场中地方商业银行和外资银行的扩张与增长速度越来越快,来自银行间的竞争越来越大。银行拥有海量的经营数据,借助数据挖掘技术可以为银行提供切实有效的方法来实现效益最大化,从而使银行在激烈的竞争中占据优势。
1数据挖掘理论介绍
1.1数据挖掘定义
数据挖掘是指对数据进行提取和加工,找出隐含的信息。数据挖掘借助统计算法、检索情报、机器学习、在线分析和模式识别等一些专业手段以达成预期目标,而且一般涉及的都是计算机科学方面。数据挖掘的过程包括理解挖掘的数据、获取相关知识和技术、整合与检查数据、去掉错误的数据、建立模型、数据挖掘工作、测试和验证挖掘结果、解释和实施挖掘结果。
1.2数据挖掘主要方法
1.2.1聚类分析
聚类是指根据数据的相似性把数据集划分为多个类别,使同类的相似度较大,而不同类的数据相似度较小。常用的聚类算法有k-means聚类算法、层次聚类算法、SOM聚类算法、FCM聚类算法。
1.2.2决策树
决策树又称为判断树,是一种归纳分类方法,它借助归纳算法对数据进行分析归纳,以树型结构表示分类或决策集合,进而产生规则和发现规律,最后再用决策对数据进行分析。
1.2.3统计学
统计学是应用数学中最重要的学科之一,它通过搜索、整理、分析、描述数据等手段,从数据中找出相应随机变量的分布规律或数字特征,从而推断所测对象的本质,甚至预测对象。
1.2.4关联规则
关联规则能够从数据集中发现频繁出现的项集。它可以理解为用来发现在同一事件中的不同项之间的相关性,即找出事务中频繁发生的项或属性的所有子集和项之间的关联性。关联规则最为经典的算法是Apriori算法。
1.2.5粗糙集
粗糙集能够从各种不完备信息中找出隐含的信息,并揭示潜在的规律。在分类机制建立的基础上,粗糙集理论把知识与等价关系对空间的划分视为同等。由于形成等价类的所有数据样本的描述属性是等价的,所以无法由属性进行区别的类集由粗糙集来进行粗略地定义。
1.2.6神经网络
神经网络是基于生物学中动物大脑发出和接收的信号通过大量神经构建成的网络传递的原理提出的。神经网络无需将反映映射关系的数学方程编写出来,它本身就能够自主的记录和学习大量的输入―输出模式映射关系。
2数据挖掘在银行中的应用
2.1数据挖掘技术在银行信贷风险管理中的应用
贷款业务是银行最重要的业务之一,银行通过赚取存取款利率之间的差价从中获取利润,所以银行信贷风险的管控极为重要。银行信贷风险包括正常、关注、次级、可疑和损失风险。正常贷款和关注贷款对银行信贷风险影响很小,一般借款人会在合同约定的期限内按时偿还本金和利息,贷款损失的概率很小。如果由于借款人个人的原因而导致严重的还款能力问题,对于损失贷款、可疑贷款、次级贷款这三项银行贷款,银行就需要担负很大的风险。银行使用数据挖掘技术对数据的各种属性如借款人年龄、借款人收入和职业、贷款担保人信用情况、借款用途、借款人及其家庭还贷能力、借款金额和借款期限进行分类和筛选,把错误、缺省或无参考价值的数据属性进行预处理,使用决策树的ID3算法构建分类模型,建立信贷风险决策树并对该树进行剪枝,提取分类规则并确定重要的决策属性,选取最优信贷风险评估模型对客户信用风险进行分析、评估和预测,把信贷风险降到最低。
2.2数据挖掘在银行客户细分中的应用
银行客户细分的目的是对所有客户实行分类营销,达到精确营销的目的。银行客户在银行存款中净现金流的多少称为客户价值,包括客户潜在价值和当前价值两种价值。客户潜在价值是指经过一段时间的发展,将来银行有很大可能从客户身上获得盈利。客户当前价值是指银行当前能从一个客户身上所获得的盈利。银行依据客户给银行带来价值的高低把客户分为潜在价值、低价值、中等价值、高价值四种类型。
对客户细分首先要建立数据仓库,然后对数据进行抽取以及对属性进行选择,规约复杂的客户信息,再使用K-Means算法计算并建立客户分类模型,对潜在价值及当前价值在客户维度上展开聚类,最终完成客户价值的细分,实现银行更有针对性的营销。
3结束语
21世纪以来,数据挖掘技术在银行中的应用使银行经营的效益得到了大幅度的提高。银行通过运用数据挖掘技术,从大量的、无规律的经营数据中挖掘出对银行有价值的信息,指导银行制定营销策略、规避信贷风险、提高经营利润。