480 likes | 587 Views
金融智能在商业银行风险控制领域的应用. 2012 年 3 月. 金融智能在商业银行风险控制领域的应用. 内容目录 一 、信用卡风险控制 二、金融欺诈防范 三、套现识别 四、贷款业务风险控制 五、练习. 一 、信用卡风险控制. 1. 信用卡和信用卡风险概述 2. 信用卡风险控制 3. 数据挖掘在信用卡风险控制中的应用 4. 案例分析. 一 、信用卡风险控制. 1. 信用卡和信用卡风险概述 ( 1 )信用卡作为一种循环信贷工具,是银行或专门的发卡机构发给资信良好的消费者的一种信用凭证。 其基本功能有 : 转账结算 ; 提供信贷 ; 支取现金。.
E N D
金融智能在商业银行风险控制领域的应用 2012年3月
金融智能在商业银行风险控制领域的应用 • 内容目录 • 一、信用卡风险控制 • 二、金融欺诈防范 • 三、套现识别 • 四、贷款业务风险控制 • 五、练习
一、信用卡风险控制 • 1.信用卡和信用卡风险概述 • 2.信用卡风险控制 • 3.数据挖掘在信用卡风险控制中的应用 • 4.案例分析
一、信用卡风险控制 • 1.信用卡和信用卡风险概述 • (1)信用卡作为一种循环信贷工具,是银行或专门的发卡机构发给资信良好的消费者的一种信用凭证。 • 其基本功能有:转账结算;提供信贷;支取现金。
一、信用卡风险控制 • 1.信用卡和信用卡风险概述 • (2)信用卡风险是银行或金融机构在经营信用卡业务过程中资金损失的不确定性。 • 组成风险的两个基本要素是敞口和控制 • 敞口可定义为导致金融损失的受制于一些效果或影响的条件; • 控制则是采用各种技巧、工具和技术减少敞口对金融损失的影响范围或严重性。 • 信用卡风险的种类有很多种,主要有:冒用卡风险、伪造资料风险、假卡风险、恶意透支风险、假挂失卡风险、内部作案风险、商户风险等等
一、信用卡风险控制 • 2.信用卡风险控制 • 信用卡风险控制发现高风险的客户,在信用卡交易及消费信贷过程中,准确地判断出借款人自身收益及还款能力是否会带来过高的信用风险。 • 信用卡信用风险管理主要包括信用风险的识别、计量、控制等。
一、信用卡风险控制 • 3.数据挖掘在信用卡风险控制中的应用 • 通过在信用卡发行过程中任意时点的结构性分析,对敞口进行量化、控制便可以提供符合企业收益和资产质量目标的风险水平,而数据挖掘使分析工作进行得最为彻底。 • 应用领域 • 有效地瞄准那些表现出良好消费行为和还款行为的消费者, 同时制定新的担保贷款指导方针, 使公司资产质量和利润达到一个可接受的水平。另外, 建立管理办法有效管理现有客户账户,以使利润最大化, 并控制公司敞口损失。 • 最大化地引进先进技术和量化敞口的工具, 以及那些监督管理控制的工具。 • 开展有效的结构性分析, 提供结论性的证据和操作性很强的结果。
一、信用卡风险控制 • 3.数据挖掘在信用卡风险控制中的应用 • 通过在信用卡发行过程中任意时点的结构性分析,对敞口进行量化、控制便可以提供符合企业收益和资产质量目标的风险水平,而数据挖掘使分析工作进行得最为彻底。 • 应用领域 • 有效地瞄准那些表现出良好消费行为和还款行为的消费者, 同时制定新的担保贷款指导方针, 使公司资产质量和利润达到一个可接受的水平。另外, 建立管理办法有效管理现有客户账户,以使利润最大化, 并控制公司敞口损失。 • 最大化地引进先进技术和量化敞口的工具, 以及那些监督管理控制的工具。 • 开展有效的结构性分析, 提供结论性的证据和操作性很强的结果。
一、信用卡风险控制 • 3.数据挖掘在信用卡风险控制中的应用 • 信用风险评估及动态调整 • 客户初始信用风险评估就是当一个客户来银行申请新的信用卡的时候,通过客户填写的基本信息,系统给出一个建议的初始信用等级。 • 以客户的历史数据为输入,表现为客户的初始信用等级分布特征,采用数据挖掘技术建立模型,来预测新客户的初始信用等级,为客户打分。 • 同时,客户的信用等级是一个动态变化的过程,根据客户消费行为的变化,信用等级应该相应的发生变化。 • 根据客户的特征数据(客户基本信息)与客户的交易数据以及一些有意义的汇总数据,构建动态的信用风险评估模型。让银行了解客户当前信用等级的分布特征,并预测下一阶段(月)客户的信用风险变化趋势。
一、信用卡风险控制 • 3.数据挖掘在信用卡风险控制中的应用 • 客户透支分析 • 分析信用卡使用中信用透支的情况,理解透支客户的具体特征。 • 如将客户透支分为三种类型:高、中、低。银行可以对高、中、低的具体情况进行设置,比如设置透支在每月 5000 元的为高。采用数据挖掘技术以客户的基本信息、历史汇总数据为输入,所选字段需与透支无直接相关性,输出为设定的透支类别,且能够预测当前客户在今后一段时间中可能透支的情况。
一、信用卡风险控制 • 3.数据挖掘在信用卡风险控制中的应用 • 客户利润分析 • 分析信用卡客户的利润分布情况,得到带来不同利润的客户的具体特征。例如将客户利润分为三种类型:高、中、低。银行可以对高、中、低的具体情况进行设置。客户利润分析同客户透支分析类似。
一、信用卡风险控制 • 3.数据挖掘在信用卡风险控制中的应用 • 客户类别分析模型 • 当前的市场营销中很重要的一个特点是强调客户细分。客户类别分析的功能也在于此,比如将客户分成四个重要的类别:交易频繁的客户、偶然大量透支的客户、稳定透支的客户、其他,帮助银行寻找出这些不同种类客户之间的特征。可以让银行了解不同行为类别客户的分布特征,能够预测下一阶段客户的类别变化趋势。
一、信用卡风险控制 • 4.案例分析:信用卡审批模型 • 某银行提供给的业务数据, 来源于信用卡业务系统, 主要包括客户资料、 客户申请资料、 信用卡资料、账户资料、历史交易数据等,共包含 100 多张表,大约300Mb 的数据量。通过查阅大量的文献等, 最后汇集成一张记录数为2 999的分析表, 再通过对数据的分析及预处理。 最后进入建模的输入变量为: • ①Sumoverdraftlimit 授信额度总和 ②Age 年龄 • ③Marriedcode 婚否 ④Homepostcode 邮编、 • ⑤Avgbalance 平 均 账 面 余 额 ⑥Cardnum 卡 数 • ⑦Avgday-consume日均消费额 ⑧Maxaccountusemonths最长使用卡账户时间 • ⑨Avgdayoverdraftamount 平均每天透支额 ⑩Avgtransac-tionamount平均每笔交易的金额 • ⑾ Avgoverdraftdays平均每笔透支天数 Sexcode性别代码 • 目标变量定义为Customerclass客户类别, • 把 2 999 个样本中的信用卡持有者分成两类: 类标号为 “1” 的 “好” 客户(2 959个样本)和类标号为 “0” 的 “差” 客户(40 个样本)。 • 在建立了最佳模型后, 在信用卡申请中, 如果模型判断为“好”客户, 则批准发给信用卡, 如果判断为“差”客户, 则拒绝发信用卡。
一、信用卡风险控制 • 4.案例分析:信用卡审批模型 • 使用模型:决策树和神经网络模型 • 决策树分类方法是一种有指导的学习方法。决策树是一 个类似于流程图的树结构, 首先根据训练样本数据集生成。 如果该树不能对所有对象做出正确的分类,那么选择一些例外的样本加入到树中,重复该过程一直到形成正确的分类规则集(决策树)。最终结果的决策树中, 叶结点代表类型或者类型分布, 内部结点对应于一个属性的测试, 每个分枝代表一个测试的输出, 从根到叶结点的一条路径就对应着一条规则。 最为典型的决策树学习系统是ID3, 它采用自顶向下递归的各个击破方式来构造决策树。 • 神经网络模型中常用的是后向传播算法。后向传播通过迭代地处理一组训练样本, 将每个样本的网络预测与实际知道的类标号比较, 进行学习。对于每个训练样本, 修改权, 使得网络预测和实际类之间的均方误差最小。这种修改 “后向” 进行。即由输出层, 经由每个隐藏层, 到第一个隐藏层(因此称作后向传播)。 一般来说权将最终收敛, 学习过程停止。
一、信用卡风险控制 • 4.案例分析:信用卡审批模型 • 使用模型:决策树和神经网络模型 • 模型流程图: • 输入数据源数据划分决策树模型 数据替换变量转换 神经网络模型模型评价 • 选择较为优化的模型:神经网络模型进行预测
二、金融欺诈防范 • 1.金融欺诈概述 • 2.数据挖掘在金融欺诈防范中的应用 • 3.案例分析
二、金融欺诈防范 • 1.金融欺诈概述 • 金融欺诈就是利用金融产品规则上的漏洞获取不正当利益的行为 • 金融欺诈行为可以以多种形式呈现 • 按照其涉及的金融产品有: 贷款欺诈 、存款欺诈 票据欺诈、 银行卡欺诈 、证券欺诈和保欺诈等 • 从欺诈行为的来源分: 可以分为外部欺诈和内部欺诈两类 • 按欺诈手段 可以分为以下三种类型
二、金融欺诈防范 • 1.金融欺诈概述 • 按欺诈手段 可以分为以下三种类型 • 一是利用银行交易系统 ,进行非法侵入或违规操作 从而谋取不正当利益。银行卡欺诈 、身份窃取以及大量的银行内部违规操作等都属于这种类型 。 • 二是提供虚假承诺或虚假信用保证资料进行欺诈。 大多数投融资欺诈都属于这种。 • 三是隐瞒重要信息, 人为制造信息不对称进行欺诈 在证券市场中大量的内幕交,在衍生产品推销过程中故意隐藏其风险性以及运用各种手段操控证券市场以期套利等
二、金融欺诈防范 • 2.数据挖掘在金融欺诈防范中的应用 • 分类预测主要使用历史数据建立分类预测模型,并用所建立的模型对未来数据进行分类预测。方法包括树型结构的分类、基于规则的分类、最近邻居法、递归法、人工神经网络法、绘图法、以及向量机(SVMs) ,可以用于解决离散型数据和连续型数据分类预测问题。如果能通过对非法集资、洗钱等典型诈骗行为的逻辑路径分析找到其行为特征, 就可利用上述方法挖掘出相关数据, 检测诈骗行为。
二、金融欺诈防范 • 2.数据挖掘在金融欺诈防范中的应用 • 聚类分析的职能是将一个数据集的所有数据点分到不同组里, 相似数据处于同一组中, 不同组的数据差异性较大 • 聚类分析方法包括K-均值聚类、 自组映射、 高斯混合模型、分层聚类、子空间聚类、图形算法以及基于密度的算法等。聚类分析在商务智能及决策分析领域获得了广泛应用。例如,应用聚类分析方法可以发现拥有相似价格的运动模式股票聚类。从中可能发现关联交易及内幕交易的可疑信息。
二、金融欺诈防范 • 2.数据挖掘在金融欺诈防范中的应用 • 关联分析的主要作用是从海量数据中高效、准确地发现强相关性事件。方法包括关联规则分析和统计相关计算。关联分析对于发现隐藏在数据中事物的内在联系有很大的帮助。例如,关联分析可以用于监控多个用户的关联交易行为,为检测跨账户协同的金融欺诈行为提供了有效路径。即使欺诈者的交易行为表面上属于正常交易,我们还是可以通过关联分析进行跨账户协同检测找到其中的特殊状况
二、金融欺诈防范 • 2.数据挖掘在金融欺诈防范中的应用 • 异常诊断也被称之为偏差检测。其主要目的是搜寻并发现数据中的异常点或异常事件。包括基于统计原理、距离和聚类分析的异常诊断技术。它们对于金融风险管理、客户信息安全管理和网络安全管理具有重要作用。通过这些技术可以发现公司提供的财务报表中经常存在异常夸大的收益和虚报收入等可疑情况。通过分析公司的财务报表,可以提前诊断和预防金融欺诈。
二、金融欺诈防范 • 3.案例分析---信用卡欺诈行为识别模型 • 以中国银行下属相关支行2006年1月至12月的信用卡交易数据为研究对象,采用 SAS EM 4.3 应用软件对构建的模型进行验证。共采集了 5029 位信用卡持卡者的 498216 条信用卡交易数据。在研究模型时,不仅需要训练数据进行模型的训练,还需要测试数据进行模型的测试,所以需要将数据分为两组,一组为训练样本,一组为测试样本。
二、金融欺诈防范 • 3.案例分析-信用卡欺诈行为识别模型 • 以客户的部分个人信息与全部交易资料为对象,根据持卡人的所处地区和信用卡类别将客户分类,然后以同类持卡人的交易行为模式为分析基础,比较当前客户交易模式与历史交易模式的差别,根据学习客户历史交易模式的规律判断当前客户是否为欺诈客户。
二、金融欺诈防范 • 3.案例分析-信用卡欺诈行为识别模型
二、金融欺诈防范 • 3.案例分析-信用卡欺诈行为识别模型 • 模型数据流图 • 输入数据源数据数据替换变量转换 神经网络模型模型评价模型预测 • 结论
三、套现识别 • 1.套现识别概述 • 2.数据挖掘在套现识别中的应用 • 3.案例分析
三、套现识别 • 1.套现识别概述 • 信用卡套现是指持卡人通过一些不正当的手段将信用卡内的资金以现金的方式间接套取,表面上是在用信用卡刷卡消费,实际上以此来逃避信用卡提现的高额利息费用,从而相当于是获得了一笔没有利息的贷款。
三、套现识别 • 1.套现识别概述 • 信用卡套现主要有两种方式: • 一种是通过商家 POS 机套现;另一种是通过淘宝网的支付宝套现。通过商家的 POS 机套现是指信用卡持卡人事先与商户沟通好,利用商家的 POS 机进行虚假交易,然后商家收取少量费用后把现金还给信用卡持卡人。类似于利用商家的 POS 机,利用淘宝网的支付宝套现是买卖双方在网上事先沟通好进行虚假交易,买方用信用卡往支付宝里支付,卖家收到款后收取少量费用,再把钱打到买方的借记卡账户,从而完成套现。
三、套现识别 • 1.套现识别概述 • 信用卡套现特点: • (1)支付数额较大 • (2)数额往往接近或等于持卡人信用卡的信用额度 • (3)短时间内持卡人的某张借记卡内有接近且略低数目的金额入账 • (4)某一商户经常返还消费者等于或接近其消费金额的金钱
三、套现识别 • 2.数据挖掘在套现识别中的应用 • (1)数据准备 • 数据是多维度的,按照上面的分析,有 “支付额度的大小” , “支付额度与信用卡信用额度的接近程度” , “金额返回借记卡与信用卡交易时间的接近程度” , “交易商户的可疑 • 度” 这四个维度
三、套现识别 • 2.数据挖掘在套现识别中的应用 • (2)数据规约 • 根据四个维度的重要性为量化后的四个维度值分配权重,四个维度的重要性或所占比重的大小应该依次为: “支付额度与信用卡信用额度的接近程度” , “交易商户的可疑度” , “支付额度的大小” , “金额返回借记卡与信用卡交易时间的接近程度”。 • 最后根据分配的权重加权计算出 “信用卡套现可疑度”
三、套现识别 • 2.数据挖掘在套现识别中的应用 • (3)异常点检测 • 利用异常点检测技术检测出异常点,常用的检验技术有统计学方法,基于距离的检测(distance-baseddetection),基于偏差的检验(deviation-basedtechniques)以及比较先进的遗传算法检测等,银行可以直接用这些方法检测出异常值。
三、套现识别 • 3.案例分析-基于 Lo g istic的信用卡套现侦测评分模型 • (1)数据准备 • 通过对银行业务系统数据进行综合的业务分析,确定了正常账户及具备套现特征账户各 2 000条作为训练样本集,并选取等量的数据作为保留样本集。经过整合、 转换、去噪和规格化等综合数据处理, 初步筛选出部分候选特征变量如表 3所示 (为方便描述问题, 所选变量有适度调整和删减 )。
三、套现识别 • 3.案例分析-基于 Lo g istic的信用卡套现侦测评分模型
三、套现识别 • 3.案例分析-基于Logistic的信用卡套现侦测评分模型 • (2)变量选择 • 结合领域知识再对具有统计学意义上显著线性相关的 10个候选变量进行相关性分析, 决定剔除 OpenMons 、Avg Am t Cons 、 U seC l 、 ConsAm t_Rate共 4个变量。至此, 候选特征变量只剩 6个。
三、套现识别 • 3.案例分析-基于Logistic的信用卡套现侦测评分模型 • (3)模型构建 • 数据流程图如下: • 输入数据源数据划分变量选择Logistic模型模型评分预测
三、套现识别 • 3.案例分析-基于Logistic的信用卡套现侦测评分模型
四、贷款业务风险控制 • 1.贷款业务风险控制概述 • 2.数据挖掘在贷款业务风险控制中的应用 • 3.案例分析
四、贷款业务风险控制 • 1.贷款业务风险控制概述 • 贷款风险是指商业银行在开办贷款业务过程中因很多种原因所致不能够按期收回所发放的贷款,从而给商业银行造成信贷资金损失的一种可能性。 • 主要类型: 市场风险、信用风险、法律风险、操作性风险
四、贷款业务风险控制 • 1.贷款业务风险控制概述 • 信贷风险管理是银行风险管理的核心,是信用风险管理的重中之重。它是指商业银行对信贷 • 风险进行识别、评价并准确度量,并在此基础上进行有效防范和控制信贷风险,以最低成本实现信贷资产最大安全保障的科学管理方法。
四、贷款业务风险控制 • 2数据挖掘在贷款业务风险控制中的应用 • 使用银行信贷管理信息系统数据库中的业务数据,利用数据挖掘技术分析客户信用风险和预测欺诈行为。
四、贷款业务风险控制 • 2数据挖掘在贷款业务风险控制中的应用 • 分析这些风险为什么会发生?哪些因素会导致这些风险?这些风险主要来自于何处?如何预测到可能发生的风险?采取何种措施减少风险的发生?通过评价这些风险的严重性、发生的可能性及控制这些风险的成本,汇总对各种风险的评价结果,可以建立一套信贷风险管理的战略和监督体系,从而完善信贷风险管理能力,准确、及时地对各种信贷风险进行监视、评价和管理,进而达到在信贷风险发生之前对其进行预警和控制。
四、贷款业务风险控制 • 2数据挖掘在贷款业务风险控制中的应用 • 明确挖掘的主题 • 选择数据挖掘工具 • 数据准备 • 数据转换 • 数据清洗 • 数据挖掘
四、贷款业务风险控制 • 3.案例分析—银行信贷管理模型分析 • (1)数据准备:收集到某行2008 年全年度的个人贷款申请、贷款客户信息、贷款合同、贷款基本情况等与个人信贷业务相关的数据
四、贷款业务风险控制 • 3.案例分析—银行信贷管理模型分析 • (2)抽取数据:根据申请贷款客户的属性和贷款情况挖掘 • 出与个人贷款风险相关的一些规律和特征,以及客户的消费习惯和贷款倾向,抽取属性字段
四、贷款业务风险控制 • 3.案例分析—银行信贷管理模型分析 • (3)数据清洗:完成缺失值处理、数据去噪、数据变换等预处理,得到预处理的结果
五、练习 • 1.思考题目 • (1)什么是信用卡风险,信用卡风险有些哪些形式? • (2)商业银行风险控制中主要用到数据挖掘的哪些技术 • (3)如何使用数据挖掘技术防范信用卡地欺诈?