‘壹’ 银行数据仓库体系实践(18)--数据应用之信用风险建模
信用风险
银行的经营风险的机构,那在第15节也提到了巴塞尔新资本协议对于银行风险的计量和监管要求,其中信用风险是银行经营的主要风险之一,它的管理好坏直接影响到银行的经营利润和稳定经营。信用风险是指交易对手未能履行约定契约中的义务而给银行造成经济损失的风险。典型的表现形式包括借款人发生违约或信用等级下降。借款人因各种原因未能及时、足额偿还债务/银行贷款、未能履行合同义务而发生违约时,债权人或银行必将因为未能得到预期的收益而承担财务上的损失。
那如何来表示某个交易对手的信用情况呢,一般使用信用等级或信用评分来来表示,等级越低或评分越低,发生违约的概率会增加。这个信用评分主要应用在客户的贷前和贷后管理中,贷前是指客户贷款申请阶段,银行受理客户贷款申请时会根据客户提交的信息、人行征信、其它数据源按一定的规则计算出一个违约概率和风险评分或信用等级。再根据这个评分或评级来确定客户的授信额度和利率。计算出的评分或评级越高,违约概率越低,比如在进行个人贷前评分时主要关注以下5方面:
(1)People:贷款人状况,包括历史还款表现、当前负债情况、资金饥渴度等;
(2)Payment:还款来源,如基本收入、资产水平、月收支负债比、无担保总负债等;
(3)Purpose:资金用途,如消费、买房,需要规避贷款资金用于投资或投机性质较高领域,如股票和数字货币;
(4)Protection:债权确保,主要是看是否有抵押物或担保,需要看抵押物用途、质量、价格等关键要素;
(5)Perspective:借款户展望,从地域、行业、人生阶段等考察稳定性及潜力;
贷后是指客户借款后银行持续跟进客户的信用情况,如果发现信用评分降低或者某些指标达到风险预警指标的阈值,说明风险升高,则会进行冻结额度甚至提前进行贷款收回。特别是对于逾期客户。
风险建模步骤
在进行信用评估时如何选择客户属性、如何确定评分或评级规则呢?这就需要进行风险建模,通过分析历史数据来确定哪些特征或指标对客户的违约相关性大,可以了解客户的还款能力以及还款意愿。并通过一定方法来建立评分和评级的规则。那风险建模主要分为以下步骤:
(1)业务理解:主要评估当前现状、确定业务目标,选择建模方法,比如需要进行XX贷款产品的贷前评分模型并确定准入规则,建模方式比如为评分卡,评分应用为基于评分确定贷款准入规则以及额度和利率规则,同时需要确定分析数据的好客户和坏客户标准,如逾期90天以上为坏客户;
(2)数据理解:首先需要准备建模的样本数据,如抽取近2年的获得类似产品的客户相关信息以及根据好客户和坏客户标准确定的结果。并针对业务数据进行业务含义理解、对数据进行收集、探索,了解每个变量的数据质量、缺失情况,数据分布等。比如对于客户在人行的征信数据、客户在银行的存款、理财等信息、以及客户申请填写的家庭、房产信息、外部获得的客户教育、司法等相关信息进行业务理解和数据分布、质量的探索,对缺失值比例过大的变量或准确性不高的变量进行剔除,同时也要确定对于样本数据中哪些数据进行建模,哪些数据进行验证。
(3)数据准备:主要对数据进行预处理和指标加工,指标加工指基于基础数据进行指标加工,如最近1个月的征信查询次数,最近1年的逾期次数等,数据预处理主要工作包括对每一个变量进行数据清洗、缺失值处理、异常值处理、数据标准化等,主要目的是将获取的原始数据转变成可用于建模的结构化数据。
比如对于连续变量,就是要寻找合适的切割点把变量分为几个区间段以使其具有最强的预测能力,也称为“分箱”。例如客户年龄就是连续变量,在这一步就是要研究分成几组、每组切割点在哪里预测能力是最强的。分箱的方法有等宽、等频、聚类(k-means)、卡方分箱法、单变量决策树算法(ID3、C4.5、CART)、IV最大化分箱法、best-ks分箱法等。如果是离散变量,每个变量值都有一定的预测能力,但是考虑到可能几个变量值有相近的预测能力,因此也需要进行分组。
通过对变量的分割、分组和合并转换,分析每个变量对于结果的相关性,剔除掉预测能力较弱的变量,筛选出符合实际业务需求、具有较强预测能力的变量。检测变量预测能力的方法有:WOE(weight of Evidence) 、IV(informationvalue)等。
(4)分析建模:即对于筛选出来的变量以及完成好坏定义的样本结果。放入模型进行拟合。如评分卡一般采用常见的逻辑回归的模型,PYTHON、SAS、R都有相关的函数实现模型拟合。以下是生成的评分卡的例子。
(5)评估及报告:即通过验证样本对模型的预测进行校验。评估模型的准确性和稳健性,并得出分析报告。常用的方法有ROC曲线、lift提升指数、KS(Kolmogorov-Smirnov)曲线、GINI系数等。
(6)应用:对模型进行实际部署和应用,如基于评分进行客户准入和产生额度,并在贷款系统进行模型部署,自动对申请客户进行评分。
(7)监测:建立多种报表对模型的有效性、稳定性进行监测,如稳定性监控报表来比较新申请客户与开发样本客户的分值分布,不良贷款分析报表来评估不同分数段的不良贷款,并且与开发时的预测进行比较,监控客户信贷质量。随着时间的推移和环境变化,评分模型的预测力会减弱,所以需要持续监控并进行适当调整或重建。
在信用风险建模中,目前评分卡建模还是主要的方式,除了申请评分(A卡(Application score card))还有B卡(Behavior score card)行为评分卡、C卡(Collection score card)催收评分卡。B卡主要进行客户贷后管理,如何进行风险预警,C卡进行催收管理,确定如何催收以及催收方式和时间点。信用风险模型中还有一个是反欺诈模型,它主要是识别假冒身份、虚假信息、批量薅羊毛等欺诈行为。随着机器学习和大数据的发展,其它的一些建模方式如决策树、深度神经网络也越来越多的应用到了风险建模中。
信用风险模型是数据仓库支持的重要数据应用之一,在风险建模分析阶段,数据仓库是建模样本数据以及衍生指标加工的主要提供者,业务人员一般在自助分析平台进行数据分析和建模,模型建立完成并部署后,会基于数据仓库数据进行模型效果的监控。在贷后管理中,风险集市也会进行贷后指标的加工。另外风险模型以及预警中会经常使用到外部数据,这部分数据也是通过数据仓库进行对接、加工和存储。
‘贰’ 《金融科技创新》pdf下载在线阅读全文,求百度网盘云资源
《金融科技创新》(Paolo Sironi(保罗•西罗尼))电子书网盘下载免费在线阅读
链接:
书名:金融科技创新
作者:Paolo Sironi(保罗•西罗尼)
译者:马睿
豆瓣评分:6.4
出版社:中信出版社
出版年份:2017-1
页数:246
内容简介:
本书通过互联网金融、社会化媒体、大数据分析、数字技术等,将财富管理行业向更高效的、以客户为中心的咨询流程转变。目标导向即通过新的金融、机器、网络技术来满足客户的个性化需求。
智能投顾(Robo-advisor)和金融科技创新(FinTech)最近成了全球热点。市场的力量正在改变银行和融资顾问原有的商业模式,向由机器人技术驱动的商业模式转化。理财经理正站在数字化浪潮的震荡中, 几百年来根深蒂固的行业格局逐渐从方方面面开始发生改变。
本书揭示了促成创新思维的各种力量, 密切审视了财富管理行业发生的革命, 尤其是数字化咨询、 个性化投资和能够洞察客户行为的认知分析方法。本书的目标是改善金融顾问和客户之间的投资体验, 让他们得以用更为直观的、 目标导向的投资话语进行交流 。不管是金融科技公司还是从事数字化的机构, 谁能利用智能投顾进行目标导向的投资, 谁就最有希望超越对手。
个人投资者、 金融顾问、 投资组合经理、 技术和数字化经理、 银行业高管和金融科技企业家都可以从这本书中得到对财富管理行业转型的深刻见解, 从而理解新技术和定量金融之间的联系, 并适应更加严格的市场监管和更高的信用标准。
作者简介:
保罗•西罗尼(Paolo Sironi)
投资组合管理和金融科技创新领域的知名作家。他目前就职于IBM,担任财富管理和金融科技分析师。保罗将金融和科技在全球范围内结合起来,在财富管理、资产管理、风险管理、金融科技等多个领域展现出了扎实的专业素养。
在加入IBM之前,保罗出资组建了一家金融科技初创公司(2008年),旨在向财富经理们提供目标导向的投资解决方案。随着投资合伙人、世界顶尖的风险管理解决方案提供商Algorithmics公司被IBM收购(2012年),这家初创公司也成为IBM的一个部门。
保罗拥有10年风险管理经验。此前,他曾在意大利联合圣保罗银行(Banca Intesa Sanpaolo)主管市场与交易对手风险建模工作。
‘叁’ 《被平均的风险如何应对未来的不确定性》pdf下载在线阅读,求百度网盘云资源
《被平均的风险》(萨姆·萨维奇(Sam Savage))电子书网盘下载免费在线阅读
资源链接:
链接:https://pan..com/s/1PhTk0JU440wB6hmFq-PqSg
书名:被平均的风险
作者:萨姆·萨维奇(Sam Savage)
译者:刘伟
豆瓣评分:6.4
出版社:中信出版集团
出版年份:2019-4-1
页数:418
内容简介:
为什么人们对变化无常的事物进行风险评估时总是一错再错?为什么基于平均值的预测和决策在金融、医疗保健、会计、反恐战争和气候变化等各个领域总是漏洞百出?因为我们一直试图用“蒸汽时代”的统计学来把握“信息时代”的风险。
作者基于自己多年的咨询、培训经验和研究成果,列出了平均值的12条罪状,介绍了概率管理这一新兴领域,旨在通过新的统计学手段和技术工具,弥补平均值的缺陷,更好地揭示风险、把握不确定性。
本书可以帮助我们更有效地对未来的情况做出判断,从而制定出更合理的决策。
作者简介:
萨姆·萨维奇((Sam Savage)
斯坦福大学工程学院顾问教授,剑桥大学贾奇商学院研究员,其父为美国着名统计学家伦纳德·吉米·萨维奇(Leonard Jimmie Savage)。作者长期从事与统计学和风险评估相关的工作和研究,根据“决策应基于对不确定的未来更大程度的主观判断”的观点,逐渐发展出一种风险建模的新方法“概率管理”,并带领着由Frontline系统公司、甲骨文公司以及SAS软件研究所等机构组成的社团开发了概率分布列(DIST)——这是一种用来储存概率分布的新型电脑数据类型。作者还自任Probability Management.0rg网站的主席。
作者在许多专业期刊和大众媒体上发表过文章,比如《哈佛商业评论》、《投资组合管理杂志》、《华盛顿邮报》以及《今日奥姆斯》(ORMSToday)杂志等。除了教书育人和科学研究之外,他还为众多的企业、机构和政府部门提供咨询和培训服务。
‘肆’ 科普文:银行业9大数据科学应用案例解析!
在银行业中使用数据科学不仅仅是一种趋势,它已成为保持竞争的必要条件。 银行必须认识到,大数据技术可以帮助他们有效地集中资源,做出更明智的决策并提高绩效。
以下我们罗列银行业使用的数据科学用例清单,让您了解如何处理大量数据以及如何有效使用数据。
(1)欺诈识别
(2)管理客户数据
(3)投资银行的风险建模
(4)个性化营销
(5)终身价值预测
(6)实时和预测分析
(7)客户细分
(8)推荐引擎
(9)客户支持
(10)结论
1、欺诈识别
机器学习对于有效检测和防范涉及信用卡,会计,保险等的欺诈行为至关重要。 银行业务中的主动欺诈检测对于为客户和员工提供安全性至关重要。 银行越早检测到欺诈行为,其越快可以限制帐户活动以减少损失。 通过实施一系列的欺诈检测方案,银行可以实现必要的保护并避免重大损失。
欺诈检测的关键步骤包括:
获取数据样本进行模型估计和初步测试 模型估计 测试阶段和部署。
由于每个数据集都不同,每个数据集都需要由数据科学家进行个别训练和微调。 将深厚的理论知识转化为实际应用需要数据挖掘技术方面的专业知识,如关联,聚类,预测和分类。
高效欺诈检测的一个例子是,当一些异常高的交易发生时,银行的欺诈预防系统被设置为暂停,直到账户持有人确认交易。对于新帐户,欺诈检测算法可以调查非常高的热门项目购买量,或者在短时间内使用类似数据打开多个帐户。
2、管理客户数据
银行有义务收集,分析和存储大量数据。但是,机器学习和数据科学工具不是将其视为合规性练习,而是将其转化为更多地了解其客户以推动新的收入机会的可能性。
如今,数字银行越来越受欢迎并被广泛使用。这创建了TB级的客户数据,因此数据科学家团队的第一步是分离真正相关的数据。之后,通过准确的机器学习模型帮助数据专家掌握有关客户行为,交互和偏好的信息,可以通过隔离和处理这些最相关的客户信息来改善商业决策,从而为银行创造新的收入机会。
3、投资银行的风险建模
风险建模对投资银行来说是一个高度优先考虑的问题,因为它有助于规范金融活动,并在定价金融工具时发挥最重要的作用。投资银行评估公司在企业融资中创造资本,促进兼并和收购,进行公司重组或重组以及用于投资目的的价值。
这就是为什么风险模型对于银行来说显得非常重要,最好是通过掌握更多信息和储备数据科学工具来评估。现在,通过大数据的力量,行业内的创新者正在利用新技术进行有效的风险建模,从而实现更好的数据驱动型决策。
4、个性化营销
市场营销成功的关键在于制定适合特定客户需求和偏好的定制化报价。数据分析使我们能够创建个性化营销,在适当的时间在正确的设备上为合适的人员提供合适的产品。数据挖掘广泛用于目标选择,以识别新产品的潜在客户。
数据科学家利用行为,人口统计和历史购买数据建立一个模型,预测客户对促销或优惠的反应概率。因此,银行可以进行高效,个性化的宣传并改善与客户的关系。
5、终身价值预测
客户生命周期价值(CLV)预测了企业从与客户的整个关系中获得的所有价值。 这项措施的重要性正在快速增长,因为它有助于创建和维持与特定客户的有利关系,从而创造更高的盈利能力和业务增长。
获得和维系有利可图的客户对银行来说是一个不断增长的挑战。 随着竞争越来越激烈,银行现在需要360度全方位了解每位客户,以便有效地集中资源。 这就是数据科学进入的地方。首先,必须考虑大量数据:如客户获得和流失的概念,各种银行产品和服务的使用,数量和盈利能力以及其他客户的特点 如地理,人口和市场数据。
这些数据通常需要大量清洗和操作才能变得可用和有意义。 银行客户的概况,产品或服务差异很大,他们的行为和期望也不尽相同。 数据科学家的工具中有许多工具和方法来开发CLV模型,如广义线性模型(GLM),逐步回归,分类和回归树(CART)。 建立一个预测模型,以确定基于CLV的未来营销策略,这对于在每个客户的一生中与该公司保持良好的客户关系,实现更高的盈利能力和增长是具有非常有价值的过程。
6、实时和预测分析
分析在银行业中的重要性不可低估。机器学习算法和数据科学技术可以显着改善银行的分析策略,因为银行业务的每个使用案例都与分析密切相关。随着信息的可用性和多样性迅速增加,分析变得更加复杂和准确。
可用信息的潜在价值非常惊人:指示实际信号的有意义的数据量(不仅仅是噪声)在过去几年呈指数级增长,而数据处理器的成本和规模一直在下降。区分真正相关的数据和噪音有助于有效解决问题和制定更明智的战略决策。实时分析有助于了解阻碍业务的问题,而预测分析有助于选择正确的技术来解决问题。通过将分析整合到银行工作流程中,可以实现更好的结果,以提前避免潜在的问题。
7、客户细分
客户细分意味着根据他们的行为(对于行为分割)或特定特征(例如区域,年龄,对于人口统计学分割的收入)挑选出一组客户。数据科学家的一系列技术如聚类,决策树,逻辑回归等等,因此它们有助于了解每个客户群的CLV并发现高价值和低价值的细分市场。
没有必要证明客户的这种细分允许有效地分配营销资源,并且为每个客户群提供基于点的方法的最大化以及销售机会。不要忘记,客户细分旨在改善客户服务,并帮助客户忠诚和留住客户,这对银行业是非常必要的。
8、推荐引擎
数据科学和机器学习工具可以创建简单的算法,分析和过滤用户的活动,以便向他建议最相关和准确的项目。这种推荐引擎即使在他自己搜索它之前也会显示可能感兴趣的项目。要构建推荐引擎,数据专家需要分析和处理大量信息,识别客户配置文件,并捕获显示其交互的数据以避免重复提供。
推荐引擎的类型取决于算法的过滤方法。协同过滤方法既可以是基于用户的,也可以是基于项目的,并且可以与用户行为一起分析其他用户的偏好,然后向新用户提出建议。
协同过滤方法面临的主要挑战是使用大量数据,导致计算问题和价格上涨。基于内容的过滤与更简单的算法一起工作,其推荐与用户参考先前活动的项目相似的项目。如果行为复杂或连接不清,这些方法可能会失败。还有一种混合类型的引擎,结合了协作和基于内容的过滤。
没有任何方法是普适的,它们每个都有一些优点和缺点,正确的选择取决于你的目标和情况。
9、客户支持
杰出的客户支持服务是保持与客户长期有效关系的关键。作为客户服务的一部分,客户支持是银行业中一个重要但广泛的概念。实质上,所有银行都是基于服务的业务,因此他们的大部分活动都涉及服务元素。它包括全面及时地回应客户的问题和投诉,并与客户互动。
数据科学使这一过程更好地实现了自动化,更准确,个性化,直接和高效,并且降低了员工时间成本。
结论
为了获得竞争优势,银行必须承认数据科学的重要性,将其融入决策过程,并根据客户数据中获得可操作的见解制定战略。 从小型可管理的步骤开始,将大数据分析整合到您的运营模式中,并领先于竞争对手。
由于这种快速发展的数据科学领域以及将机器学习模型应用于实际数据的能力,因此可以每天扩展此用例列表,从而获得更多更准确的结果。
‘伍’ 《金融建模应用于资本市场、公司金融、风险管理与金融机构》pdf下载在线阅读全文,求百度网盘云资源
《金融建模》(托马斯.S.Y.霍)电子书网盘下载免费在线阅读
资源链接:
链接: https://pan..com/s/1A78ON61Sd_0BHplvMSYN5A
书名:金融建模
作者:托马斯.S.Y.霍
译者:蔡明超
豆瓣评分:7.6
出版社:上海财大
出版年份:2007-11
页数:686
内容简介:
作为一本教材性质的书籍,本书在许多方面给了读者一些分析问题观念上的冲击,从内容而言,至少包括以下几个方面:(1)将或有权益引入公司估值。第十二章和第十四章讲述公司估值模型,将公司看作经营收入的或有权益,固定运营成本作为一项长期债务,作者还以银行、保险公司等金融机构为案例进行了详细分析。(2)实物期权与公司估值。随着中国股市流动性的提升,上市公司具有的收缩、扩张等选择权价值提升,本书分析了传统现金流方法的不足,并通过具体实例讲述了如何对公司进行战略价值分析的方法。(3)如何从历史数据估值转换到相对价值估值。在传统的金融模型中,预期收益率或波动率需要历史数据进行估计,而历史数据不足或数据的非平稳性使得这种方法出现问题。相对价值则是根据市场观察到的基准金融产品的价格,估计建模需要的参数。本书在期限结构、公司估值、公司财务等多个领域介绍了相对价值方法的观念,并通过案例介绍具体应用。 本书至少特别适合于三类读者:(1)在校研究生。金融建模在商业运作中越来越重要,随着金融专业MBA与金融方向MBA的推出,金融建模逐步被引入MBA课程,本书正适合于作为MBA课程的教材,当然也适合于金融学硕士生的教材,配合教材网站基于EXCEL表单的练习,可以提升学生对模型的理解。同时,由于本书对模型介绍严密,对大多数结果进行了推导,因此也可以作为商学院和数学系金融数学或金融工程研究生课程的教材,有助于这些学生兼顾金融理论和模型的实际应用。(2)公司战略分析与公司财务分析人员。随着越来越多金融学专业的学生进入非金融类跨国公司,怎样让金融在公司运作中有用武之地,本书给这些读者提供了概念性指导和具体的应用案例。(3)进行估值的金融分析师。目前,绝大多数的金融分析师采用传统的贴现流方法,忽略了公司的战略价值,本书可帮助这些读者学会如何将实物期权的方法应用于公司估值。