『壹』 銀行數據倉庫體系實踐(18)--數據應用之信用風險建模
信用風險
銀行的經營風險的機構,那在第15節也提到了巴塞爾新資本協議對於銀行風險的計量和監管要求,其中信用風險是銀行經營的主要風險之一,它的管理好壞直接影響到銀行的經營利潤和穩定經營。信用風險是指交易對手未能履行約定契約中的義務而給銀行造成經濟損失的風險。典型的表現形式包括借款人發生違約或信用等級下降。借款人因各種原因未能及時、足額償還債務/銀行貸款、未能履行合同義務而發生違約時,債權人或銀行必將因為未能得到預期的收益而承擔財務上的損失。
那如何來表示某個交易對手的信用情況呢,一般使用信用等級或信用評分來來表示,等級越低或評分越低,發生違約的概率會增加。這個信用評分主要應用在客戶的貸前和貸後管理中,貸前是指客戶貸款申請階段,銀行受理客戶貸款申請時會根據客戶提交的信息、人行徵信、其它數據源按一定的規則計算出一個違約概率和風險評分或信用等級。再根據這個評分或評級來確定客戶的授信額度和利率。計算出的評分或評級越高,違約概率越低,比如在進行個人貸前評分時主要關注以下5方面:
(1)People:貸款人狀況,包括歷史還款表現、當前負債情況、資金飢渴度等;
(2)Payment:還款來源,如基本收入、資產水平、月收支負債比、無擔保總負債等;
(3)Purpose:資金用途,如消費、買房,需要規避貸款資金用於投資或投機性質較高領域,如股票和數字貨幣;
(4)Protection:債權確保,主要是看是否有抵押物或擔保,需要看抵押物用途、質量、價格等關鍵要素;
(5)Perspective:借款戶展望,從地域、行業、人生階段等考察穩定性及潛力;
貸後是指客戶借款後銀行持續跟進客戶的信用情況,如果發現信用評分降低或者某些指標達到風險預警指標的閾值,說明風險升高,則會進行凍結額度甚至提前進行貸款收回。特別是對於逾期客戶。
風險建模步驟
在進行信用評估時如何選擇客戶屬性、如何確定評分或評級規則呢?這就需要進行風險建模,通過分析歷史數據來確定哪些特徵或指標對客戶的違約相關性大,可以了解客戶的還款能力以及還款意願。並通過一定方法來建立評分和評級的規則。那風險建模主要分為以下步驟:
(1)業務理解:主要評估當前現狀、確定業務目標,選擇建模方法,比如需要進行XX貸款產品的貸前評分模型並確定準入規則,建模方式比如為評分卡,評分應用為基於評分確定貸款准入規則以及額度和利率規則,同時需要確定分析數據的好客戶和壞客戶標准,如逾期90天以上為壞客戶;
(2)數據理解:首先需要准備建模的樣本數據,如抽取近2年的獲得類似產品的客戶相關信息以及根據好客戶和壞客戶標准確定的結果。並針對業務數據進行業務含義理解、對數據進行收集、探索,了解每個變數的數據質量、缺失情況,數據分布等。比如對於客戶在人行的徵信數據、客戶在銀行的存款、理財等信息、以及客戶申請填寫的家庭、房產信息、外部獲得的客戶教育、司法等相關信息進行業務理解和數據分布、質量的探索,對缺失值比例過大的變數或准確性不高的變數進行剔除,同時也要確定對於樣本數據中哪些數據進行建模,哪些數據進行驗證。
(3)數據准備:主要對數據進行預處理和指標加工,指標加工指基於基礎數據進行指標加工,如最近1個月的徵信查詢次數,最近1年的逾期次數等,數據預處理主要工作包括對每一個變數進行數據清洗、缺失值處理、異常值處理、數據標准化等,主要目的是將獲取的原始數據轉變成可用於建模的結構化數據。
比如對於連續變數,就是要尋找合適的切割點把變數分為幾個區間段以使其具有最強的預測能力,也稱為「分箱」。例如客戶年齡就是連續變數,在這一步就是要研究分成幾組、每組切割點在哪裡預測能力是最強的。分箱的方法有等寬、等頻、聚類(k-means)、卡方分箱法、單變數決策樹演算法(ID3、C4.5、CART)、IV最大化分箱法、best-ks分箱法等。如果是離散變數,每個變數值都有一定的預測能力,但是考慮到可能幾個變數值有相近的預測能力,因此也需要進行分組。
通過對變數的分割、分組和合並轉換,分析每個變數對於結果的相關性,剔除掉預測能力較弱的變數,篩選出符合實際業務需求、具有較強預測能力的變數。檢測變數預測能力的方法有:WOE(weight of Evidence) 、IV(informationvalue)等。
(4)分析建模:即對於篩選出來的變數以及完成好壞定義的樣本結果。放入模型進行擬合。如評分卡一般採用常見的邏輯回歸的模型,PYTHON、SAS、R都有相關的函數實現模型擬合。以下是生成的評分卡的例子。
(5)評估及報告:即通過驗證樣本對模型的預測進行校驗。評估模型的准確性和穩健性,並得出分析報告。常用的方法有ROC曲線、lift提升指數、KS(Kolmogorov-Smirnov)曲線、GINI系數等。
(6)應用:對模型進行實際部署和應用,如基於評分進行客戶准入和產生額度,並在貸款系統進行模型部署,自動對申請客戶進行評分。
(7)監測:建立多種報表對模型的有效性、穩定性進行監測,如穩定性監控報表來比較新申請客戶與開發樣本客戶的分值分布,不良貸款分析報表來評估不同分數段的不良貸款,並且與開發時的預測進行比較,監控客戶信貸質量。隨著時間的推移和環境變化,評分模型的預測力會減弱,所以需要持續監控並進行適當調整或重建。
在信用風險建模中,目前評分卡建模還是主要的方式,除了申請評分(A卡(Application score card))還有B卡(Behavior score card)行為評分卡、C卡(Collection score card)催收評分卡。B卡主要進行客戶貸後管理,如何進行風險預警,C卡進行催收管理,確定如何催收以及催收方式和時間點。信用風險模型中還有一個是反欺詐模型,它主要是識別假冒身份、虛假信息、批量薅羊毛等欺詐行為。隨著機器學習和大數據的發展,其它的一些建模方式如決策樹、深度神經網路也越來越多的應用到了風險建模中。
信用風險模型是數據倉庫支持的重要數據應用之一,在風險建模分析階段,數據倉庫是建模樣本數據以及衍生指標加工的主要提供者,業務人員一般在自助分析平台進行數據分析和建模,模型建立完成並部署後,會基於數據倉庫數據進行模型效果的監控。在貸後管理中,風險集市也會進行貸後指標的加工。另外風險模型以及預警中會經常使用到外部數據,這部分數據也是通過數據倉庫進行對接、加工和存儲。
『貳』 《金融科技創新》pdf下載在線閱讀全文,求百度網盤雲資源
《金融科技創新》(Paolo Sironi(保羅•西羅尼))電子書網盤下載免費在線閱讀
鏈接:
書名:金融科技創新
作者:Paolo Sironi(保羅•西羅尼)
譯者:馬睿
豆瓣評分:6.4
出版社:中信出版社
出版年份:2017-1
頁數:246
內容簡介:
本書通過互聯網金融、社會化媒體、大數據分析、數字技術等,將財富管理行業向更高效的、以客戶為中心的咨詢流程轉變。目標導向即通過新的金融、機器、網路技術來滿足客戶的個性化需求。
智能投顧(Robo-advisor)和金融科技創新(FinTech)最近成了全球熱點。市場的力量正在改變銀行和融資顧問原有的商業模式,向由機器人技術驅動的商業模式轉化。理財經理正站在數字化浪潮的震盪中, 幾百年來根深蒂固的行業格局逐漸從方方面面開始發生改變。
本書揭示了促成創新思維的各種力量, 密切審視了財富管理行業發生的革命, 尤其是數字化咨詢、 個性化投資和能夠洞察客戶行為的認知分析方法。本書的目標是改善金融顧問和客戶之間的投資體驗, 讓他們得以用更為直觀的、 目標導向的投資話語進行交流 。不管是金融科技公司還是從事數字化的機構, 誰能利用智能投顧進行目標導向的投資, 誰就最有希望超越對手。
個人投資者、 金融顧問、 投資組合經理、 技術和數字化經理、 銀行業高管和金融科技企業家都可以從這本書中得到對財富管理行業轉型的深刻見解, 從而理解新技術和定量金融之間的聯系, 並適應更加嚴格的市場監管和更高的信用標准。
作者簡介:
保羅•西羅尼(Paolo Sironi)
投資組合管理和金融科技創新領域的知名作家。他目前就職於IBM,擔任財富管理和金融科技分析師。保羅將金融和科技在全球范圍內結合起來,在財富管理、資產管理、風險管理、金融科技等多個領域展現出了扎實的專業素養。
在加入IBM之前,保羅出資組建了一家金融科技初創公司(2008年),旨在向財富經理們提供目標導向的投資解決方案。隨著投資合夥人、世界頂尖的風險管理解決方案提供商Algorithmics公司被IBM收購(2012年),這家初創公司也成為IBM的一個部門。
保羅擁有10年風險管理經驗。此前,他曾在義大利聯合聖保羅銀行(Banca Intesa Sanpaolo)主管市場與交易對手風險建模工作。
『叄』 《被平均的風險如何應對未來的不確定性》pdf下載在線閱讀,求百度網盤雲資源
《被平均的風險》(薩姆·薩維奇(Sam Savage))電子書網盤下載免費在線閱讀
資源鏈接:
鏈接:https://pan..com/s/1PhTk0JU440wB6hmFq-PqSg
書名:被平均的風險
作者:薩姆·薩維奇(Sam Savage)
譯者:劉偉
豆瓣評分:6.4
出版社:中信出版集團
出版年份:2019-4-1
頁數:418
內容簡介:
為什麼人們對變化無常的事物進行風險評估時總是一錯再錯?為什麼基於平均值的預測和決策在金融、醫療保健、會計、反恐戰爭和氣候變化等各個領域總是漏洞百出?因為我們一直試圖用「蒸汽時代」的統計學來把握「信息時代」的風險。
作者基於自己多年的咨詢、培訓經驗和研究成果,列出了平均值的12條罪狀,介紹了概率管理這一新興領域,旨在通過新的統計學手段和技術工具,彌補平均值的缺陷,更好地揭示風險、把握不確定性。
本書可以幫助我們更有效地對未來的情況做出判斷,從而制定出更合理的決策。
作者簡介:
薩姆·薩維奇((Sam Savage)
斯坦福大學工程學院顧問教授,劍橋大學賈奇商學院研究員,其父為美國著名統計學家倫納德·吉米·薩維奇(Leonard Jimmie Savage)。作者長期從事與統計學和風險評估相關的工作和研究,根據「決策應基於對不確定的未來更大程度的主觀判斷」的觀點,逐漸發展出一種風險建模的新方法「概率管理」,並帶領著由Frontline系統公司、甲骨文公司以及SAS軟體研究所等機構組成的社團開發了概率分布列(DIST)——這是一種用來儲存概率分布的新型電腦數據類型。作者還自任Probability Management.0rg網站的主席。
作者在許多專業期刊和大眾媒體上發表過文章,比如《哈佛商業評論》、《投資組合管理雜志》、《華盛頓郵報》以及《今日奧姆斯》(ORMSToday)雜志等。除了教書育人和科學研究之外,他還為眾多的企業、機構和政府部門提供咨詢和培訓服務。
『肆』 科普文:銀行業9大數據科學應用案例解析!
在銀行業中使用數據科學不僅僅是一種趨勢,它已成為保持競爭的必要條件。 銀行必須認識到,大數據技術可以幫助他們有效地集中資源,做出更明智的決策並提高績效。
以下我們羅列銀行業使用的數據科學用例清單,讓您了解如何處理大量數據以及如何有效使用數據。
(1)欺詐識別
(2)管理客戶數據
(3)投資銀行的風險建模
(4)個性化營銷
(5)終身價值預測
(6)實時和預測分析
(7)客戶細分
(8)推薦引擎
(9)客戶支持
(10)結論
1、欺詐識別
機器學習對於有效檢測和防範涉及信用卡,會計,保險等的欺詐行為至關重要。 銀行業務中的主動欺詐檢測對於為客戶和員工提供安全性至關重要。 銀行越早檢測到欺詐行為,其越快可以限制帳戶活動以減少損失。 通過實施一系列的欺詐檢測方案,銀行可以實現必要的保護並避免重大損失。
欺詐檢測的關鍵步驟包括:
獲取數據樣本進行模型估計和初步測試 模型估計 測試階段和部署。
由於每個數據集都不同,每個數據集都需要由數據科學家進行個別訓練和微調。 將深厚的理論知識轉化為實際應用需要數據挖掘技術方面的專業知識,如關聯,聚類,預測和分類。
高效欺詐檢測的一個例子是,當一些異常高的交易發生時,銀行的欺詐預防系統被設置為暫停,直到賬戶持有人確認交易。對於新帳戶,欺詐檢測演算法可以調查非常高的熱門項目購買量,或者在短時間內使用類似數據打開多個帳戶。
2、管理客戶數據
銀行有義務收集,分析和存儲大量數據。但是,機器學習和數據科學工具不是將其視為合規性練習,而是將其轉化為更多地了解其客戶以推動新的收入機會的可能性。
如今,數字銀行越來越受歡迎並被廣泛使用。這創建了TB級的客戶數據,因此數據科學家團隊的第一步是分離真正相關的數據。之後,通過准確的機器學習模型幫助數據專家掌握有關客戶行為,交互和偏好的信息,可以通過隔離和處理這些最相關的客戶信息來改善商業決策,從而為銀行創造新的收入機會。
3、投資銀行的風險建模
風險建模對投資銀行來說是一個高度優先考慮的問題,因為它有助於規範金融活動,並在定價金融工具時發揮最重要的作用。投資銀行評估公司在企業融資中創造資本,促進兼並和收購,進行公司重組或重組以及用於投資目的的價值。
這就是為什麼風險模型對於銀行來說顯得非常重要,最好是通過掌握更多信息和儲備數據科學工具來評估。現在,通過大數據的力量,行業內的創新者正在利用新技術進行有效的風險建模,從而實現更好的數據驅動型決策。
4、個性化營銷
市場營銷成功的關鍵在於制定適合特定客戶需求和偏好的定製化報價。數據分析使我們能夠創建個性化營銷,在適當的時間在正確的設備上為合適的人員提供合適的產品。數據挖掘廣泛用於目標選擇,以識別新產品的潛在客戶。
數據科學家利用行為,人口統計和歷史購買數據建立一個模型,預測客戶對促銷或優惠的反應概率。因此,銀行可以進行高效,個性化的宣傳並改善與客戶的關系。
5、終身價值預測
客戶生命周期價值(CLV)預測了企業從與客戶的整個關系中獲得的所有價值。 這項措施的重要性正在快速增長,因為它有助於創建和維持與特定客戶的有利關系,從而創造更高的盈利能力和業務增長。
獲得和維系有利可圖的客戶對銀行來說是一個不斷增長的挑戰。 隨著競爭越來越激烈,銀行現在需要360度全方位了解每位客戶,以便有效地集中資源。 這就是數據科學進入的地方。首先,必須考慮大量數據:如客戶獲得和流失的概念,各種銀行產品和服務的使用,數量和盈利能力以及其他客戶的特點 如地理,人口和市場數據。
這些數據通常需要大量清洗和操作才能變得可用和有意義。 銀行客戶的概況,產品或服務差異很大,他們的行為和期望也不盡相同。 數據科學家的工具中有許多工具和方法來開發CLV模型,如廣義線性模型(GLM),逐步回歸,分類和回歸樹(CART)。 建立一個預測模型,以確定基於CLV的未來營銷策略,這對於在每個客戶的一生中與該公司保持良好的客戶關系,實現更高的盈利能力和增長是具有非常有價值的過程。
6、實時和預測分析
分析在銀行業中的重要性不可低估。機器學習演算法和數據科學技術可以顯著改善銀行的分析策略,因為銀行業務的每個使用案例都與分析密切相關。隨著信息的可用性和多樣性迅速增加,分析變得更加復雜和准確。
可用信息的潛在價值非常驚人:指示實際信號的有意義的數據量(不僅僅是雜訊)在過去幾年呈指數級增長,而數據處理器的成本和規模一直在下降。區分真正相關的數據和噪音有助於有效解決問題和制定更明智的戰略決策。實時分析有助於了解阻礙業務的問題,而預測分析有助於選擇正確的技術來解決問題。通過將分析整合到銀行工作流程中,可以實現更好的結果,以提前避免潛在的問題。
7、客戶細分
客戶細分意味著根據他們的行為(對於行為分割)或特定特徵(例如區域,年齡,對於人口統計學分割的收入)挑選出一組客戶。數據科學家的一系列技術如聚類,決策樹,邏輯回歸等等,因此它們有助於了解每個客戶群的CLV並發現高價值和低價值的細分市場。
沒有必要證明客戶的這種細分允許有效地分配營銷資源,並且為每個客戶群提供基於點的方法的最大化以及銷售機會。不要忘記,客戶細分旨在改善客戶服務,並幫助客戶忠誠和留住客戶,這對銀行業是非常必要的。
8、推薦引擎
數據科學和機器學習工具可以創建簡單的演算法,分析和過濾用戶的活動,以便向他建議最相關和准確的項目。這種推薦引擎即使在他自己搜索它之前也會顯示可能感興趣的項目。要構建推薦引擎,數據專家需要分析和處理大量信息,識別客戶配置文件,並捕獲顯示其交互的數據以避免重復提供。
推薦引擎的類型取決於演算法的過濾方法。協同過濾方法既可以是基於用戶的,也可以是基於項目的,並且可以與用戶行為一起分析其他用戶的偏好,然後向新用戶提出建議。
協同過濾方法面臨的主要挑戰是使用大量數據,導致計算問題和價格上漲。基於內容的過濾與更簡單的演算法一起工作,其推薦與用戶參考先前活動的項目相似的項目。如果行為復雜或連接不清,這些方法可能會失敗。還有一種混合類型的引擎,結合了協作和基於內容的過濾。
沒有任何方法是普適的,它們每個都有一些優點和缺點,正確的選擇取決於你的目標和情況。
9、客戶支持
傑出的客戶支持服務是保持與客戶長期有效關系的關鍵。作為客戶服務的一部分,客戶支持是銀行業中一個重要但廣泛的概念。實質上,所有銀行都是基於服務的業務,因此他們的大部分活動都涉及服務元素。它包括全面及時地回應客戶的問題和投訴,並與客戶互動。
數據科學使這一過程更好地實現了自動化,更准確,個性化,直接和高效,並且降低了員工時間成本。
結論
為了獲得競爭優勢,銀行必須承認數據科學的重要性,將其融入決策過程,並根據客戶數據中獲得可操作的見解制定戰略。 從小型可管理的步驟開始,將大數據分析整合到您的運營模式中,並領先於競爭對手。
由於這種快速發展的數據科學領域以及將機器學習模型應用於實際數據的能力,因此可以每天擴展此用例列表,從而獲得更多更准確的結果。
『伍』 《金融建模應用於資本市場、公司金融、風險管理與金融機構》pdf下載在線閱讀全文,求百度網盤雲資源
《金融建模》(托馬斯.S.Y.霍)電子書網盤下載免費在線閱讀
資源鏈接:
鏈接: https://pan..com/s/1A78ON61Sd_0BHplvMSYN5A
書名:金融建模
作者:托馬斯.S.Y.霍
譯者:蔡明超
豆瓣評分:7.6
出版社:上海財大
出版年份:2007-11
頁數:686
內容簡介:
作為一本教材性質的書籍,本書在許多方面給了讀者一些分析問題觀念上的沖擊,從內容而言,至少包括以下幾個方面:(1)將或有權益引入公司估值。第十二章和第十四章講述公司估值模型,將公司看作經營收入的或有權益,固定運營成本作為一項長期債務,作者還以銀行、保險公司等金融機構為案例進行了詳細分析。(2)實物期權與公司估值。隨著中國股市流動性的提升,上市公司具有的收縮、擴張等選擇權價值提升,本書分析了傳統現金流方法的不足,並通過具體實例講述了如何對公司進行戰略價值分析的方法。(3)如何從歷史數據估值轉換到相對價值估值。在傳統的金融模型中,預期收益率或波動率需要歷史數據進行估計,而歷史數據不足或數據的非平穩性使得這種方法出現問題。相對價值則是根據市場觀察到的基準金融產品的價格,估計建模需要的參數。本書在期限結構、公司估值、公司財務等多個領域介紹了相對價值方法的觀念,並通過案例介紹具體應用。 本書至少特別適合於三類讀者:(1)在校研究生。金融建模在商業運作中越來越重要,隨著金融專業MBA與金融方向MBA的推出,金融建模逐步被引入MBA課程,本書正適合於作為MBA課程的教材,當然也適合於金融學碩士生的教材,配合教材網站基於EXCEL表單的練習,可以提升學生對模型的理解。同時,由於本書對模型介紹嚴密,對大多數結果進行了推導,因此也可以作為商學院和數學系金融數學或金融工程研究生課程的教材,有助於這些學生兼顧金融理論和模型的實際應用。(2)公司戰略分析與公司財務分析人員。隨著越來越多金融學專業的學生進入非金融類跨國公司,怎樣讓金融在公司運作中有用武之地,本書給這些讀者提供了概念性指導和具體的應用案例。(3)進行估值的金融分析師。目前,絕大多數的金融分析師採用傳統的貼現流方法,忽略了公司的戰略價值,本書可幫助這些讀者學會如何將實物期權的方法應用於公司估值。