搜狐媒體平臺06-20 10:40大
如果你身為高富帥或者白富美,同時又是個剁手族,那你的阿里巴巴芝麻信用分一定很高。這樣,當其他人還在焦急地等待簽證消息時,你就可以瀟灑地從限量版的愛馬仕包包里拿出iPhone6s,點擊支付寶,輕觸芝麻信用,哇,你的信用分數(shù)是760!隨后你任性地把護照和iPhone6s扔在簽證官面前,看著他/她在你護照上蓋章,你微笑著說:Please charge Visa fee directly from my Ant Credit Account (螞蟻花唄)!
除了簽證辦理之外,其他許多生活方面的應(yīng)用也離不開芝麻信用。如果你想免押金租車、租房,在酒店先入住后付款,都需要一定的芝麻信用分數(shù);更不用說金融方面的信用貸款了……FICO評分在中國的推廣一直說不上熱火朝天,可是在中國有芝麻信用分的人不說上億,起碼也有幾千萬吧。這么廣泛的客戶來源,再加上支付寶的強大覆蓋力,F(xiàn)ICO評分這樣的傳統(tǒng)信用評分還有多大價值呢?會不會在不遠的將來,就被芝麻信用分、騰訊征信評分取代映襯得黯然失色呢?
出去玩的有福了!超便宜!
廣告
廣告詳情
其實也不能一概而論。讓我們先看看傳統(tǒng)的FICO評分和芝麻信用分是如何計算出來的吧:
FICO評分是Fair Isaac公司開發(fā)的信用評分系統(tǒng),也是目前美國應(yīng)用得最廣泛的一種。FICO評分系統(tǒng)得出的信用分數(shù)范圍在300~850分之間,分數(shù)越高,說明客戶的信用風險越小,它采集客戶的人口統(tǒng)計學信息、歷史貸款還款信息、歷史金融交易信息、人民銀行征信信息等,通過邏輯回歸模型計算客戶的還款能力,預測客戶在未來一年違約的概率:
1. 人口統(tǒng)計學信息:如客戶年齡、家庭結(jié)構(gòu)、住房情況、工作類別及時間等;
2. 歷史貸款還款信息:即過去6個月或12個月的付款方式、逾期次數(shù)等;
3. 歷史金融交易信息:即過去6個月或12個月的平均月交易筆數(shù)、金額等;
4. 銀行征信信息:如過去12個月中新開的賬戶總數(shù)、所有賬戶的總額度、賬戶是否逾期等。
看,以上這些信息都是FICO評分模型的自變量,最終會通過邏輯回歸模型輸出最終分數(shù)。不同的是,阿里巴巴推出的芝麻信用分則是以大數(shù)據(jù)分析技術(shù)為基礎(chǔ),采集多元化數(shù)據(jù),包括傳統(tǒng)的金融類交易、還款數(shù)據(jù),第三方的非金融行為數(shù)據(jù),互聯(lián)網(wǎng)、移動網(wǎng)絡(luò)和社交網(wǎng)絡(luò)數(shù)據(jù)等,幫助貸款方從多個方面考察個體的還款能力、還款意愿,做出合理、全面的信用評分。
上圖展現(xiàn)了基于大數(shù)據(jù)分析技術(shù)的機器集成學習法Ensemble。不同于傳統(tǒng)的邏輯回歸模型,它采集了上萬個數(shù)據(jù)項、從不同的層面(還款能力、還款意愿、欺詐可能性、穩(wěn)定性等)對個體進行建模打分;再把這些單個層面的評分、結(jié)合個體的綜合信息,給個體一個最終的信用評分。
兩種評分模型采用數(shù)據(jù)量的不同體現(xiàn)了其評分思路的區(qū)別。通常,F(xiàn)ICO評分模型只有十幾個評分項,每一個評分項對目標變量(即是否違約)的預測性和影響力都很高。但是,在機器集成學習法中,最終進入模型的評分項可能多達成千上萬,而且每一個這樣的評分項對目標變量的單獨預測性可能都很小;Ensemble就是利用機器學習法,把這么多微小的預測性匯總成為最終對個體的違約可能性有很強預測性的評分。
那么,芝麻信用有哪些局限性呢?我們不妨參照已有的實例來進行橫向?qū)Ρ确治?。美國的互?lián)網(wǎng)金融公司ZestFinance從2009年就開始研發(fā)基于大數(shù)據(jù)的信用評估模型:融合多源信息,采用機器學習的預測模型和集成學習策略,進行大數(shù)據(jù)挖掘。他們收集了上千種來源于第三方的數(shù)據(jù),比如水、電、煤賬單,電話賬單,房屋租賃信息,和傳統(tǒng)的金融借貸、還款信息等;通過機器學習的方法尋找數(shù)據(jù)間的關(guān)聯(lián)性并對數(shù)據(jù)進行必要的轉(zhuǎn)換;在關(guān)聯(lián)性的基礎(chǔ)上將數(shù)據(jù)重新整合成不同的測量指標;每一種指標反映個體的某一方面特征,比如詐騙概率、長期和短期的信用風險和償還能力;最后,將所有指標按加權(quán)投票的原則,做成最終的信用評分。
但是ZestFinance的個體信用評分只適用于缺乏或沒有信貸記錄的人群,也就是說,這些人或者剛移民到美國,或者之前從來沒有過貸款行為。所以ZestFinance 的大數(shù)據(jù)征信最終無法替換FICO評分,而只是用來補充FICO評分的不足。原因包括多個方面:
1. ZestFinance 的大數(shù)據(jù)征信的體量不大,到現(xiàn)在只為10萬美國人提供服務(wù),對模型的有效性、準確性還很難做出有效的評價。
2. ZestFinance 的大數(shù)據(jù)模型也給傳統(tǒng)的風險管理帶來挑戰(zhàn):傳統(tǒng)的FICO評分需要處理的變量比較少,對模型結(jié)果可以給出合理的解釋,方便金融機構(gòu)不同部門之間、金融機構(gòu)與客戶之間的溝通。而ZestFinance 的基于大數(shù)據(jù)的數(shù)以千計的變量規(guī)模和多模型應(yīng)用,使得數(shù)據(jù)的處理和模型的解釋變得很復雜,在實際應(yīng)用中會帶來許多麻煩。
3. ZestFinance 在利用個體消費者的大數(shù)據(jù)進行信用評估時,很多數(shù)據(jù)會涉及個人隱私,比如個人社交網(wǎng)絡(luò)數(shù)據(jù)(微信朋友圈)、電商交易數(shù)據(jù)、通話記錄等,所以涉及個人隱私的保護和合規(guī)性。
阿里巴巴的芝麻信用和ZestFinance的大數(shù)據(jù)征信相似,也存在一定的問題,比如:芝麻信用覆蓋的人群可能上億,但是芝麻信用分的有效性和準確性還沒有得到公認的評估;憑借高的芝麻信用分可以在支付寶開通螞蟻花唄,類似信用卡的透支服務(wù),但是芝麻信用在其他方面的應(yīng)用還沒有達到一定的規(guī)模。
當然,大數(shù)據(jù)信用評分終歸是歷史的趨勢,目前FICO公司和國外三大征信機構(gòu)都已經(jīng)開始了利用大數(shù)據(jù)分析技術(shù)來完善傳統(tǒng)信用評估體系的前瞻性研究。比如,益百利Experian已經(jīng)投入研究團隊關(guān)注社交網(wǎng)絡(luò)數(shù)據(jù)對信用評分的影響;FICO公司也已經(jīng)開始了在線評估的信息工具和基于互聯(lián)網(wǎng)的信用評估系統(tǒng)的項目研究。我們相信,隨著理論與方法的完善和實踐的深入,基于大數(shù)據(jù)分析的信用評分終有一天將占據(jù)主流地位,不過,市場上會不會出現(xiàn)有力的新競爭者、最終贏家究竟是芝麻還是西瓜,仍需我們拭目以待。
文章來源36大數(shù)據(jù),www.36dsj.com ,微信號dashuju36 ,36大數(shù)據(jù)是一個專注大數(shù)據(jù)創(chuàng)業(yè)、大數(shù)據(jù)技術(shù)與分析、大數(shù)據(jù)商業(yè)與應(yīng)用的網(wǎng)站。分享大數(shù)據(jù)的干貨教程和大數(shù)據(jù)應(yīng)用案例,提供大數(shù)據(jù)分析工具和資料下載,解決大數(shù)據(jù)產(chǎn)業(yè)鏈上的創(chuàng)業(yè)、技術(shù)、分析、商業(yè)、應(yīng)用等問題,為大數(shù)據(jù)產(chǎn)業(yè)鏈上的公司和數(shù)據(jù)行業(yè)從業(yè)人員提供支持與服務(wù)。
via:KPMG大數(shù)據(jù)挖掘
End.
展開剩余45%
聯(lián)系客服