全新的嵌入式網(wǎng)絡(luò)算法助力解決“金融欺詐”痛點
此次會議中,信也科技投遞了名為《Financial Fraud Detection on Micro-credit Loan Scenario via Fuller Location Information Embedding》的論文。據(jù)悉,該論文在組委會國內(nèi)外知名學(xué)者專家的匿名評審后獲得高度認可,并將在WWW會議上的金融科技主題討論會進行專場分享。
論文探討了金融科技領(lǐng)域非常重要的話題——“金融欺詐檢測”,它不僅是風(fēng)險控制引擎的關(guān)鍵功能之一,也為利率定價政策提供了最有力的保證,是助力個人借款業(yè)務(wù)健康發(fā)展的重要工具之一。
當(dāng)傳統(tǒng)金融欺詐檢測手段無法滿足金融科技的檢測需求時,本論文中提出了一種以“互聯(lián)網(wǎng)”的方法去解決問題的新思路,以數(shù)據(jù)驅(qū)動的算法作為金融欺詐檢測的主要工具。
論文重點討論了新思路將如何融合表示用戶數(shù)據(jù),如何證明其有效性,以及如何用在具體的業(yè)務(wù)模型中:從用戶相關(guān)的位置信息(比如線下用戶提交申請的地點、身份證上的地址等)和相關(guān)數(shù)據(jù)中抽取相應(yīng)的特征(例如客戶行為、經(jīng)濟及社會相關(guān)的數(shù)據(jù)),構(gòu)建地理位置的一個嵌入表示,并以此預(yù)測客戶在未來一段時間內(nèi)是否存在逾期的可能。論文設(shè)計和探索了與位置(地址)相關(guān)的新信息,這些信息被證實是金融欺詐檢測的重要因素之一(如圖1)。
圖一:地址和房價信息對逾期的影響
論文論證了位置坐標(biāo)和房價量化分析位置信息與欺詐行為之間的關(guān)系。然而在實際工作中,很少有人關(guān)注這些信息。這其中通常存在著利用位置信息的三大挑戰(zhàn):(1)數(shù)據(jù)稀疏性使金融欺詐檢測模型難以充分學(xué)習(xí)到位置信息與欺詐行為之間的關(guān)系;(2)僅考慮位置信息而不具有居民個性的金融欺詐檢測模型時,欺詐識別位置信息的能力被大大削弱;(3)位置信息的表示需要是有效且易于使用的,以便在下游任務(wù)中使用。
論文的一大貢獻是提出了一種基于自動編碼器的位置信息嵌入網(wǎng)絡(luò)FLIE,它可克服上述挑戰(zhàn),將理論應(yīng)用在實踐中。與原來的位置信息(用位置坐標(biāo)表示)相比,F(xiàn)LIE不僅包含原坐標(biāo)信息,還引入了位置坐標(biāo)的其他屬性,即社區(qū)坐標(biāo)和社區(qū)信息。此外,F(xiàn)LIE還考慮了客戶的個性及行為數(shù)據(jù),以增加客戶區(qū)分度。因此,F(xiàn)LIE的信息量比原始位置信息更為豐富(如圖2所示)。
圖二:地址embedding FLIE的整體架構(gòu)(圖(a) 四類信息作為FLIE的輸入,及embedding的模塊化結(jié)果,圖(b) encoding部分的結(jié)構(gòu))
為了更好的應(yīng)對挑戰(zhàn),解決數(shù)據(jù)稀疏問題,F(xiàn)LIE進行了自監(jiān)督學(xué)習(xí)。相對于監(jiān)督學(xué)習(xí),自監(jiān)督學(xué)習(xí)是從極不平衡數(shù)據(jù)中學(xué)習(xí)信息的更好選擇。同時,F(xiàn)LIE還將客戶個性引入到位置信息嵌入中,克服個體差異,增強位置信息嵌入的欺詐識別能力。我們的應(yīng)用程序收集了豐富的經(jīng)過授權(quán)的客戶行為,這些信息隱含了客戶的自然和社會屬性,因此非常適合為位置信息嵌入補充個性化信息。那么,F(xiàn)LIE探索了位置坐標(biāo)、社區(qū)坐標(biāo)、社區(qū)信息和客戶行為之間的關(guān)系。最后,F(xiàn)LIE用大量數(shù)據(jù)中學(xué)習(xí)嵌入的位置信息,取代人工制作的特征,解決了在下游任務(wù)中重復(fù)構(gòu)建特征的問題。論文采用了全局和局部的兩層注意力機制,也是一個明顯的特征,既簡化了注意力模型的復(fù)雜度,又保證了整體模型特征的充分抽?。ㄒ妶D3)。
圖三:全局和局部注意力機制通用的模型結(jié)構(gòu)
上述模型在現(xiàn)實中被用于風(fēng)險控制中,包括了逾期客戶預(yù)測和客戶分群兩大任務(wù)。逾期客戶預(yù)測涉及欺詐客戶檢測、信用額度和利率定價等應(yīng)用。客戶分群的應(yīng)用包括設(shè)置借款策略、營銷、睡眠客戶喚醒和對不同客戶群的風(fēng)險控制建模。
由此可見,F(xiàn)LIE模型在通過不斷試驗論證并應(yīng)用后,將幫助行業(yè)進一步解決是風(fēng)險控制中的金融欺詐檢測,推動行業(yè)發(fā)展,為我國金融科技健康發(fā)展貢獻積極力量。
厚積薄發(fā),實現(xiàn)WWW2021精彩亮相
被稱為“互聯(lián)網(wǎng)發(fā)展的風(fēng)向標(biāo)”的WWW2021,是被csrankings.org,csmetrics.org及中國計算機學(xué)會高度認可的A類推薦學(xué)術(shù)會議,曾在世界各地多個國家和地區(qū)舉辦,是互聯(lián)網(wǎng)業(yè)界的頂級盛事,并成為學(xué)術(shù)界以及產(chǎn)業(yè)界人士探討技術(shù)、交流思想、推動互聯(lián)網(wǎng)演變發(fā)展的峰會。
本次WWW2021將于2021年4月12日到4月23日在位于歐洲心臟的斯洛文尼亞首都盧布爾雅那舉行,信也科技在論文入選的同時,也將作為首家中國地區(qū)的贊助支持伙伴受邀參與大會專場研討,這也標(biāo)志著信也科技在學(xué)術(shù)研究方面的重大飛躍。
WWW2021選擇信也科技作為贊助合作伙伴是對其技術(shù)科研能力的認可。在過去五年中,信也科技的研發(fā)費用累計達10億元,投入金額在行業(yè)內(nèi)屬于較高水平,而對業(yè)務(wù)全流程的精細化運營以及技術(shù)微創(chuàng)新將是信也后續(xù)進行科技投入的重點方向。
截至2021年3月31日,信也科技共登記軟件著作權(quán)171項,另外已成功提交125個專利申請,12個被授權(quán)。信也科技還擁有高新技術(shù)企業(yè)、上海市企業(yè)技術(shù)中心、計算機三級等保等資質(zhì)。目前,信也科技完備的自研技術(shù)已實現(xiàn)了對業(yè)務(wù)流程的全覆蓋,如人臉識別、多場景OCR、聲紋識別等多模態(tài)核身、增信技術(shù),語音識別、意圖識別、對話管理、語音生成等全流程智能對話機器人技術(shù),以及基于復(fù)雜網(wǎng)絡(luò)的不良中介識別和團伙識別技術(shù)等。此外,還形成了智能投放、精準(zhǔn)營銷、核身、反欺詐、風(fēng)控決策流、Automl模型平臺和智能機器人等一系列AI產(chǎn)品。
信也科技每年舉辦的信也科技杯(前身“魔鏡杯”),更是不斷推動和激勵金融科技行業(yè)的技術(shù)進步與創(chuàng)新。信也科技取得成績的背后是長久以來著眼于科技并致力于科研的信念,亦是信也科技長期堅持與包括加州理工大學(xué)、加州大學(xué)洛杉磯分校、浙江大學(xué)等在內(nèi)的海內(nèi)外頂級名校以及知名科技企業(yè)合作開展產(chǎn)學(xué)研聯(lián)動的成果。
信也科技對金融科技的研發(fā)視為第一要務(wù),此次論文的入選與WWW2021會議的參與研討,是發(fā)展路上成果的展現(xiàn)。將來,信也科技會堅守“科技,讓金融更美好”的使命,積極提升科技研發(fā)能力,與金融科技行業(yè)共發(fā)展。
免責(zé)聲明:市場有風(fēng)險,選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。
關(guān)鍵詞: