近日,奇富科技(QFIN)聯(lián)合復(fù)旦大學(xué)、華南理工大學(xué)研究人員共同發(fā)起了一場(chǎng)以“信貸多模態(tài)ai(886062)如何定標(biāo)準(zhǔn)”為主題的直播討論。直播深度解析首個(gè)面向信貸場(chǎng)景的多模態(tài)評(píng)測(cè)基準(zhǔn)FCMBench-V1.0——該基準(zhǔn)圍繞多模態(tài)感知、推理與決策等關(guān)鍵環(huán)節(jié)設(shè)計(jì)評(píng)估任務(wù),并同步開(kāi)源數(shù)據(jù)集與評(píng)測(cè)工具,試圖為金融AI建立一把可被廣泛認(rèn)可的“尺子”。整場(chǎng)分享時(shí)長(zhǎng)1小時(shí),融合學(xué)術(shù)前沿與產(chǎn)業(yè)實(shí)踐,為金融機(jī)構(gòu)、科研院校及行業(yè)從業(yè)者提供了專業(yè)參考與發(fā)展思路。以下為本次直播核心內(nèi)容梳理。
產(chǎn)業(yè)實(shí)踐視角:FCMBench讓金融AI模型能力有了統(tǒng)一衡量標(biāo)尺
奇富科技(QFIN)多模態(tài)負(fù)責(zé)人楊葉輝率先從產(chǎn)業(yè)實(shí)踐角度,剖析了金融AI的發(fā)展痛點(diǎn)與FCMBench-V1.0的研發(fā)初衷和核心設(shè)計(jì)邏輯。他形象地將AI比作工具“鋤頭”,而金融、醫(yī)療這類高門(mén)檻行業(yè)則是具備發(fā)展?jié)摿Φ摹胺饰滞恋亍?,金融業(yè)務(wù)對(duì)隱私、安全、合規(guī)的天然高要求,決定了模型能力的驗(yàn)證絕不能靠“自說(shuō)自話”,必須建立一套客觀、統(tǒng)一的評(píng)測(cè)體系。
FCMBench-V1.0的誕生,正是為了解決金融機(jī)構(gòu)在模型選型時(shí)的核心困惑。楊葉輝指出,當(dāng)前金融行業(yè)存在不同模型各自宣稱高評(píng)分、卻無(wú)統(tǒng)一對(duì)比標(biāo)準(zhǔn)的問(wèn)題,且模型在實(shí)驗(yàn)室環(huán)境與真實(shí)生產(chǎn)環(huán)境中還易出現(xiàn)性能大幅下滑的情況,F(xiàn)CMBench的核心價(jià)值,就是做一把衡量模型能力的“統(tǒng)一尺子”,把不同模型拉到同一條起跑線上,讓其能力在真實(shí)業(yè)務(wù)條件下接受檢驗(yàn)。
圍繞這把“尺子”的設(shè)計(jì),楊葉輝提出了FCMBench堅(jiān)守的三大原則:公平性、科學(xué)性、實(shí)戰(zhàn)性。公平性杜絕“自說(shuō)自話”,建立統(tǒng)一評(píng)測(cè)底線;科學(xué)性體現(xiàn)為數(shù)據(jù)分布、任務(wù)與難度設(shè)置合理,可有效區(qū)分算法差異;實(shí)戰(zhàn)性則是核心,力求模型在基準(zhǔn)上的優(yōu)異表現(xiàn)能直接適配真實(shí)業(yè)務(wù)場(chǎng)景。
為了讓評(píng)測(cè)更貼合實(shí)際,F(xiàn)CMBench通過(guò)模擬十余種真實(shí)拍攝干擾、設(shè)置證件信息合理性判斷、多證件比對(duì)等推理類任務(wù),還原信貸業(yè)務(wù)中的各類風(fēng)險(xiǎn)場(chǎng)景。楊葉輝舉例,若用戶提供的年收入累計(jì)超50萬(wàn)但納稅比例低于10%,這類明顯的風(fēng)險(xiǎn)點(diǎn)便是FCMBench納入的推理類難題,以此考驗(yàn)?zāi)P偷娘L(fēng)險(xiǎn)識(shí)別和反欺詐判斷能力,確保評(píng)測(cè)任務(wù)設(shè)置的實(shí)際價(jià)值。
在楊葉輝看來(lái),F(xiàn)CMBench并非“為做而做”,其核心目標(biāo)是反哺業(yè)務(wù)及行業(yè)本身,定位是金融行業(yè)的公共資源,旨在通過(guò)統(tǒng)一標(biāo)準(zhǔn)實(shí)現(xiàn)AI能力與業(yè)務(wù)價(jià)值的深度綁定。同時(shí),F(xiàn)CMBench也是金融大模型學(xué)術(shù)研究與產(chǎn)業(yè)應(yīng)用的溝通橋梁,技術(shù)層面將持續(xù)擴(kuò)充任務(wù)、數(shù)據(jù)類型、語(yǔ)種與模態(tài),實(shí)現(xiàn)信貸AI全場(chǎng)景覆蓋;行業(yè)層面則會(huì)聯(lián)動(dòng)高校攻關(guān)技術(shù)難點(diǎn),邀請(qǐng)銀行及各類金融機(jī)構(gòu)深度參與共建,豐富真實(shí)業(yè)務(wù)數(shù)據(jù)與場(chǎng)景,推動(dòng)其升級(jí)為行業(yè)公認(rèn)的評(píng)測(cè)標(biāo)準(zhǔn)乃至團(tuán)體標(biāo)準(zhǔn),成為金融機(jī)構(gòu)模型選型與合作的實(shí)戰(zhàn)門(mén)檻。
學(xué)術(shù)研究視角:金融AI的“ImageNet時(shí)刻”亟待到來(lái)
如果說(shuō)產(chǎn)業(yè)界關(guān)注的是“尺子”怎么用,那么學(xué)術(shù)界更關(guān)心“尺子”為何缺失,以及如何打造一把真正公信力的“標(biāo)尺”。
復(fù)旦大學(xué)陳濤教授從AI發(fā)展史切入,直指問(wèn)題本質(zhì):“AI大模型發(fā)展高度依賴開(kāi)源生態(tài),而金融領(lǐng)域目前缺乏國(guó)內(nèi)外公認(rèn)的統(tǒng)一評(píng)測(cè)數(shù)據(jù)集與標(biāo)準(zhǔn)。沒(méi)有統(tǒng)一‘尺子’,企業(yè)與學(xué)術(shù)界難以協(xié)同投入研究,無(wú)法形成強(qiáng)有力的發(fā)展生態(tài),這從根本上制約了金融大模型的誕生?!?/p>
他將目光投向了深度學(xué)習(xí)的里程碑——ImageNet。“ImageNet數(shù)據(jù)集推動(dòng)了深度學(xué)習(xí)的爆發(fā),成為圖像識(shí)別領(lǐng)域的統(tǒng)一評(píng)測(cè)標(biāo)桿,類似的評(píng)測(cè)標(biāo)準(zhǔn)是AI行業(yè)突破的關(guān)鍵?!标悵J(rèn)為,當(dāng)前金融領(lǐng)域正缺乏這種統(tǒng)一、全面的評(píng)測(cè)數(shù)據(jù)集,難以形成協(xié)同發(fā)展生態(tài),亟需打造屬于自身的“ImageNet”。
對(duì)于奇富科技(QFIN)推出的FCMBench-V1.0,陳濤評(píng)價(jià)其為當(dāng)前國(guó)內(nèi)外金融信貸領(lǐng)域規(guī)模大、權(quán)威性高的統(tǒng)一評(píng)測(cè)基準(zhǔn)之一。相較于行業(yè)內(nèi)其他零散的評(píng)測(cè)數(shù)據(jù)集,F(xiàn)CMBench-V1.0首次實(shí)現(xiàn)了模態(tài)統(tǒng)一,覆蓋信貸、風(fēng)控等多類核心任務(wù),且全程面向真實(shí)業(yè)務(wù)場(chǎng)景設(shè)計(jì),由奇富科技(QFIN)及業(yè)界首發(fā)的特性,讓其兼具全面性與實(shí)用性,成為金融領(lǐng)域打造專屬“ImageNet”的重要探索。
產(chǎn)學(xué)研融合視角:金融AI落地優(yōu)勢(shì)顯著,F(xiàn)CMBench銜接產(chǎn)業(yè)需求與人才培養(yǎng)
華南理工大學(xué)許言午教授則從產(chǎn)學(xué)研融合的角度,解讀了金融AI的實(shí)際應(yīng)用現(xiàn)狀、落地優(yōu)勢(shì),并闡述了FCMBench在行業(yè)人才培養(yǎng)方面的重要價(jià)值。
他首先澄清了一個(gè)普遍誤解:“很多人直覺(jué)上覺(jué)得AI在金融領(lǐng)域‘存在感不強(qiáng)’,其實(shí)并不準(zhǔn)確。AI早已深度參與保險(xiǎn)定價(jià)、資產(chǎn)評(píng)估和量化交易等核心場(chǎng)景,只是這些價(jià)值并不直接呈現(xiàn)在ToC產(chǎn)品中,因此‘看不見(jiàn)’。”
同時(shí),許言午還指出,相較于醫(yī)療等其他高門(mén)檻行業(yè),金融AI具備顯著的落地效率優(yōu)勢(shì),落地效率可達(dá)數(shù)十倍乃至上百倍。這一優(yōu)勢(shì)的背后,是金融信貸領(lǐng)域可通過(guò)歷史數(shù)據(jù)回測(cè)、雙模型并行測(cè)試的方式,快速驗(yàn)證模型實(shí)際效果,模型調(diào)整周期(883436)極短;而醫(yī)療行業(yè)若變更算法,需重新完成臨床前實(shí)驗(yàn)等全流程驗(yàn)證,耗時(shí)可達(dá)三五年,二者的實(shí)操成本存在巨大差距。
對(duì)于金融數(shù)據(jù)集的打造,許言午提出了三大核心要素:價(jià)值驅(qū)動(dòng)、全面精巧、公正普惠。他認(rèn)為,優(yōu)質(zhì)的金融數(shù)據(jù)集,首先要選題有價(jià)值且具備創(chuàng)新性,能夠真正解決行業(yè)實(shí)際問(wèn)題;其次設(shè)計(jì)要全面精巧,兼顧行業(yè)多維度的應(yīng)用需求;最后測(cè)評(píng)方式要公平公正,立足行業(yè)公共價(jià)值打造,而非以私利為導(dǎo)向。
而FCMBench-V1.0的推出,恰好契合了這三大要素,同時(shí)還在金融行業(yè)人才培養(yǎng)方面發(fā)揮著重要作用。許言午表示,F(xiàn)CMBench是銜接人才培養(yǎng)與金融行業(yè)需求、完善行業(yè)人才梯隊(duì)的重要紐帶,它既能為AI輔修金融等方向的學(xué)生提供真實(shí)的產(chǎn)業(yè)實(shí)踐場(chǎng)景,提升其就業(yè)競(jìng)爭(zhēng)力,也能為算法類專業(yè)學(xué)生提供貼合實(shí)際的金融行業(yè)應(yīng)用場(chǎng)景,助力其快速適配金融領(lǐng)域的崗位需求,進(jìn)而為金融行業(yè)持續(xù)補(bǔ)充優(yōu)質(zhì)人才,完善行業(yè)人才梯隊(duì)建設(shè)。
本次直播中,三位嘉賓分別從產(chǎn)業(yè)實(shí)踐、學(xué)術(shù)研究、產(chǎn)學(xué)研融合三個(gè)不同維度,圍繞信貸多模態(tài)ai(886062)標(biāo)準(zhǔn)建設(shè)展開(kāi)深度探討,讓行業(yè)對(duì)金融AI的發(fā)展現(xiàn)狀、痛點(diǎn)及未來(lái)方向有了更清晰的認(rèn)知。未來(lái),隨著FCMBench-V1.0的持續(xù)運(yùn)營(yíng)與共建,以及更多金融機(jī)構(gòu)、科研院校的參與,金融領(lǐng)域有望逐步形成類似ImageNet的開(kāi)源生態(tài),讓AI技術(shù)與金融業(yè)務(wù)實(shí)現(xiàn)更深度的融合,推動(dòng)金融AI朝著標(biāo)準(zhǔn)化、規(guī)范化的方向發(fā)展,最終實(shí)現(xiàn)技術(shù)突破與產(chǎn)業(yè)落地的雙向賦能。
