在金融文檔智能識(shí)別領(lǐng)域,大模型的泛化能力為金融業(yè)務(wù)自動(dòng)化帶來(lái)了無(wú)限遐想,用大模型進(jìn)行OCR識(shí)別,可以輕松抽取任意文檔版式。
然而,這也帶來(lái)了新的問(wèn)題,大模型如果不經(jīng)過(guò)二次開(kāi)發(fā),滿(mǎn)足不了數(shù)據(jù)溯源需求。當(dāng)模型從識(shí)別出一個(gè)關(guān)鍵財(cái)務(wù)數(shù)據(jù),卻常常無(wú)法提供該結(jié)果在原文中“所見(jiàn)即所得”的絕對(duì)證據(jù)。
對(duì)于任何需要存檔、審計(jì)、追責(zé)的嚴(yán)肅文檔處理工作,這種“看似正確”但無(wú)法溯源的識(shí)別結(jié)果,是合規(guī)體系中一個(gè)無(wú)法容忍的斷點(diǎn),基本不能滿(mǎn)足生成需求。
想象以下場(chǎng)景:
●信貸審批: 根據(jù)一份復(fù)雜的財(cái)報(bào),建議拒絕一筆貸款。當(dāng)審批人員追問(wèn)“具體是財(cái)報(bào)中哪一項(xiàng)數(shù)據(jù)導(dǎo)致此結(jié)論”時(shí),通用大模型只能給出一個(gè)基于概率的模糊解釋?zhuān)鵁o(wú)法指向原文的具體條款。
●保險(xiǎn)理賠: AI自動(dòng)從醫(yī)療記錄中提取了理賠金額。在后續(xù)的賠付爭(zhēng)議中,如果無(wú)法提供該金額在幾十頁(yè)醫(yī)療報(bào)告中原始出處的鐵證,保險(xiǎn)公司將陷入巨大的法律和財(cái)務(wù)風(fēng)險(xiǎn)。
●合規(guī)審計(jì): 監(jiān)管機(jī)構(gòu)前來(lái)審查,要求提供某項(xiàng)交易決策所依據(jù)的合同條款。如果AI系統(tǒng)無(wú)法提供從決策結(jié)果到合同原文的清晰映射,企業(yè)將可能面臨巨額罰款。
對(duì)于金融行業(yè)而言,其可解釋性和可復(fù)核性更為關(guān)鍵。一個(gè)無(wú)法被審計(jì)的AI,無(wú)論多“智能”,都是一個(gè)不可用的系統(tǒng)。
易道博識(shí)智能文檔處理平臺(tái)(簡(jiǎn)稱(chēng)DeepIDP),通過(guò)大小模型協(xié)同的架構(gòu),提供全面的文檔處理能力,值得一提的是,智能文檔處理平臺(tái)支持字段級(jí)數(shù)據(jù)溯源。
這個(gè)功能在實(shí)踐中意味著:
當(dāng)業(yè)務(wù)人員、風(fēng)控官或?qū)徲?jì)員查看系統(tǒng)從一份長(zhǎng)達(dá)50頁(yè)的招股說(shuō)明書(shū)中抽取的“承諾發(fā)行總額”字段時(shí),DeepIDP即可立刻在原始文檔的PDF影像上,高亮框選出該數(shù)字所在的具體段落、表格和位置。
這種所見(jiàn)即所得的溯源能力,帶來(lái)了三大核心價(jià)值:
1.結(jié)果可復(fù)核: 將AI的“黑箱”操作,變?yōu)橐粋€(gè)完全透明、可供人工快速驗(yàn)證的“白箱”流程。
2.過(guò)程可追溯: 建立起從結(jié)構(gòu)化數(shù)據(jù)到非結(jié)構(gòu)化原文的完整證據(jù)鏈,讓每一次AI處理都有據(jù)可查。
3.全面可審計(jì): 完美滿(mǎn)足監(jiān)管部門(mén)對(duì)系統(tǒng)決策可解釋性的要求,讓企業(yè)放心大膽地將AI用于核心業(yè)務(wù)。
問(wèn)題1:小模型會(huì)被大模型徹底取代嗎?
回答: 不會(huì)。在可預(yù)見(jiàn)的未來(lái),兩者將長(zhǎng)期共存。小模型在特定任務(wù)上的效率、成本和穩(wěn)定性?xún)?yōu)勢(shì)是通用大模型難以企及的。未來(lái)的趨勢(shì)是大小模型的深度協(xié)同,而非替代。
問(wèn)題2:如何判斷一個(gè)文檔處理任務(wù)應(yīng)該用大模型還是小模型?
高頻標(biāo)準(zhǔn)文檔用OCR小模型:每日需要處理數(shù)萬(wàn)張的增值稅發(fā)票、身份證、銀行流水或標(biāo)準(zhǔn)化的入庫(kù)單。
長(zhǎng)尾低頻文檔用大模型:需要審核的商業(yè)合同、法律文書(shū)、非標(biāo)業(yè)務(wù)申請(qǐng)表、市場(chǎng)研究報(bào)告等。這些文檔可能每天只處理幾十份,但每一份的版式和語(yǔ)言風(fēng)格都可能不同。
DeepIDP在底層集成了小模型推理引擎和大型模型推理引擎。該架構(gòu)可以根據(jù)任務(wù)的復(fù)雜度和需求,自動(dòng)調(diào)度最合適的模型進(jìn)行處理,對(duì)外提供標(biāo)準(zhǔn)化的服務(wù)接口。
這種融合架構(gòu)屏蔽了底層模型的差異,實(shí)現(xiàn)了“無(wú)感調(diào)用”,用戶(hù)無(wú)需刻意區(qū)分某個(gè)識(shí)別能力是由大模型還是小模型提供,只需專(zhuān)注于自身業(yè)務(wù)需求即可。