天天看點

深源恒際醫療票據OCR落地九省市 服務範圍覆寫過半市場

近年來,我國健康險市場規模持續保持高增長。銀保監會最新統計資料顯示,2019年中國健康險業務原保險保費收入6564億元,同比增長29.75%。同時,随着群眾風險保障意識的不斷提升,未來健康險仍有巨大的潛在增長空間。據天風證券研報預測,未來五年内健康險複合增速将保持在20%左右。

與市場規模呈正相關,健康險理賠案件數也在逐年走高。據了解,自2015年起,健康險理賠案件數量和賠付金額正以年均20%的速度增長。是以,如何提升服務效率、優化服務體驗,成為保險機構增強市場競争力的重要抓手。

保險科技公司

深源恒際

從健康險核賠理算業務場景入手,研發了醫療票據OCR産品,基于深度學習算法下的專項模型訓練,自動識别、提取醫療票據上的核心理算資訊,并将結構化的資訊錄入理算系統,旨在通過計算機視覺替代人力作業,大幅降低人力投入、縮短業務耗時,幫助健康險提升理賠服務效率、優化理賠服務體驗。

截至目前,該産品已先後在北京、天津、上海、廣東、浙江、江蘇、山東、河南及河北九省市完成落地,預估服務範圍覆寫健康險過半市場。

01

切中要害 直擊痛點

出于行業監管因素,目前商業醫保機構無法直接擷取或即時共享到投保使用者的醫療資訊。在涉及健康險理賠時,理算人員需要從使用者送出的醫療單據上擷取原始的理算資料,并将相關資訊逐項錄入系統,通常單個案件涉及錄入的資訊多達百餘項。而人工錄入的作業方式不夠經濟,一方面人工作業難免出現錯漏,影響理算準确性,容易造成理賠滲漏,另一方面配置大量人力資源從事高度重複的事務性工作,耗時費力、效率低下。

基于OCR識别技術,開發了集識别、提取、結構化功能于一體的資訊識别錄入自動化解決方案。在健康險核賠理算中,自動從各類醫療票據圖像中識别、提取出理算所需的字段資訊,并同步完成結構化錄入,大幅縮短資訊處理耗時,減少八成以上人力投入,使理賠效率整體提升60%-80%。同時,醫療票據OCR的應用,有助于健康險機構優化人力資源配置,基于流程自動化而釋放的勞動力可參與從事對腦力依賴更強的工作。

目前,支援識别錄入的票據類型包括門診發票、住院發票、醫保結算單、費用清單,字元識别準确率超過98%。

02

對症下藥 攻破難點

事實上,醫療票據OCR在實際落地應用中面臨諸多技術難點,如票面資訊模糊、發票折疊畸變、内容重疊、資訊串行等,均會對識别準确率形成幹擾,給算法模型訓練帶來相應挑戰。為降低、消弭噪音,深源恒際結合多種圖像處理技術,在不損害文字資訊的前提下排除幹擾因素,讓識别模型具備很好的抗幹擾能力和魯棒性。

深源恒際醫療票據OCR落地九省市 服務範圍覆寫過半市場

首先,醫療票據在全國範圍内沒有統一的制版格式,各地版式差異明顯。面對此類情形,通用OCR算法難以突破模版多樣化的問題。深源恒際針對各地模版進行獨立強化訓練,在模型訓練中增強特征提取細粒度,根據不同模版上的啟發性資訊輔助文字區域的定位和切分,弱化版式差異帶來的不良影響。目前,已有包含北京、天津、上海、廣東、浙江、江蘇、山東、河南及河北九省市在内的票據模版完成針對性強化訓練并釋出上線。

其次,醫療票據多采用資料與格式分離的套打方式,在OCR識别中通常會帶來兩方面困擾:一是套打發票大多采用針式列印技術,圖像分辨率低、列印字迹模糊,影響識别準确率;二是難免出現機打資訊和印刷資訊串行或内容重疊的情形,串行增加了資訊提取難度,影響資料結構化;内容重疊造成部分資訊被遮擋,在文本檢測時容易導緻漏檢,在文本識别時容易導緻誤識。

深源恒際基于深度學習算法,通過圖層分離技術解決了突破性地解決了套打票據識别中存在的技術難題,使識别準确率大幅提升。

圖層分離:通過大量分析樣本資料,提取機打部分與印刷部分的差異化特征,強化特征提取細粒度,基于深度學習方法搭建像素級圖層分離模型,實作從原始圖像中分離出機打資訊與印刷資訊,通過圖層分離完成資訊剝離。

坐标定位:圖層分離後,基于圖像識别技術擷取所有文本條目的坐标資訊,通過傳統比對算法完成印刷類文本條目坐标資訊與機打類文本條目坐标資訊的關聯,實作印刷字段資訊與機打字段資訊的比對,進而解決資訊串行帶來的幹擾。

雙識别模型:針對機打和印刷兩類文本資訊分别訓練算法模型,大幅提升圖層分離精确度,降低資訊重疊帶來的幹擾。

再次,為確定理算資訊完整無誤,深源恒際提出“機器校驗為主、人工複核為輔”的校驗機制,開發了多重校驗規則引擎。基于字段間的内在邏輯與關聯關系,自動甄别置信度較低的字段資訊,對存疑的高風險資訊進行預警提示,并依據内在邏輯對可能出錯的資料進行啟發式糾正;對于模糊文字,則通過醫療詞典庫進行智能校驗。綜合多種方式輔助複核,快速完成資料的校驗與糾正,為理算提供完整、精确的資料依據。

此外,醫療票據OCR服務與健康險理算中常用的智能理算規則引擎相銜接,可實作從資訊錄入到結果輸出全面自動化,讓健康險理賠真正駛入快車道。

未來,

将持續疊代算法模型,進一步擴大産品落地範圍,在不間斷的落地應用中優化産品性能,将技術創新優勢延展到行業全流程中,打造全棧式智能服務。

繼續閱讀