一種票據(jù)類圖像版面解析方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202110949153.0 申請(qǐng)日 -
公開(公告)號(hào) CN113657279A 公開(公告)日 2021-11-16
申請(qǐng)公布號(hào) CN113657279A 申請(qǐng)公布日 2021-11-16
分類號(hào) G06K9/00(2006.01)I;G06K9/62(2006.01)I;G06T3/40(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 丁大強(qiáng);李蒙陽(yáng);石海濤;胡安裕 申請(qǐng)(專利權(quán))人 北京玖安天下科技有限公司
代理機(jī)構(gòu) 北京啟知服知識(shí)產(chǎn)權(quán)代理有限公司 代理人 韓榮
地址 101316北京市順義區(qū)南法信鎮(zhèn)金關(guān)北二街3號(hào)院2號(hào)樓12層1215
法律狀態(tài) -

摘要

摘要 一種票據(jù)類圖像版面解析方法,包括:準(zhǔn)備用于模型訓(xùn)練的訓(xùn)練版面樣本,進(jìn)行人工標(biāo)注;對(duì)訓(xùn)練版面樣本中文本框進(jìn)行特征編碼;將所述文本框的坐標(biāo)特征與文本特征進(jìn)行特征拼接,形成所述文本框的拼接特征;將訓(xùn)練版面樣本中的多個(gè)候選框的所述拼接特征進(jìn)行拼接,形成所述訓(xùn)練版面樣本的特征序列向量;對(duì)模型進(jìn)行訓(xùn)練,獲得版面解析模型;將所述待解析版面的特征序列向量輸入所述版面解析模型,獲得所述待解析版面的解析結(jié)果。本發(fā)明采用機(jī)器學(xué)習(xí)方法,實(shí)現(xiàn)了端到端訓(xùn)練與處理過程,相對(duì)于傳統(tǒng)的特征工程方法極大降低了人工的工作量,同時(shí)還提升了模型構(gòu)架的運(yùn)行效率,顯著提高了票據(jù)類圖像版面解析的準(zhǔn)確性。