一種面向內(nèi)容安全的困難樣本挖掘方法及裝置

基本信息

申請?zhí)?/td> CN202110999821.0 申請日 -
公開(公告)號(hào) CN113688915A 公開(公告)日 2021-11-23
申請公布號(hào) CN113688915A 申請公布日 2021-11-23
分類號(hào) G06K9/62 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 丁大強(qiáng);李蒙陽;石海濤;胡安裕 申請(專利權(quán))人 北京玖安天下科技有限公司
代理機(jī)構(gòu) 北京啟知服知識(shí)產(chǎn)權(quán)代理有限公司 代理人 韓榮
地址 101316 北京市順義區(qū)南法信鎮(zhèn)金關(guān)北二街3號(hào)院2號(hào)樓12層1215
法律狀態(tài) -

摘要

摘要 一種面向內(nèi)容安全的困難樣本挖掘方法,包括以下步驟:(s1)準(zhǔn)備訓(xùn)練樣本,進(jìn)行標(biāo)注;(s2)利用標(biāo)注后所述訓(xùn)練樣本對困難樣本挖掘模型進(jìn)行訓(xùn)練;(s3)利用所述困難樣本挖掘模型對待挖掘的數(shù)據(jù)進(jìn)行處理,獲得挖掘結(jié)果。本發(fā)明一種面向內(nèi)容安全的困難樣本挖掘方法及裝置,在模型訓(xùn)練過程中,所采用的的損失函數(shù)包含難類別和難樣本信息,訓(xùn)練后的模型針對難類別和難樣本的識(shí)別效果相對于現(xiàn)有方法更好,同時(shí)還可以保證其他類別樣本的識(shí)別準(zhǔn)確率,非常適用于解決面向內(nèi)容安全的困難樣本的挖掘問題。