有效語音識別方法及系統(tǒng)
基本信息

| 申請?zhí)?/td> | CN201510055655.3 | 申請日 | - |
| 公開(公告)號 | CN104575498B | 公開(公告)日 | 2018-08-17 |
| 申請公布號 | CN104575498B | 申請公布日 | 2018-08-17 |
| 分類號 | G10L15/20 | 分類 | 樂器;聲學(xué); |
| 發(fā)明人 | 付姝華 | 申請(專利權(quán))人 | 深圳市云之訊網(wǎng)絡(luò)技術(shù)有限公司 |
| 代理機(jī)構(gòu) | 廣州市越秀區(qū)哲力專利商標(biāo)事務(wù)所(普通合伙) | 代理人 | 深圳市云之訊網(wǎng)絡(luò)技術(shù)有限公司 |
| 地址 | 518000 廣東省深圳市南山區(qū)高新南四道8號創(chuàng)維半導(dǎo)體設(shè)計(jì)大廈東座18樓1802室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 有效語音識別方法及系統(tǒng),方法包括以下步驟:步驟A:實(shí)時(shí)獲取當(dāng)前語音幀的語音頻譜分布;步驟B:實(shí)時(shí)獲取當(dāng)前語音幀的短時(shí)能量和長時(shí)能量;步驟C:根據(jù)語音頻譜分布、長時(shí)能量和短時(shí)能量獲取語音類似度;以及步驟D:判斷語音類似度是否大于預(yù)設(shè)的語音類似度閾值,若是,執(zhí)行步驟E;若否,執(zhí)行步驟F;步驟E:判定當(dāng)前語音幀為有效語音;以及步驟F:判定當(dāng)前語音幀為非語音。上述發(fā)明實(shí)時(shí)獲取每一語音幀的語音頻譜分布和能量變化,并根據(jù)語音頻譜分布和能量變化快速識別出有效語音,無需像傳統(tǒng)方法那樣結(jié)合多幀才能綜合判斷,故,即使所應(yīng)用的場景頻繁切換也能可靠快速地識別。 |





