一種語音信號增強系統、方法及存儲介質與流程

文檔序號:18171791發布日期:2019-07-13 09:52
一種語音信號增強系統、方法及存儲介質與流程

本發明實施例涉及語音信號處理技術領域,具體涉及一種語音信號增強系統、方法及存儲介質。



背景技術:

聲音的特性是會疊加,在某些嘈雜的環境中,用戶發出的語音信號會疊加外界環境中的干擾信號,例如噪音信號,或者其他來源的聲音信號。而導致接收的語音信號的對象并不能清楚的識別,尤其對于需要識別語音信號的語音識別設備來說,在接收到摻雜各種噪音的語音信號時,將無法對語音信號進行有效識別,也就無法進行后續的操作。

如此一來,必然給使用語音識別設備的用戶造成困擾。那么,如何才能保證語音識別設備,即使在嘈雜的環境中,也能夠從摻雜各種噪音的語音信號中,有效識別用戶發出的語音信號,進而執行后續操作,成為本申請亟待解決的技術問題。



技術實現要素:

為此,本發明實施例提供一種語音信號增強系統、方法及存儲介質,以解決現有技術中語音識別設備,在嘈雜的環境中無法對摻雜各種噪音的語音信號后進行有效識別的問題。

為了實現上述目的,本發明實施例提供如下技術方案:

第一方面,本發明實施例提供了一種語音信號增強系統,該語音信號增強系統與語音識別設備建立電連接,該系統包括:骨傳導語音傳感器、麥克風、聲音增強處理裝置以及聲音融合裝置;

骨傳導語音傳感器用于采集用戶的語音信號,并將用戶的語音信號傳輸至聲音融合裝置;

麥克風用于,采集外界發出的聲音信號,并將外界發出的聲音信號傳輸至聲音增強處理裝置;

聲音增強處理裝置,用于將麥克風采集的外界發出的聲音信號進行一次降噪處理,并將經過一次降噪處理后的信號輸入至聲音融合裝置;

聲音融合裝置,用于將用戶的語音信號和一次降噪處理后的信號進行融合處理,獲取輸出信號,用以作為所述語音識別設備的語音識別信號。

本發明實施例的特征還在于,系統還包括回聲消除裝置,用于將麥克風采集的外界發出的聲音信號進行回聲消除處理,并將經過回聲消除處理后的聲音信號傳輸至聲音增強處理裝置。

本發明實施例的特征還在于,麥克風的數量為至少兩個,聲音增強處理裝置具體用于,將至少兩個麥克風采集的外界發出的聲音信號進行波束成形處理后,再進行噪音抑制處理。

本發明實施例的特征還在于,聲音融合裝置,具體用于:利用自適應濾波方法對用戶的語音信號和一次降噪處理后的信號進行融合處理,獲取輸出信號,用以作為所述語音識別設備的語音識別信號。

本發明實施例的特征還在于,該系統還包括降噪裝置,用于對輸出信號進行二次降噪處理,以便將經過二次降噪處理后的信號作為語音識別設備的語音識別信號。

本發明實施例的特征還在于,系統還包括:聲音活動檢測裝置,用于當接收到聲音傳感器組中預設聲音傳感器傳輸的用戶發出的語音信號時,喚醒聲音傳感器組中除預設聲音傳感器之外的聲音傳感器、聲音增強處理裝置以及聲音融合裝置從休眠狀態進入工作狀態,其中,聲音傳感器組由骨傳導語音傳感器以及麥克風構成。

本發明實施例的特征還在于,預設聲音傳感器的數量為至少一個。

第二方面,本發明實施例還提供了一種語音信號增強方法,該方法應用于一種語音信號增強系統,語音信號增強系統與語音識別設備建立電連接,語音信號增強系統包括:骨傳導語音傳感器、麥克風、聲音增強處理裝置以及聲音融合裝置;該方法包括:

骨傳導傳感器采集用戶的語音信號后,傳輸至聲音融合裝置;

麥克風采集外界發出的聲音信號,并傳輸至聲音增強處理裝置;

聲音增強處理裝置將麥克風采集的外界發出的聲音信號進行一次降噪處理,并將經過一次降噪處理后的信號輸入至聲音融合裝置;

聲音融合裝置將用戶的語音信號,以及經過一次降噪處理后的信號進行聲音融合處理,獲取輸出信號,用以作為所述語音識別設備的語音識別信號。

本發明實施例的特征還在于,語音信號增強系統還包括回聲消除裝置,麥克風采集外界發出的聲音信號,并傳輸至聲音增強處理裝置之前,方法還包括:

利用回聲消除裝置對每一個麥克風分別采集的外界聲音信號進行回聲消除處理。

本發明實施例的特征還在于,語音信號增強系統中的麥克風數量為至少兩個,聲音增強處理裝置將麥克風采集的外界發出的聲音信號進行一次降噪處理,具體包括:

將至少兩個麥克風采集的外界發出的聲音信號進行波束成形處理后,再噪音抑制處理。

本發明實施例的特征還在于,聲音融合裝置將用戶的語音信號,以及經過一次降噪處理后的信號進行聲音融合處理,獲取輸出信號,用以作為所述語音識別設備的語音識別信號,具體包括:

聲音融合裝置利用自適應濾波方法對用戶的語音信號和一次降噪處理后的信號進行融合處理,獲取輸出信號,用以作為所述語音識別設備的語音識別信號。

本發明實施例的特征還在于,聲音融合裝置將用戶的語音信號,以及經過一次降噪處理后的信號進行聲音融合處理,獲取輸出信號之后,該方法還包括:

利用降噪裝置對輸出信號進行二次降噪處理,以便將經過二次降噪處理后的信號作為語音識別設備的語音識別信號。

本發明實施例的特征還在于,語音信號增強系統還包括:聲音活動檢測裝置,骨傳導語音傳感器、麥克風構成聲音傳感器組;當聲音傳感器組中除預設聲音傳感器之外的聲音傳感器、聲音增強處理裝置以及聲音融合裝置進入工作狀態之前,方法還包括:當聲音活動檢測裝置接收到聲音傳感器組中預設聲音傳感器傳輸的用戶發出的語音信號時,喚醒聲音傳感器組中除預設聲音傳感器之外的聲音傳感器、聲音增強處理裝置以及聲音融合裝置從休眠狀態進入工作狀態。

本發明實施例的特征還在于,預設聲音傳感器的數量為至少一個。

第三方面,本發明實施例還提供了一種計算機存儲介質,計算機存儲介質中包含一個或多個程序指令,一個或多個程序指令用于被如上第一方面所述的一種語音信號增強系統執行如上第二方面所述的一種語音信號增強方法中的任一方法步驟。

根據本發明的實施方式,具有如下優點:骨傳導語音傳感器主要采集用戶的語音信號中的低頻,而麥克風則采集外界發出的聲音信號,其采集的聲音信號中實際是包含了用戶的語音信號和外界噪音。聲音增強處理裝置將外界發出的聲音信號進行降噪處理后,可以濾除掉噪音信號。聲音融合裝置將骨傳導語音傳感器采集用戶的語音信號中低頻信號,和經過降噪處理后的信號進行融合,從而得到一個還原用戶真實聲音,且已經經過降噪處理的干凈的信號,這個信號將作為語音識別設備的輸入信號,供語音識別設備進行精準識別,并執行后續的操作。經過上述處理后的信號更加容易被語音識別設備識別,進而可以提升用戶對語音識別設備的體驗度。

附圖說明

為了更清楚地說明本發明的實施方式或現有技術中的技術方案,下面將對實施方式或現有技術描述中所需要使用的附圖作簡單地介紹。顯而易見地,下面描述中的附圖僅僅是示例性的,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據提供的附圖引伸獲得其它的實施附圖。

圖1為本發明一實施例提供的一種語音信號增強系統結構示意圖;

圖2為本發明另一實施例提供的一種語音信號增強系統結構示意圖;

圖3為本發明另一實施例提供的一種語音信號增強系統結構示意圖;

圖4為本發明另一實施例提供的一種語音信號增強方法流程示意圖。

具體實施方式

以下由特定的具體實施例說明本發明的實施方式,熟悉此技術的人士可由本說明書所揭露的內容輕易地了解本發明的其他優點及功效,顯然,所描述的實施例是本發明一部分實施例,而不是全部的實施例?;诒景l明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。

本發明實施例提供了一種語音信號增強系統,該語音信號增強系統與語音識別設備建立電連接,或者包含于語音識別設備中,具體如圖1所示,該系統包括:骨傳導語音傳感器10、麥克風20、聲音增強處理裝置30以及聲音融合裝置40。

骨傳導語音傳感器10用于采集用戶的語音信號,并將用戶的語音信號傳輸至聲音融合裝置40;

麥克風20用于,采集外界發出的聲音信號,并將外界發出的聲音信號傳輸至聲音增強處理裝置30;

聲音增強處理裝置30,用于將麥克風20采集的外界發出的聲音信號進行一次降噪處理,并將經過一次降噪處理后的信號輸入至聲音融合裝置40;

聲音融合裝置40,用于將用戶的語音信號和經過一次降噪處理后的信號進行融合處理,獲取輸出信號,用以作為語音識別設備的語音識別信號。

具體的,骨傳導語音傳感器10可以是骨傳導麥克風20或者加速度傳感器,其緊密貼合使用者的耳骨,用以充分采集用戶在說話時聲音延頭骨的傳播。聲音的振動可以帶動頭骨和肌肉組織振動,這種振動頻率剛好被骨傳導語音傳感器10采集。骨傳導語音傳感器10的有點在于,采樣頻率和區間相比普通麥克風20低很多,能夠有效的采集低頻信號,隔離高頻噪音,基本覆蓋大部分人聲的共振峰,可以包含人聲的有效信息。

而麥克風20則用于分別采集外界發出的聲音信號,外界發出的聲音信號中包含了用戶的語音信號,以及外界環境中的噪音。采用麥克風20的原因在于,其可以采集外側環境造影和用戶說話的聲音。其涵蓋了說話人聲音中所有頻帶信號。

而正是由于麥克風20采集的聲音信號中包含外界環境中的噪音信號,因此需要通過聲音增強處理裝置30進行一次降噪處理。然后,將經過一次降噪處理后的信號輸入至聲音融合裝置40中。

可選的,在一個具體的實施例中,如果麥克風20的數量為至少兩個時,聲音增強處理裝置30主要是用于至少兩個麥克風20分別采集的外界發出的聲音信號進行波束成形處理。通過波束成形處理,實現對麥克風20采集的聲音信號進行空間濾波。波束成形的目的是為了進行有指向性的濾波和去除干擾。然后,再將經過空間濾波處理后的信號進行噪音抑制處理。對于波束成形處理和噪音抑制處理實際都屬于現有技術,這里不做過多介紹。

進一步可選的,如圖2或者如圖3所示,為了防止用戶發出語音信號時,其正在聽音樂或者看電影等流媒體信息時,麥克風20將會采集到一部分流媒體信號,這部分流媒體信號將成為干擾信號,進一步對最終要輸出的信號進行干擾。因此,語音信號增強系統還可以包括回聲消除裝置50,用于結合流媒體信號的原始參考信號,對麥克風20采集到的流媒體信號進行回聲消除。具體回聲消除的工作原理為現有技術,這里不做過多贅述。而且,每一個回聲消除裝置50分別對應一個麥克風20。

聲音融合裝置40,其主要是對用戶的語音信號和經過一次降噪處理后的信號進行融合處理。其處理方式可以采用自適應濾波方法進行融合處理。具體的處理過程就是提取骨傳導語音傳感器10采集的用戶的語音信號中的有效低頻信號,然后將該有效低頻信號替代經過聲音增強裝置一次降噪處理后的信號中的低頻信號。同時,在替代過程中實現對所有信號的進一步濾波處理,從而使得獲取的輸出信號是干凈的,更加貼近人聲音的信號,用以作為語音識別設備的語音識別信號。

可選的,為了使得語音識別設備的語音信號更加清楚自然,該系統還可以包括:降噪裝置70,具體如圖2或圖3所示,降噪裝置70用于對輸出信號進行二次降噪處理,其主要目的是為了進一步消除環境噪音和非平穩噪音。例如嘈雜的街邊噪音、引擎噪音或者風噪等。并將經過二次降噪處理后的信號最為最終輸入到語音識別設備的語音識別信號。

進一步可選的,為了降低語音增強系統所消耗的功耗,該語音增強系統中還可以包括聲音活動檢測裝置60,具體如圖2或者如圖3所示。并且,僅設置聲音活動檢測裝置60和聲音傳感器組中預設聲音傳感器處于工作狀態,而其他元器件處于休眠狀態。只有當聲音活動檢測裝置60接收到聲音傳感器組中預設聲音傳感器傳輸的用戶發出的語音信號時,才會喚醒語音增強系統中的其他部件從休眠狀態進入工作狀態。而聲音傳感器組則是由骨傳導語音傳感器10以及麥克風20構成。

可選的,預設聲音傳感器的個數可以為至少一個。

圖2中示出了語音信號增強系統中預設聲音傳感器為骨傳導語音傳感器10。而圖3中示出了語音信號增強系統中預設傳感器為兩個麥克風20。

本發明實施例提供的一種語音信號增強系統,骨傳導語音傳感器主要采集用戶的語音信號中的低頻,而麥克風則采集外界發出的聲音信號,其采集的聲音信號中實際是包含了用戶的語音信號和外界噪音。聲音增強處理裝置將外界發出的聲音信號進行降噪處理后,可以濾除掉噪音信號。聲音融合裝置將骨傳導語音傳感器采集用戶的語音信號中低頻信號,和經過降噪處理后的信號進行融合,從而得到一個還原用戶真實聲音,且已經經過降噪處理的干凈的信號,這個信號將作為語音識別設備的輸入信號,供語音識別設備進行精準識別,并執行后續的操作。經過上述處理后的信號更加容易被語音識別設備識別,進而可以提升用戶對語音識別設備的體驗度。

如上述實施例1相對應的,本發明實施例2提供了一種語音信號增強方法,該方法應用于一種語音信號增強系統,語音信號增強系統與語音識別設備建立電連接,或者包含于語音識別設備中,語音信號增強系統包括:骨傳導語音傳感器、麥克風、聲音增強處理裝置以及聲音融合裝置;具體如圖4所示,方法包括:

步驟410,骨傳導傳感器采集用戶的語音信號后,傳輸至聲音融合裝置。

步驟420,麥克風采集外界發出的聲音信號,并傳輸至聲音增強處理裝置。

步驟430,聲音增強處理裝置將麥克風采集的外界發出的聲音信號進行一次降噪處理,并將經過一次降噪處理后的信號輸入至聲音融合裝置。

步驟440,聲音融合裝置將用戶的語音信號,以及經過一次降噪處理后的信號進行聲音融合處理,獲取輸出信號,用以作為語音識別設備的語音識別信號。

可選的,語音信號增強系統還包括回聲消除裝置,麥克風采集外界發出的聲音信號,并傳輸至聲音增強處理裝置之前,方法還包括:

利用回聲消除裝置對每一個麥克風分別采集的外界聲音信號進行回聲消除處理。

可選的,語音信號增強系統中的麥克風數量為至少兩個,聲音增強處理裝置將麥克風采集的外界發出的聲音信號進行一次降噪處理,具體包括:

將至少兩個麥克風采集的外界發出的聲音信號進行波束成形處理后,再噪音抑制處理。

可選的,聲音融合裝置將用戶的語音信號,以及經過一次降噪處理后的信號進行聲音融合處理,獲取輸出信號,用以作為語音識別設備的語音識別信號,具體包括:

聲音融合裝置利用自適應濾波方法對用戶的語音信號和經過一次降噪處理后的信號進行融合處理,獲取輸出信號,用以作為語音識別設備的語音識別信號。

可選的,語音信號增強系統還包括:降噪裝置,聲音融合裝置將用戶的語音信號,以及經過一次降噪處理后的信號進行聲音融合處理,獲取輸出信號之后,該方法還包括:

利用降噪裝置對輸出信號進行二次降噪處理,以便將經過二次降噪處理后的信號作為語音識別設備的語音識別信號。

可選的,語音信號增強系統還包括:聲音活動檢測裝置,骨傳導語音傳感器、麥克風構成聲音傳感器組;當聲音傳感器組中除預設聲音傳感器之外的聲音傳感器、聲音增強處理裝置以及聲音融合裝置進入工作狀態之前,該方法還包括:當聲音活動檢測裝置接收到聲音傳感器組中預設聲音傳感器傳輸的用戶發出的語音信號時,喚醒聲音傳感器組中除預設聲音傳感器之外的聲音傳感器、聲音增強處理裝置以及聲音融合裝置從休眠狀態進入工作狀態。

可選的,預設聲音傳感器的數量為至少一個。

本發明實施例提供的一種語音信號增強方法中各步驟均已在上述實施例1中做了詳細介紹,因此這里不做過多贅述。

本發明實施例提供的一種語音信號增強方法,骨傳導語音傳感器主要采集用戶的語音信號中的低頻,而麥克風則采集外界發出的聲音信號,其采集的聲音信號中實際是包含了用戶的語音信號和外界噪音。聲音增強處理裝置將外界發出的聲音信號進行降噪處理后,可以濾除掉噪音信號。聲音融合裝置將骨傳導語音傳感器采集用戶的語音信號中低頻信號,和經過降噪處理后的信號進行融合,從而得到一個還原用戶真實聲音,且已經經過降噪處理的干凈的信號,這個信號將作為語音識別設備的輸入信號,供語音識別設備進行精準識別,并執行后續的操作。經過上述處理后的信號更加容易被語音識別設備識別,進而可以提升用戶對語音識別設備的體驗度。

與上述實施例相對應的,本發明實施例還提供了一種計算機存儲介質,該計算機存儲介質中包含一個或多個程序指令。其中,一個或多個程序指令用于被如實施例1所介紹的一種語音信號增強系統執行如實施例2所介紹的一種語音信號增強方法。

雖然,上文中已經用一般性說明及具體實施例對本發明作了詳盡的描述,但在本發明基礎上,可以對之作一些修改或改進,這對本領域技術人員而言是顯而易見的。因此,在不偏離本發明精神的基礎上所做的這些修改或改進,均屬于本發明要求保護的范圍。

再多了解一些
當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
做爱视频