導讀:羅姆日前宣布開發(fā)出使智能手機麥克風具備敏銳指向性的數(shù)字信號處理IC,這個技術(shù)和僅僅使用噪音消除的技術(shù)不同,可以更加強調(diào)聲源,大幅提高各種設(shè)備的語音識別率和改善免提的通話質(zhì)量。
日本知名半導體制造商羅姆(總部位于日本京都市)面向智能手機和汽車導航儀等設(shè)備上所使用的麥克風,開發(fā)出使兩個無指向性的麥克風形成敏銳的指向性(波束賦形技術(shù))、提高語音品質(zhì)的數(shù)字信號處理IC“BU8332KV-M”。
本產(chǎn)品采用波束賦形技術(shù)形成指向性,因為將指向軸轉(zhuǎn)向聲源的方向,所以大大降低了環(huán)境噪音。通過噪音抑制的功能,進一步降低殘留在指向軸方向的固定噪音。這個技術(shù)和僅僅使用噪音消除的技術(shù)不同,可以更加強調(diào)聲源。而且,由于能夠在僅僅10mm的窄間距上安裝兩個麥克風,所以能夠內(nèi)置于以智能手機為代表的各種小型設(shè)備上。通過最優(yōu)化處理,波束賦形技術(shù)可以將使用時的處理延遲時間控制在10msec以下,使得對于其它應用程序的影響控制在最小的限度內(nèi)。通過這些措施,有助于提高各種設(shè)備的語音識別率和改善免提的通話質(zhì)量。
前期工序的生產(chǎn)基地在羅姆株式會社(日本京都市),后期工序在ROHM Electronics Philippines, Inc.(菲律賓)進行,從8月份開始以月產(chǎn)8萬個的規(guī)模投入量產(chǎn)。
近年來,隨著語音識別技術(shù)的日益發(fā)展,語音輸入系統(tǒng)廣泛應用于以汽車導航儀及智能手機為首的移動設(shè)備上,今后,也將要擴展到家電產(chǎn)品。另外,在全球化商業(yè)模式之下,視頻通話以及電視會議的日益頻繁,未來開發(fā)性能更加良好的拾音技術(shù)勢在必行。
在這種趨勢下的拾音技術(shù),需要使聲源變得更加清晰。迄今為止,指向性麥克風只能通過物理結(jié)構(gòu)(筒狀結(jié)構(gòu))形成指向性,但是,要想使指向性提高,就會出現(xiàn)麥克風的尺寸變大,而物理結(jié)構(gòu)沒有變化,不能夠控制指向性等問題出現(xiàn)。
下頁內(nèi)容:敏銳指向性可以更加清晰地拾取聲源[member]
[page]
此次,羅姆開發(fā)出的這款數(shù)字信號處理IC,通過采用使用兩個無指向性的麥克風的波束賦形技術(shù),使特定方向的聲源語音變得清晰。
使用兩個麥克風形成指向性的技術(shù)早已被應用,但現(xiàn)有技術(shù)為了提高指向性,必須拉長麥克風間距,所以不能適應小型便攜式設(shè)備的搭載要求。另外,數(shù)字信號處理的延遲時間及音質(zhì)劣化,也是今后繼續(xù)要攻克的研究課題。
而如今,羅姆采用DiMAGIC Corporation的指向性控制技術(shù),并且成功地使環(huán)境噪音大幅度地衰減。利用波束賦形技術(shù)形成指向性,并且通過把指向軸轉(zhuǎn)向聲源方向,從而衰減了聲源以外的語音。在指向軸方向殘留的固定噪音通過噪音抑制的功能得以降低,因而使得聲源變得清晰。其結(jié)果是使得背面方向的衰減量較傳統(tǒng)的麥克風改善30dB以上。因為能在僅僅10mm的麥克風間距實現(xiàn)這樣的效果,所以可以搭載在小型便攜設(shè)備上。另外,通過最優(yōu)化處理,波束賦形技術(shù)可以將使用時的處理延遲時間控制在10msec以下,使得對于其它應用程序的影響控制在最小的限度內(nèi)。再者,由于能夠轉(zhuǎn)換指向性的形態(tài)和銳度,所以可以根據(jù)用途而實現(xiàn)最佳的指向性。
<特點>
1)敏銳指向性可以更加清晰地拾取聲源
獨有的信號處理技術(shù),與以往麥克風比較,實現(xiàn)了敏銳的指向性,進行聲音的清晰度處理。聲源方向(0°)對于背面方向(180°)的衰減量與以往的麥克風比較大幅度改善30dB以上。此外,還可以實現(xiàn)10mm安裝間距。
2)大幅度提高語音識別率
可以使語音不劣化,能降低環(huán)境噪音。因此,提高在環(huán)境噪音條件下的語音識別率。通過本公司的檢測,在環(huán)境噪音等級55dBSPL的環(huán)境下的語音識別精度從5%提高到90%。
[page]
3)可以選擇指向性模式
可以將指向性模式轉(zhuǎn)換為四種形態(tài),而且能將指向性的方向反轉(zhuǎn)180°,也可以調(diào)整指向性銳度。這些控制可以不改變麥克風的配置,而只是進行寄存器的設(shè)定。
① 無指向性:全方位的拾音。
② 單一指向性: 拾取正前方的語音,并且衰減后方的語音。
③ 銳心型指向性: 比起單一的指向性來,還衰減側(cè)方的語音。
④ 雙指向性: 比銳心型指向性更加衰減側(cè)方的語音。
4)其它的功能
?使用波束賦形技術(shù)功能時的處理延遲時間為10msec以下。
?搭載降低殘留在軸向指向方向的固定噪音的噪音抑制功能。
?采樣頻率16kHz。
?模擬輸出(LINEOUT)或者數(shù)字輸出(PCM接口)。
?可用3.3V的單系統(tǒng)工作(內(nèi)置核心電源調(diào)節(jié)器)。
?內(nèi)置有麥克風用偏壓、前置放大器的電路。
?雙線主機接口。
?可以單機工作(內(nèi)置EEPROM用SPI接口)。
<用語說明>
?波束賦形技術(shù)
是利用多個麥克風的相位差,降低目標方向以外的語音的技術(shù)。降低環(huán)境噪音,提高目標聲源的清晰度。