項目背景:西興技術智能語音交互是基于語音輸入的新 一代交互模式,通過說話就可以得到反饋結果。語音技術實 現了人機語音交互,使人與機器之間溝通變得像人與人溝通 一樣簡單。語音技術主要包括語音合成和語音識別兩項關鍵 技術。讓機器說話,用的是語音合成技術;讓機器聽懂人說 話,用的是語音識別技術。此外,語音技術還包括語音編碼、 音色轉換、口語評測、語音消噪和增強等技術,有著廣闊應 用空間。
所需技術需求簡要描述:1.當麥克風和信號源距離太遠 時(比如 10m、20m 距離),錄制信號的信噪比會很低,算法 處理難度很大,需要提供協助。2.如何實現回聲消除:近場 環境下,播放音樂或是語音播報的時候可以按鍵停止這些, 但遠場環境下想要通過語音控制,必須得實現回聲消除。3. 如何實現低信噪比和混響:遠場環境要求拾音麥克風的靈敏 度高,這樣才能在較遠的距離下獲得有效的音頻振幅,同時 近場環境下又不能爆音(振幅超過最大量化精度)。這樣的 環境下,噪音必然會很大,從而使得語音質量變差,即 SNR 降低。