語音識別集成電路 IP 與協處理器
1 成果簡介語音識別在嵌入式芯片上實現的主要矛盾是算法實現的性能精度與芯片功耗、速度之間的矛盾,一個性能較好的 800 條典型漢語普通話語音識別算法以純粹軟件嵌入方案實現通常需要 200MIPS 以上 ARM( Advanced Risc Machine) MCU 處理速度,因此我們提出語音識別集成電路 IP 與協處理器來克服以上的問題,通過關鍵運算的硬件化映射來大幅提高語音識別計算的功耗和處理速度。該設計可作為語音識別集成電路 IP 放入客戶的 SoC 芯片中,也可作為協處理器放在片外。 關鍵性能指標如下: *工藝:蘇州 HJTC 0.18um 1P6M 標準 CMOS 工藝 *管芯面積: 1.5 x 2mm *邏輯規模: 3 萬等效門(標準二輸入與非門,不含 SRAM) *I/O 數: 52 封裝: CQFP64 *存儲規模:片上集成 1 片單口 SRAM,共 4K×16 比特 *供電電壓:核心部分->1.8V, IO 部分->3.3V *正常工作頻率: 20MHz(最高工作頻率 100MHz) *功耗: 80uW/MHz *速度: 4us/幀(特征維數取 27,時鐘頻率取 20MHz) 圖 1 語音識別集成電路版圖圖 2 ARM+語音識別協處理的測試系統表 1 與其他語音識別芯片的對比2 應用說明語音識別 IP 或協處理器基于對高斯混合模型計算的優化,適合于各種 HMM 模型的模式識別計算,在語音識別、說話人識別、說話人確認、語音合成等方面均可以廣泛應用。 語音識別 IP 或協處理器以加速 ASIC 的模式工作,相同時鐘主頻下計算性能是 TI C54x系列 16bit DSP 的 5.5 倍以上,對主系統計算性能提升可以達到 4~8 倍。 語音識別 IP 或協處理器對于性能要求型場合和功耗限制型場合都十分適合,芯片支持16bit 并行總線接口,適合于各種 32 位/16 位 MCU 系統,迅速為系統集成高性能語音處理能力。3 應用范圍車載導航, GPS 手機,支持大規模識別詞表(例如萬條以上的地名)支持模糊語音檢索;低端手機平臺,支持語音撥號、語音控制,支持用戶身份確認、聲紋密碼。4 效益分析語音識別 IP 或協處理器芯片可應用拓展到個人移動信息終端的全市場空間,以 GPS 產品為例,細分的預裝 GPS、個人導航設備( Portable Navigation Device, PND), GPS 手機三種產品,根據 CCID( Consulting China Research Center)咨詢公司預測 2008 年這三者分別約占到全球市場總量的 15%、 35%和 50%。快速增長的 GPS 市場,對語音識別功能有著非常迫切而又實際的需求, GPS 應用提出的超大規模詞表、高混淆度和高環境復雜度這一系列語音識別的技術難題,也只能由語音識別芯片解決。語音識別加快了人機交互與地名等信息的檢索,可提高駕駛期間操作 GPS 的行車安全性,同時可以反過來進一步促進 GPS 產品的銷售增長。 語音識別技術通過芯片在性能得到大幅提升后,將擺脫傳統的人名撥號功能,可用于菜單控制、地名、信息、多媒體內容的檢索等等。而語音識別芯片使得低功耗和低成本的要求得以滿足,有望成為手機人機交互界面( Man-Machine Interface, MMI)發展的新技術增長點,移動通信領域的市場潛力特別巨大。
清華大學
2021-04-13