本發(fā)明以輔助視覺障礙人士對外界場景的理解為目的,提供一種基于RGB‐IR相機的聲音編碼交互系統(tǒng),該系統(tǒng)通過實時獲取兩臺RGB‐IR相機的RGB彩色圖像和IR紅外圖像,在傳統(tǒng)雙目視覺的基礎(chǔ)上結(jié)合紅外激光筆,實時獲得三維深度信息,再將三維圖像轉(zhuǎn)化為聲音編碼,通過耳機傳輸給使用者,使視覺障礙人士可以通過聽覺感受到場景中的物體分布和方位。