首先,抽取視頻中關鍵幀的亮度圖像;
接著,對當前關鍵幀的亮度圖像來定位字幕條位置:首先采樣關鍵幀的亮度圖像,生成紋理圖;接著確定水平字幕條的位置:先進行垂直紋理圖水平投影求差分,然后確定水平字幕條上下邊框,再確定水平字幕條左右邊框;接著確定垂直字幕條的位置:先進行水平紋理圖垂直投影求差分,然后確定垂直字幕條左右邊框,再確定垂直字幕條上下邊框;最后進行字幕條去噪,確定字幕條位置;
然后,確定字幕條起始幀和終止幀:首先,判斷當前關鍵幀是否有字幕:如果沒有字幕,則繼續進行下→個關鍵幀的字幕條定位,直到有字幕條出現;如果出現字幕條,設當前關鍵幀為字幕條關鍵幀,則在前一個關鍵幀和字幕條關鍵幀之間確定字幕條的起始幀,然后用字幕條關鍵幀的字幕條區域依次匹配后面的關鍵幀,如果匹配一致,將繼續匹配,直到匹配不一致,則在前一個關鍵幀和當前關鍵幀確定字幕條的終止幀:
最后,利用紋理去噪方法提取視頻中的文字信息:首先,求存在同一條字幕的多幀視頻幀亮度圖像的字幕條區域的平均和圖像:接著,將平均和圖像進行OTSU分割,生成只有黑白兩種顏色連通域的字幕區域圖像;然后,對OTSU分割后的圖像確定哪種顏色為文字區域:最后,剔除非文字噪聲。
掃碼關注,查看更多科技成果