基于本體的數字出版物語義標注優化方法
本專利系統所要解決的技術問題正是對上述存在的技術不足,提出了一種基于本體的數字岀版物語義標注優化方法。其公開了在語義分析與標注方法中,進行段落分詞,其中,段落分詞包括字符串匹配分詞、最短路徑分詞和詞義分詞法等
一、項目分類
關鍵核心技術突破
二、成果簡介
現階段關于數字出版物內容提煉標注技術大多是根據基本詞庫及內容上下文進行抽取的,沒有結合出版物的領域背景,從而降低了標注在特定領域的準確性,導致信息可達性降低、傳播效率降低。
本專利系統所要解決的技術問題正是對上述存在的技術不足,提出了一種基于本體的數字岀版物語義標注優化方法。其公開了在語義分析與標注方法中,進行段落分詞,其中,段落分詞包括字符串匹配分詞、最短路徑分詞和詞義分詞法等;然后進行語義標注,即為文本中的詞分配詞性信息(例如名詞、動詞等);最后,進行段落-維度結構化關聯,將段落在語義空間上的點坐標表示出來。
因此,本發明相對于上述該文獻實際解決的技術問題是:如何提高標注的準確性和檢索的準確性。本專利系統對數字出版內容進行知識化加工,優化了現有的語義標注方法。
武漢理工大學
2022-08-12