本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,提供一種文本分類方法與設(shè)備,所述方法包括:
S1,利用基于關(guān)鍵詞庫擴(kuò)充的特征選擇規(guī)則,確定各目標(biāo)文本的特征詞集合;
S2,利用基于特征詞類內(nèi)均勻度和特征詞類間區(qū)分度的權(quán)重計(jì)算公式,計(jì)算所述特征詞集合中各特征詞的權(quán)重;
S3,利用最大權(quán)重融合算法,對同一目標(biāo)文本的特征詞在不同文本類別中的權(quán)重進(jìn)行權(quán)重融合運(yùn)算,構(gòu)建目標(biāo)文本特征向量;
S4,基于所述目標(biāo)文本特征向量,利用多標(biāo)記分類模型對所述目標(biāo)文本進(jìn)行分類。
本發(fā)明提供的一種文本分類方法與設(shè)備,能夠有效提高文本信息表達(dá)的準(zhǔn)確性、提高模型構(gòu)建的效率,確保準(zhǔn)確高效地對文本信息進(jìn)行多標(biāo)記分類。
產(chǎn)業(yè)化應(yīng)用
掃碼關(guān)注,查看更多科技成果