摘要:針對傳統方法中性能與精度的不足,通過最優類別分組和遺傳算法,提出一種非完全標注的文本分類訓練方法。新方法能將原來的分類體系拆分成多個分類體系,使得每個分類體系下的類別彼此互斥。在每個拆分出的分類體系下,對數據進行訓練,可提高分類器的精度。通過多個分類器并聯,分別輸出樣本對應的類別,得到樣本實際所屬的所有類別。仿真實驗表明,該方法可有效地解決當前分類體系下,非完全標注的文本分類器無法有效的識別出非完全標注文本類別與其它類別的邊界,從而造成數據分類性能低下等問題。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社