摘要:【目的/意義】移動互聯網時代,微博以其快速、便捷的優點迅速成為信息傳播與共享的平臺之一。在互聯網信息傳播過程中,話題內容焦點會隨著時間推動發生動態遷移,及時準確的發現話題內容焦點的遷移有助于了解網絡輿情的演化趨勢。【方法/過程】首先,定義基于焦點特征詞分布的焦點詞提取公式,構造焦點特征詞集合;然后,使用Skip-gram模型在大規模語料上訓練得到詞向量,再通過BTM對文本建模,直接在BTM主題維上結合焦點特征詞集合構造主題詞向量;最后,計算主題特征詞間的相似度,將其應用到聚類算法中實現話題焦點識別?!窘Y果/結論】通過對新浪微博數據集上的實驗結果表明,本方法能夠充分利用詞向量引入的語義信息,提高文本聚類效果,有效的獲取各階段的話題焦點。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社