摘要:社交網絡已被廣泛地用于通過基于互聯網的文本消息和圖像在公共領域表達意見。Twitter的情感分析為組織提供了實時監控與他們相關的產品和事件的公眾感覺的能力,成為公眾情緒監測的有效途徑。情感分析的第一步是數據的文本預處理?,F有的關于Twitter情感分析的研究主要集中在新情感特征的提取上,而忽略對預處理方法的深入研究。在本文中,我們研究了基于支持向量機(SVM)、樸素貝葉斯、最大熵和基于人工神經網絡的監督分類器在Twitter數據上的特征提取及分類方法。我們還提出了基于Mapreduce的主成分分析(MPCA)與SVM結合的分類算法模型。然后討論了文本預處理方法對兩類分類任務中情感分類性能的影響,總結了各種預處理方法在Twitter數據集上的特征模型和四種分類方法的分類性能。實驗結果表明在經過了參數調優后,我們提出的分類算法模型不僅提高了Twitter情感分類的準確率和F1指標,而且能解決支持向量機和人工神經網絡的計算消耗問題,算法模型具有一定的擴展性,實驗結果令人滿意。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社