摘要:隨機森林算法是一類在機器學習中較為常見的算法,其在數據的分類以及非參數回歸中都有重要的作用。如何更好地處理數據,進行特征選擇是隨機森林的重點研究領域。自編碼神經網絡在深度學習中有著不可替代的作用,其在數據壓縮、特征提取等方面有著優異的性能。結合兩者優點,提出一種基于使用稀疏降噪自編碼器對原始數據進行特征提取的隨機森林算法。采用多種常用數據集進行實驗分析,對原始數據分別采用不同的特征提取方法,并利用隨機森林將提取后的特征進行分類。實驗結果表明,利用稀疏降噪自編碼神經網絡進行特征提取所得到的特征,能夠使隨機森林的分類精度得到一定程度的提高。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社