摘要:對大規??萍嘉墨I進行整理分析時,常常需要自動識別論文作者所歸屬的組織機構,此時需要將論文中的作者地址信息與對應的機構名稱進行自動匹配。同一個機構的作者地址信息在不同的英文論文中可能出現多種不同的寫法,這給匹配造成了困難。針對這一問題,設計出一種機器學習方法,此方法充分利用英文論文中作者地址的書寫特點,在基于類中心向量的基礎上將作者地址信息與機構名稱進行自動匹配。與傳統方法比較,該方法不需要手工編寫煩瑣的匹配規則,被應用于中國科學院作者地址信息數據集,實驗結果證明了此方法的可行性。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社