摘要:由于沒有完整可用的指標同義詞庫以進行指標映射,各家醫院關于同一檢驗檢查指標的不同稱謂,已嚴重影響到了區域間醫療信息的互聯共享,因而需要對檢驗檢查指標進行標準化處理.這可以看作是一個實體對齊問題,但指標只有相應的取值和取值范圍,難以像知識庫實例匹配那般使用到屬性信息,也不似實體鏈接那般擁有上下文信息,而且不存在一個標準知識庫來提供所有指標的標準名稱.針對以上問題,提出指標標準化算法,先根據指標字面特征進行聚類,再使用相似度特征和分塊打分特征迭代地進行二分類映射.實驗表明,最終的二分類映射,其 F 1-score可以達到85.27%,證明了該方法的有效性.
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社