時間:2022-05-21 05:29:27
序論:在您撰寫信息學論文時,參考他人的優秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發您的創作熱情,引導您走向新的創作高度。
一、計算機化病歷
計算機化病歷是醫學信息學的一個重要研究方向。它是指存在一個系統中的電子病歷,這個系統可支持使用者獲得完整、準確的資料;提示和警示醫療人員;給予臨床決策服務;連接管理、書刊目錄、臨床基礎知識以及其他設備[2]。電子病歷的優點如下:完整的電子病歷存儲系統支持多個用戶同時查看,保證個人醫療信息的共享與交流。通過網絡,醫師可以在家中或在世界任何一個角落隨時獲得患者的電子病歷。同時可根據不同的用戶給予不同的資料查詢權限,從而保證了病歷的安全性。授權用戶在適當時間才能查看合適的病歷。
此外,電子病歷不再是一個被動的醫療記錄。論文通過與圖像信息的整合,可提供實時醫療監控,藥物劑量查詢等多種功能。電子病歷已成為新興信息技術和信息工具的基礎。
電子病歷目前可大致分為單機電子病歷和網上電子病歷兩種。網上電子病歷的優點是采用了ASP服務器提供全球,安全性與數據完整性則由ASP供應商解決;缺點則是數據不在醫師所工作的計算機上。
雖然醫療界投入巨資,電子病歷仍存在許多問題亟待解決[3]。首先,病歷數據的輸入界面仍不夠簡單;其次,電子病歷需要統一的醫學用語標準。目前,美國國家醫學圖書館已制定出統一醫學用語系統(unifiedmedicallanguagesystem,UMLS),這一系統包含了近一百萬個術語描述醫學概念。一旦該系統得以推廣,將極大地促進全球醫學用語的標準化。
二、醫學信息系統
醫學信息系統與其他工業系統有很大的不同。畢業論文不同的部門對信息的要求不同,這是對醫學信息系統最大的挑戰。例如,信息系統用戶可分為基本用戶和二級用戶,基本用戶包括醫師和其他護理人員;二級用戶則包括醫療保險公司、政府醫療保險機構等。不同用戶需要的信息不同,導致信息管理的復雜性。同時,如何有效地利用不同的信息系統解決不同的醫療管理也日益成為人們重視的課題。
信息系統包括實驗測試系統、醫療設備訂購與維護系統及影像圖片存儲與交換系統等,存儲于不同的計算機和不同的信息網絡中。對于特定的用戶來說,前端界面可能有所不同,但是后端數據必須是一體化和標準化的。
醫學信息系統包括企業資源規劃系統(ERP)、患者關系管理系統(patientrelationshipmanage—ment,PRM)、數據挖掘及決策支持系統等|4J。ERP技術在商業領域取得巨大成功,近年來,其在醫療機構中也得到廣泛應用。其特點是將企業信息整合為一體(整合的數據庫),所以各系統都提供一致的數據。一次輸入,多次使用,有效地降低了輸入費用,并保證各系統得到完整、實時、一致的數據。其次,ERP系統可用來決策醫療設備訂購、管理和維護,例如通過一個整合的數據庫,根據病床的使用率,ERP系統可自動選擇最合適的時間對醫療設備進行維護。PRM是側重于患者需求的信息管理系統。PRM記錄患者生活習慣、個人病史、家庭病史以及過敏反應等,醫院從而可提供更加個性化的醫療服務。同時通過PRM,患者也可向醫院詢問醫療方案。數據挖掘技術在醫療管理上也日益重要,這種技術的主要優點是降低成本,為醫師提供最有價值的信息,從而提高醫療診斷的質量。Bresnahan[5]指出,上千種的服務、多種治療方案以及相互關系使信息系統越來越復雜,而這種復雜性推動了數據挖掘技術在醫療上的使用,已遠遠超過其在銀行業和零售業的應用范圍。
三、醫療決策系統
醫學實踐最重要的是作出正確的醫療診斷,因此醫學信息學將研究重點也放在決策系統上。碩士論文決策系統不僅需要先進的信息科學技術和工具,而且需要理解醫師如何利用推理知識作出醫療判斷。
當前決策系統主要基于兩種方法論:著重于統計分析的定量分析法,以及側重于邏輯推理的專家系統法。定量分析法產生于上世紀50和60年代,主要用于解決心臟疾病和異常疼痛等臨床問題。早期系統以概率決策理論為解決問題的依據。最新的此類系統以美國Stanford大學PANDA項目最為著名[6]。PANDA項目使用了決策分析技術,主要應用于胎兒期診斷,根據概率分析方法對胎兒期中的問題作出最有利于患者的選擇。專家系統法以邏輯推理為解決問題的核心。最著名的第一代專家系統是MYCIN系統[7]。此系統主要用于對多種傳染病的診斷和治療,其中的醫學知識不是包含于工具中,而是存儲在規則中。第二代專家系統則以Asgaard系統最為成功[8]。系統大大擴展了MYCIN的功能,并補充了一系列的推理方法,其中包含了所有相關領域中的復雜知識。通過與數據庫的連接,系統可自動提取帶有時間標志的數據,而這種功能則使系統可針對某個患者作出特定階段最適合的治療方式。另外通過反溯法可比較不同的醫療護理,并作出相應的質量報告。
四、影像信息學技術
自上世紀70年代中期,以計算機為基礎的醫學影像學隨著數學、生物物理學和工程模型學蓬勃發展起來。但是由于各類學術會議側重于影像,而忽視了信息學,導致醫學影像信息學科發展緩慢。
直到近年,界面友好的醫學影像數據庫與二維、三維結構及可視化的結合將醫學影像信息學帶入了一個嶄新的時代。開始于1990年的“可視人”項目提供了大量的人體模擬圖像,這一技術的廣泛應用帶動了各類解剖學教育軟件的開發,更為重要的是引發了關于模型、摸擬及大型數字化圖像搜索等一系列的信息學問題。同一時間開始的“人類大腦”項目則直接導致了大量關于大腦數據圖譜登記、分ShanghaiMedJ,2004,VoI27,No9區等課題的開展。新的信息學、生物計量學、計算圖像學的結合,使人們重新認識到影像信息與模擬學的重要性。
現代影像信息學研究的重點包括圖像傳遞標準、傳遞規則、醫學術語、信息壓縮、圖像數據庫索引及圖像病例傳遞安全等。從“虛擬細胞”[9]到“虛擬人”[10],當前影像信息學從分子水平、細胞水平、組織水平到個體都得到廣泛的應用。然而,醫學信息學面臨著更多亟待解決的現實問題。影像信息的完整化需要更深層的科學、技術和醫療實踐的結合,包括對二維和三維圖像自動分區與注冊的新技術;數據抽象與概括;圖像數據庫中生物多樣性來解釋群體圖像數據和表現型與基因型之間的關系;開發醫學信息數據注釋語言整合高級圖像系統和醫院信息系統等。
五、遠程醫療與互聯網
隨著寬帶網進入千家萬戶,遠距離傳遞診斷和患者管理信息成為可能,遠程醫療成為新的研究熱點。通過網絡電視和無線技術,使醫師及患者能隨時傳遞相應的醫學相關信息,從而為遠程醫療開創了更為廣闊的應用前景。然而遠程醫療昂貴的醫療費用使其現階段只限于特定的人群。
互聯網的出現提供了圖片和文字傳輸的介質,而且為醫療機構提供了海量的信息數據。英語論文在互聯網的幫助下,醫師不僅可以全球共享醫學資源,而且可以針對某一特殊病例進行廣泛的交流。例如,美國國家醫學圖書館提供醫藥在線(MEDLINE)數據庫,其成員可查看、打印各類文獻資料;醫學網(CLINICWEB)則提供所有臨床信息的索引,是醫學界常用的搜索引擎。同時互聯網的發展為一些身患相同病癥人群的相互交流提供了可能,此類患者交流組織的形成有利于自我尋找最合適的治療。
六、數據標準的重要性
電子病歷和病案的大量應用、醫療設備和儀器的數字化,使得醫院數據庫的信息容量不斷地膨脹。然而簡單存儲信息只是數據庫的低端操作,數據的集成和分析以及醫學決策和知識的自動獲取才是信息學研究的重點。要對數據進行加工和分析,數據必須以特定的結構方式來存儲。數據結構允許計算機輕易地傳遞符號和像素,并大大提高信息處理的速度。然而,這種數據結構不是僅由輸入來決定的,醫護人員必須有一約定俗成的數據標準,并為社會所公認。這一數據標準明確了數據庫中存儲的特殊符號所具有的涵義。其作用正如字典一樣,起到咨詢和定義的功能。數據標準又可分為文字標準和信息標準。
文字標準是指標準必須以文字形式表示,而不能以圖像形式表達,國際上稱為醫療數據系統,它包括一系列有特定涵義的單詞。意識到標準的重要性,越來越多的醫學和信息組織參與到此標準的制訂中來。其中最著名的為美國病理協會制訂的人類與獸類醫學系統術語標準SNOMED和英國健康中心制訂的醫學系統術語標準ReadCodes。
信息標準則同時定義文字和圖像數據。當今最通用的信息標準稱為HL7(HealthLevelSeven),也可稱為標準衛生信息傳輸協議,其中又包括醫學數字化圖像和傳遞標準(DICOM)。HL7標準確定了數據庫系統中信息傳遞的順序和格式,涵蓋了實驗測試術語、藥品設備采購術語、收費術語、出院轉院術語及電子監護術語等,并提供了一種類似于數據庫的結構,利于患者信息在電子病歷系統、實驗室系統等多種數據系統中傳遞。
DICOM可明確圖像在數據流傳遞過程中壓縮和加密的格式,并確定CT圖像或B超圖像在數據庫中存儲的方式。
七、結語
醫學信息學是計算機技術、生物物理學、統計學等與現代醫療結合的新興學科,也是提高醫療服務質量、醫院管理水平和降低成本的必然結果。這一學科需要多領域科研人員和醫務工作者的大力合作??梢灶A見,不久的將來醫學信息學將在醫院管理、教學和科研、疾病的預防、診斷和治療等方面發揮巨大和不可替代的作用,并將帶動整個醫學界的革新。
參考文獻
1GreenesRA.ShortliffeEH.Medicalinformatics:anemerginga-cademicdisciplineandinstitutionalpriority.JAMA,1990,263:1114—1120.
2SteadWW.HalrlmondWE.Computer-basedmedicalrecords:thecenterpieceofTMRMDComput,1988,5:48—62.
3McDonaldCJThebarrierstoelectronicmedicalrecordsystemsandhowtoovercomethemJAmMedInformAssoc,1997,4:213—221.
4SiauK.Healthcareinformatics.IEEETransInfTechnolBiome-di.2003.7:1-7.
5BresnahanJ.Dataminging:adelicateoperationCIOMag(on-line).1997.
6OwensDK,ShachterRD,NeaseRF.Representationandanaly-sisofmedicaldecisionproblemswithinfluencediagrams.MedDecisiMaking,1997.17:241—262.
7YuVL,FaganLM,WraithSM,eta1.Antimicrobialselectionbyacomputer:Ablindedevaluationbyinfectiousdiseaseexperts.JAMA,1979,242:1279—1282.
8ShaharY,MikschS,JohnsonP.TheAsgaardproject:ataskspecificframeworkfortheapplicationandcritiquingoftime-on-entedclinicalguidelines.ArtifIntellMed.1998.14:29—51.
[論文摘要]生物信息學是80年代以來新興的一門邊緣學科,信息在其中具有廣闊的前景。伴隨著人類基因組計劃的勝利完成與生物信息學的發展有著密不可分的聯系,生物信息學的發展為生命科學的發展為生命科學的研究帶來了諸多的便利,對此作了簡單的分析。
一、生物信息學的產生
21世紀是生命科學的世紀,伴隨著人類基因組計劃的勝利完成,與此同時,諸如大腸桿菌、結核桿菌、啤酒酵母、線蟲、果蠅、小鼠、擬南芥、水稻、玉米等等其它一些模式生物的基因組計劃也都相繼完成或正在順利進行。人類基因組以及其它模式生物基因組計劃的全面實施,使分子生物數據以爆炸性速度增長。在計算機科學領域,按照摩爾定律飛速前進的計算機硬件,以及逐步受到各國政府重視的信息高速公路計劃的實施,為生物信息資源的研究和應用帶來了福音。及時、充分、有效地利用網絡上不斷增長的生物信息數據庫資源,已經成為生命科學和生物技術研究開發的必要手段,從而誕生了生物信息學。
二、生物信息學研究內容
(一)序列比對
比較兩個或兩個以上符號序列的相似性或不相似性。序列比對是生物信息學的基礎。兩個序列的比對現在已有較成熟的動態規劃算法,以及在此基礎上編寫的比對軟件包BALST和FASTA,可以免費下載使用。這些軟件在數據庫查詢和搜索中有重要的應用。有時兩個序列總體并不很相似,但某些局部片斷相似性很高。Smith-Waterman算法是解決局部比對的好算法,缺點是速度較慢。兩個以上序列的多重序列比對目前還缺乏快速而又十分有效的算法。
(二)結構比對
比較兩個或兩個以上蛋白質分子空間結構的相似性或不相似性。
(三)蛋白質結構預測
從方法上來看有演繹法和歸納法兩種途徑。前者主要是從一些基本原理或假設出發來預測和研究蛋白質的結構和折疊過程。分子力學和分子動力學屬這一范疇。后者主要是從觀察和總結已知結構的蛋白質結構規律出發來預測未知蛋白質的結構。同源模建和指認(Threading)方法屬于這一范疇。雖然經過30余年的努力,蛋白結構預測研究現狀遠遠不能滿足實際需要。
(四)計算機輔助基因識別
給定基因組序列后,正確識別基因的范圍和在基因組序列中的精確位置.這是最重要的課題之一,而且越來越重要。經過20余年的努力,提出了數十種算法,有十種左右重要的算法和相應軟件上網提供免費服務。原核生物計算機輔助基因識別相對容易些,結果好一些。從具有較多內含子的真核生物基因組序列中正確識別出起始密碼子、剪切位點和終止密碼子,是個相當困難的問題,研究現狀不能令人滿意,仍有大量的工作要做。
(五)非編碼區分析和DNA語言研究
在人類基因組中,編碼部分進展總序列的3-5%,其它通常稱為“垃圾”DNA,其實一點也不是垃圾,只是我們暫時還不知道其重要的功能。分析非編碼區DNA序列需要大膽的想象和嶄新的研究思路和方法。DNA序列作為一種遺傳語言,不僅體現在編碼序列之中,而且隱含在非編碼序列之中。
三、生物信息學的新技術
(一)Lipshutz(Affymetrix,Santaclara,CA,USA)
描述了一種利用DNA探針陣列進行基因組研究的方法,其原理是通過更有效有作圖、表達檢測和多態性篩選方法,可以實現對人類基因組的測序。光介導的化學合成法被應用于制造小型化的高密度寡核苷酸探針的陣列,這種通過軟件包件設計的寡核苷酸探針陣列可用于多態性篩查、基因分型和表達檢測。然后這些陣列就可以直接用于并行DNA雜交分析,以獲得序列、表達和基因分型信息。Milosavljevic(CuraGen,Branford,CT,USA)介紹了一種新的基于專用定量表達分析方法的基因表達檢測系統,以及一種發現基因的系統GeneScape。為了有效地抽樣表達,特意制作片段模式以了解特定基因的子序列的發生和冗余程度。他在酵母差異基因表達的大規模研究中對該技術的性能進行了驗證,并論述了技術在基因的表達、生物學功能以及疾病的基礎研究中的應用。(二)基因的功能分析
Overton(UniversityofPennsylvaniaSchoolofMedicine,Philadelphia,PA,USA)論述了人類基因組計劃的下一階段的任務基因組水平的基因功能分析。這一階段產生的數據的分析、管理和可視性將毫無疑問地比第一階段更為復雜。他介紹了一種用于脊椎動物造血系統紅系發生的功能分析的原型系統E-poDB,它包括了用于集成數據資源的Kleisli系統和建立internet或intranet上視覺化工具的bioWidget圖形用戶界面。EpoDB有可能指導實驗人員發現不可能用傳統實驗方法得到的紅系發育的新的藥物靶,制藥業所感興趣的是全新的藥物靶,EpoDB提供了這樣一個機會,這可能是它最令人激動的地方。
Babbitt(UniversityofCalifornia,SanFrancisco,CA,USA)討論了通過數據庫搜索來識別遠緣蛋白質的方法。對蛋白質超家族的結構和功能的相互依賴性的理解,要求了解自然所塑造的一個特定結構模板的隱含限制。蛋白質結構之間的最有趣的關系經常在分歧的序列中得以表現,因而區分得分低(low-scoring)但生物學關系顯著的序列與得分高而生物學關系較不顯著的序列是重要的。Babbit證明了通過使用BLAST檢索,可以在數據庫搜索所得的低得分區識別遠緣關系(distantrelationship)。Levitt(Stanforduniveersity,PaloAlto,CA,USA)討論了蛋白質結構預測和一種僅從序列數據對功能自動模建的方法?;蚬δ苋Q于基因編碼的蛋白質的三級結構,但數據庫中蛋白質序列的數目每18個月翻一番。為了確定這些序列的功能,結構必須確定。同源模建和從頭折疊(abinitiofolding)方法是兩種現有的互為補充的蛋白質結構預測方法;同源模建是通過片段匹配(segmentmatching)來完成的,計算機程棄SegMod就是基于同源模建方法的。
(三)新的數據工具
Letovsky(JohnshopkinsUniversity,Baltimore,MD,USA)介紹了GDB數據庫,它由每條人類染色體的許多不同圖譜組成,包括細胞遺傳學、遺傳學、放射雜交和序列標簽位點(STS)的內容,以及由不同研究者用同種方法得到的圖譜。就位置查詢而言,如果不論其類型(type)和來源(source),或者是否它們正好包含用以批定感興趣的區域的標志(markers),能夠搜索所有圖譜是有用的。為此目的,該數據庫使用了一種公用坐標系統(commoncoordinatesystem)來排列這些圖譜。數據庫還提供了一張高分辨率的和與其他圖譜共享許多標志的圖譜作為標準。共享標志的標之間的對應性容許同等于所有其它圖譜的標準圖譜的分配。
Candlin(PEappliedBiosystems,FosterCity,CA,USA)介紹了一種新的存儲直接來自ABⅠPrismdNA測序儀的數據的關系數據庫系統BioLIMS。該系統可以與其它測序儀的數據集成,并可方便地與其它軟件包自動調用,為測序儀與序列數據的集成提供了一種開放的、可擴展的生物信息學平臺。
參考文獻:
藥學信息學計算機綜合實驗課程體系建設
(1)重視實用性課程實驗的開設是藥學信息學課程體系創新與實踐的重要特點。藥學信息學專業計算機基礎課程實驗設計的目標是使學生能夠達到在藥學研究領域掌握計算機應用的專業背景知識及能力。藥學信息應用型人才培養體系的藥學信息學課程體系的實驗內容包括“計算機基礎”、“程序設計技術與應用”以及高級課程“計算機在藥學中的應用”等三個方面的具體實施項目。(2)根據藥學專業對計算機人才的需求及應用,結合計算機基礎教學的具體內容及多年的教學實踐,將藥學信息學課程體系試驗設計分為三組典型實驗:①計算機基礎操作典型實驗;②計算機程序設計典型實驗;③計算機綜合應用典型實驗。三組實驗的設計與實施具有層次鮮明、條理清晰、結構完善、循序漸進等特點。
構建課程網絡教學平臺建設
(1)建立了以多元化、交互式學習環境為主要特色的多功能網站,建立完善的多媒體教學資源庫,該教學資源庫是面向全校學生,集學生自學、師生交流、網絡答疑等多功能于一體綜合網絡教學平臺。(2)該教學資源庫中包括教師課件、課外閱讀資料、相關資料圖片,以及教學過程中使用到的軟件、教學錄像等,并且通過網站平臺免費提供藥學信息學體系的教學大綱、教材、教學方案、教學課件、實驗課程設計、教學資源素材,全面公開并共享教學資源,突破時間和地點的限制,為學生自主學習提供幫助,教學方式由目前的多媒體教學逐步轉變為網絡化教學。(3)在“構建藥學信息學課程體系創新與實踐”過程中,制作了系列課程相應的PowerPoint演示文檔,并建立的多個相應的實例數據及應用軟件用法介紹視頻,并提供大量相關多媒體參考、學習資料,方便藥學信息學專業的學生快速查找和深入學習各章節的內容,同時也提供了部分可執行的藥學信息學應用程序,有助于加深學生對書本知識的理解,而且也為藥學信息學實驗數據處理及模擬提供了有利幫助。(4)建立并豐富了藥學信息學系列課程的測試大型試題庫,并開發設計了聯網在線機考測評軟件,面向全校學生,實現了無紙化考試。通過以下綜合實驗操作技能的綜合測評,如藥學常用軟件工具練習及開發環境構建、基于Excel和VisualBasic的藥學試驗設計、基于Matlab和VisualBasic的LD50計算、基于Excel和Matlab的藥學實驗數據分析等實驗檢測項目,健全了以檢驗實際操作能力為核心的考試測評機制、以考促學的積極作用,豐富完善了藥學信息學課程體系建設的重要環節。
一、正在出現的技術
Klingler(Lncytepharmaceuticals,PaloAlto,CA,USA)強調基因組學正推動制藥業進入信息時代。隨著不斷增加的序列、表達和作圖數據的產生,描述和開發這些數據的信息工具變得對實現基因組研究的任務至關重要。他談到了Incytepharmaceuticals對大規模基因組數據和生物信息學的貢獻。
Lipshutz(Affymetrix,Santaclara,CA,USA)描述了一種利用DNA探針陣列進行基因組研究的方法,其原理是通過更有效有作圖、表達檢測和多態性篩選方法,可以實現對人類基因組的測序。光介導的化學合成法被應用于制造小型化的高密度寡核苷酸探針的陣列,這種通過軟件包件設計的寡核苷酸探針陣列可用于多態性篩查、基因分型和表達檢測。然后這些陣列就可以直接用于并行DNA雜交分析,以獲得序列、表達和基因分型信息。Milosavljevic(CuraGen,Branford,CT,USA)介紹了一種新的基于專用定量表達分析方法的基因表達檢測系統,以及一種發現基因的系統GeneScape。為了有效地抽樣表達,特意制作片段模式以了解特定基因的子序列的發生和冗余程度。他在酵母差異基因表達的大規模研究中對該技術的性能進行了驗證,并論述了技術在基因的表達、生物學功能以及疾病的基礎研究中的應用。
二、基因的功能分析
Overton(UniversityofPennsylvaniaSchoolofMedicine,Philadelphia,PA,USA)論述了人類基因組計劃的下一階段的任務——基因組水平的基因功能分析。這一階段產生的數據的分析、管理和可視性將毫無疑問地比第一階段更為復雜。他介紹了一種用于脊椎動物造血系統紅系發生的功能分析的原型系統E-poDB,它包括了用于集成數據資源的Kleisli系統和建立internet或intranet上視覺化工具的bioWidget圖形用戶界面。EpoDB有可能指導實驗人員發現不可能用傳統實驗方法得到的紅系發育的新的藥物靶,制藥業所感興趣的是全新的藥物靶,EpoDB提供了這樣一個機會,這可能是它最令人激動的地方。
Sali(Rockefelleruniversity,NewYork,NY,USA)討論了同源蛋白質結構模建。比較蛋白質模建(comparativeproteinmodeling)也稱為同源模建(homologymodeling),即利用實驗確定的蛋白質結構為模式(模型)來預測另一種具有相似氨基酸序列的蛋白質(靶)的構象。此方法現在已經具有了足夠的精確性,并且被認為效果良好,因為蛋白質序列的一個微小變化通常僅僅導致其三維結構的細微改變。
Babbitt(UniversityofCalifornia,SanFrancisco,CA,USA)討論了通過數據庫搜索來識別遠緣蛋白質的方法。對蛋白質超家族的結構和功能的相互依賴性的理解,要求了解自然所塑造的一個特定結構模板的隱含限制。蛋白質結構之間的最有趣的關系經常在分歧的序列中得以表現,因而區分得分低(low-scoring)但生物學關系顯著的序列與得分高而生物學關系較不顯著的序列是重要的。Babbit證明了通過使用BLAST檢索,可以在數據庫搜索所得的低得分區識別遠緣關系(distantrelationship)。Levitt(Stanforduniveersity,PaloAlto,CA,USA)討論了蛋白質結構預測和一種僅從序列數據對功能自動模建的方法?;蚬δ苋Q于基因編碼的蛋白質的三級結構,但數據庫中蛋白質序列的數目每18個月翻一番。為了確定這些序列的功能,結構必須確定。同源模建和從頭折疊(abinitiofolding)方法是兩種現有的互為補充的蛋白質結構預測方法;同源模建是通過片段匹配(segmentmatching)來完成的,計算機程棄SegMod就是基于同源模建方法的。
三、新的數據工具
Letovsky(JohnshopkinsUniversity,Baltimore,MD,USA)介紹了GDB數據庫,它由每條人類染色體的許多不同圖譜組成,包括細胞遺傳學、遺傳學、放射雜交和序列標簽位點(STS)的內容,以及由不同研究者用同種方法得到的圖譜。就位置查詢而言,如果不論其類型(type)和來源(source),或者是否它們正好包含用以批定感興趣的區域的標志(markers),能夠搜索所有圖譜是有用的。為此目的,該數據庫使用了一種公用坐標系統(commoncoordinatesystem)來排列這些圖譜。數據庫還提供了一張高分辨率的和與其他圖譜共享許多標志的圖譜作為標準。共享標志的標之間的對應性容許同等于所有其它圖譜的標準圖譜的分配。
Markowitz(LawrenceberkeleyLaboratory,Berkeley,CA,USA)討論了分布式數據庫與局部管理的關系,以及用基于工具的方法開發分子生物學數據庫(MDBs)的問題。許多方案當前正在促進搜索多種不同來源MDBs的數據,包括建立數據倉庫;這要求對各種MDBs的組合有一種全局觀,并從成員MDBs中裝填數據入中心數據庫。這些方案的主要問題是開發整體視圖(globalviews),構建巨大的數據倉庫并使集成的數據庫與不斷發展中的成員MDBs同步化的復雜性。Markowitz還討論了對象協議模型(objectprotocolmodel,OPM),并介紹了支持以下用途的工具:建立用于文本文件或者關系MDBs的OPM視圖;將MDBs作成一個數據庫目錄,提供MDB名稱、定位、主題、獲取信息和MDB間鏈接等信息;說明、處理和解釋多數據庫查詢。Karp(SRIinternational,MenloPark,CA,USA)解釋了Ocelot,一種能滿足管理生物學信息需求的面向對象知識陳述系統(一種面向對象系統的人工智能版)。Ocelot支持略圖展開(schemaevolution)并采用一種新的最優化并行控制機制(同時進行多項訪問數據的過程),其略圖驅動圖形編輯器提供了交互式瀏覽和編輯功能,其注釋系統支持數據庫開發者之間的結構通訊。
Riley(MarinebiologicalLaboratory,WoodsHole,MA,USA)在討論大腸桿菌蛋白質的功能同時,特別提到了GPEC數據庫,它包括了由實驗確定的所有E.coli基因的功能的信息。該數據庫中最大比例的蛋白質是酶,其次則為轉運和調控蛋白。
Candlin(PEappliedBiosystems,FosterCity,CA,USA)介紹了一種新的存儲直接來自ABⅠPrismdNA測序儀的數據的關系數據庫系統BioLIMS。該系統可以與其它測序儀的數據集成,并可方便地與其它軟件包自動調用,為測序儀與序列數據的集成提供了一種開放的、可擴展的生物信息學平臺。
Glynais(NetGenics,Cleveland,OH,USA)認為生物信息學中最關鍵的問題之一是軟件工具和數據庫缺乏靈活性。但是,軟件技術的發展已得到了其它領域如金融業和制造業的發展經驗的借鑒,可以使來自不同軟件商的運行于各種硬件系統的軟件共同工作。這種系統的國際標準是CORBA,一種由250多個主要軟件和硬件公司共同合作開發的軟件體系。聯合使用CORBA和Java可以開發各種通過一個公用用戶界面訪問任何種類的數據或軟件工具的網絡應用軟件,也包括生物信息學應用軟件。Overton不同意Glynias的這種想法,他強調說CORBA僅對軟件集成有用,不兼容的數據庫軟件可能是計算生物學所面臨的最困難問題,一些制藥公司和數據庫倉庫最近資助了一項用OCRBA鏈接不同的數據庫的計劃[2,3]。
四、制藥先導的發現
Burgess(Sturcturalbioinformatics,SanDiego,CA,USA)討論了填補基因組學和藥物設計之間鴻溝的蛋白質結構中的計算問題。在缺乏主要疾病基因或藥物靶的精確描述數據的情況下,藥物設計者們不得不采用大規模表達蛋白質篩選方法;而結構生物信息學則采用一種更為實用有效的計算方法直接從序列數據中確定靶蛋白質的活性位點的精細結構特征,它利用一種集成專家系統從現實的或虛擬的化學文庫中進行迅速的計算篩選,可以達到一個很大的規模。
Elliston(Genelogic,Columbia,MD,USA)討論了治療藥物開發中發現新的分子靶的過程,著重討論了基因發現方法。他認為,隨著日益臨近的人類基因組測序的完成,幾乎全部基因的特征將在序列水平得到揭示。但是,對基因的認識將有賴于更多的信息而不僅僅是序列,需要考慮的第一類信息是轉錄表達水平信息,而Genelogic公司的GeneExpress就是一個由mRNA表達譜、轉錄因子位點、新基因和表達序列標簽組成的數據庫。
Liebman(Vysis,Downessgrove,IL,USA)介紹了Vysis公司開發的計算和實驗方法,這些主法不僅用于管理序列數據,而且被用于以下用途:分析臨床數據庫和自然—突變數據庫;開發新的算法以建立功能同源性(區別于序列同源性)模擬生物學通路以進行風險評估;藥物設計的靶評估;聯系復雜的通路特性以便識別副作用;開發疾病發展的定性模型并解釋臨床后果。
隨著發現的新基因的日益增多,這個問題顯得格外重要:基因的功能是什么?Escobedo(Chirontechnologies,Emeryville,CA,USA)提出了這個問題的一種方法:將分泌蛋白質的基因的功能克隆與篩選這些克?。赡艿乃幬锇校┙Y合起來。在這種方法中,在微粒體cDNA文庫池中進行體外翻譯避免了勞動密集的克隆、表達和純化步聚,對文庫池中的翻譯產物在細胞水平進行篩選,測試其在細胞增殖和分化中的作用。例如,在用這種方法識別的111個克隆中,56個屬于已知的分泌蛋白質,25個為膜相關蛋白,另外30個功能未知,可能是新的蛋白質。一種相似的方法在轉移到小鼠模型系統中的基因傳導載體中構建分泌蛋白質的cDNA文庫來克隆特定的功能基因。
Ffuchs(Glaxowellcome,ResearchTrianglePark,NC,USA)討論了生物信息學更為廣義的影響:它不僅影響到新藥物靶基的發現,還對改善藥物開發的臨床前期和臨床期的現狀極具重要性。眾所周知,涉汲數以千計病人的臨床試驗(可能是藥物開發最為花錢的部分)的設計不論多么仔細,也不能為正確的藥物選擇正確的病人。而在基因組水平劃分病人群體的方法可以大大改善發現新藥的效率。Fuchs介紹了一種將病人的基因型和表型標志結合起來以改善臨床前期和臨床期藥物開發過程的系統GeneticinformationSystem.他強調將遺傳學和生物信息學數據同化學、生物化學、藥理學和醫學數據連接起來的集成信息管理和分析方法是極其重要的。
Green(HumanGenomeSciences,Rockville,MD,USA)介紹了他的測序工作中采用的數據管理工具?;贓ST的測序方法所面臨的挑戰是,在對幾百個cDNA克復測序之后,產生的數據堆積如山。由于大多數人類基因都是用這種方法發現并在么有數據庫中分類編排的,面臨的識別開放讀框、重疊序列的重疊圖譜、組織特異表達和低豐度mRNA基因的任務是令人生畏的。HumangenomeSciences公司開發了一些可用戶化數據庫工具,在同一個數據庫中可包括以下功能:WWW上訪問和檢索數據,序列拼接,臨視潛在藥物靶基因的研究進展等。這些能夠管理多項任務——從注釋基因序列到成功開發基因產物進入藥物發現的流程——的軟件工具,極其可望從一種基于基因組知識的藥物發現方法中得到新的藥物靶。
Summer-Smith(Base4bioinformatics,Mississauga,Ontario,Canada)描述了一種相關的策略。藥物發現階段中所要求的軟件工具的任務是多樣化的,要能注釋基因,并闡明它的生理和病理功能及其商業潛質。對這樣多種來源的信息的集成與分析,在派生的、項目取向的數據庫(project-specificdatabase,PSD)中可以很好完成。由于項目貫穿于發現到開發全過程,其間又不斷加入背景的成員,PSD在項目的管理與發展中成為一種關鍵性的資源。
按照Smith(Bostonuniversity,Boston,MA,USA)的觀點[2],我們并不需要更快捷的計算機或更多的計算機科學家,而是需要更的生物學家和生物化學家來解釋序列的功能。這對有些軟件或硬件專家來說是個打擊,但生物學系統的復雜性是令人生畏的,并且對基因功能的認識可能需要生物學方法和計算方法的結合。探索基因的功能很可能要花費生物學家們數十年的時間,本次會議表明沒有任何單一的方法可以得出一個答案;但是,將計算生物學同大規模篩先結合起來識別一種化學靶物(hit)是一種產生化學工具來探索基因功能的方法,這些化學工具接下來就可以用作理解基因功能的“探針”。這種方法在Butt(GeneTranscriptionTechnologies,Philadelphia,PA,USA)的描述中,既是一種檢查基因功能的簡單方法,也是為潛在的藥物靶發現化學先導物的簡單方法,他描述了一種可以在酵母中重建人類基因功能的酵母大規模篩選系統。在此系統中,可以迅捷地在一個化學文庫中發現配基。這種技術的重要特征是它不僅僅是發現一種藥物靶的配基的篩板(screen),相反,由于該系統的高速度,它也是發現先導靶基因的一種篩板。過去,世界上的制藥公司通常在某一時間內僅能對有限數目(約20多個)的藥物靶基因進行工作,鑒于此,我們需要根本不同的方法如基因組學來打開通向“新”生物學的通路。由于機器人和合成化學的進步,藥物發現中最關鍵的問題不再是得到一種先導化合物(leadcompound),而是得到導向靶基因。此次會議為從計算和實驗方法中發展出的新生物學邁出很好的一步。
參考文獻
1LimHA,BatttR.TIBTECH,1998;16(3)):104
1.1醫學信息學教學與醫學實踐需求脫節
醫學信息學的教學體系應該從醫學信息的上、中、下“三游”來加以組織。醫學信息學上游主要是指傳授醫學信息的本質、特征、類型、產生機制與機構、傳播等知識。醫學信息學中游主要是指傳授醫學信息的搜集、整理、鑒定、組織與分析,以及醫療信息化背景下的醫學信息的描述與信息庫、衛生信息系統、醫學信息的儲存、檢索和深加工等知識。醫學信息學下游主要是指傳授醫學信息資源開發、利用與服務及其文化傳承等知識。筆者認為醫學信息學是一門應用型較強的課程,對于醫學專業的學生需要根據未來所從事的職業性質研修相應的“三游”知識。如臨床專業的學生需要研修病案管理學、病案信息資源管理學、醫院信息系統、電子病歷等課程。但是就筆者所在的南京醫科大學進行調研發現,在醫學學生的教學計劃中,只有衛生信息管理與信息系統專業與醫療保險專業開設了醫學信息學的相關課程,而作為未來醫學信息的產生者——醫生,臨床專業的醫學生教學計劃中沒有醫學信息學的相關課程。這種醫學信息學教學與醫學實踐需求之間的脫節,直接導致臨床專業的醫學生在大學期間沒有培養良好的醫學信息學素養,進而導致這些醫學生在未來成為醫生之后對醫學信息不重視,甚至為醫學信息產生、收集、整理而煩惱。
1.2醫學信息學學科發展不深入
長春工業大學繼續教育學院對開設醫學信息學專業(或方向)的高校進行了排名,其順序是復旦大學、中山大學、中南大學、中國醫科大學、首都醫科大學、四川大學、北京大學、南方醫科大學、山西醫科大學、浙江大學、華中科技大學、西安交通大學、石河子大學、吉林大學、重慶醫科大學、哈爾濱醫科大學、山東大學、杭州師范大學、南京醫科大學、泰山醫學院、河北醫科大學、南昌大學、天津中醫藥大學、福建醫科大學、武漢大學、上海交通大學、青島大學、天津醫科大學、延邊大學、浙江中醫藥大學、新鄉醫學院、南華大學和大連醫科大學等33所高校。筆者在南京醫科大學圖書館網站利用“題名=醫學信息或衛生信息,文獻類型選擇‘中文書籍’進行檢索,返回結果為51本與醫學信息相關,14本與衛生信息相關的文獻。在51本與醫學信息相關的檢索結果中涉及醫學信息檢索的文獻為31本,涉及到醫學信息學基礎教程的結果為8本。其余主要包括醫學信息研究、醫學信息資源組織與管理、醫學信息系統、醫學信息學決策與支持系統和醫學信息分析等。綜觀這些檢索結果基本上是針對不同對象的大學課程教科書。在14本與衛生信息相關的檢索結果中涉及衛生信息管理的結果為8本,涉及衛生信息系統的結果為2本,涉及衛生信息化的有2本,涉及衛生信息技術與衛生信息資源的各1本。從檢索結果可以得出在醫學信息學學科發展過程中存在創作重復現象。如在檢索結果中涉及到的知識點雷同多,書本編排應急就章,重復建設,后出版之書不僅沒有超過前者,有的反而出現倒退現象。除劉冰、黃玉玲主編的《醫學信息研究》之外,主要用于醫學信息學專業教學教材。在這些教材中除了丁寶芬教授的《醫學信息學》、羅愛靜教授的《衛生信息管理概論》和《衛生信息管理學》作為普通高等教育國家級教材規劃教材之外,其余教材鮮有得到國際或國內同行普遍認同。有些著作雖然注重吸收圖書情報與檔案管理學的學科知識,但是沒有能夠與醫學信息學有效融合,移植現象比較明顯。當然筆者在此無意于簡單否定醫學信息學界與出版界同行的工作,但我國33所醫學信息學相關專業的高等院校應該反思,應考慮利用范式理論指引學科發展,加強知識橫向與縱向的傳承與發展,引進圖書情報與檔案管理學、經濟學和管理學等理論,彌補國內醫學信息學學科的空白和不足,提升學科地位。
2醫學信息學范式研究是解困之舉
隨著全球化進程的加劇,醫學信息學也將與其他學科更加相融,醫學信息學的發展必將走向開放與合作,醫學信息學學科發展問題將會成為一個國際性課題。因此我國醫學信息學共同體利用范式理論作為研究手段,從國外學科研究成果和研究方法中汲取有益成分,使之為解決國內醫學信息學的學科發展之瓶頸成為應然解困之舉。
2.1范式研究有助于醫學信息學學科的深化與拓展
醫學信息學要想從宏觀上和根本上提升學科地位,需要在元科學領域的研究上投入更多精力。元科學理論,即關于科學的科學,醫學信息學元科學即是指關于醫學信息學的科學。當醫學信息學發展到一定階段的時候,醫學信息學共同體會對學科的本質、規律及其相關元問題進行分析與探究,便產生了“學中之學”、“科學之科學”的研究取向,筆者認為可以將這類的醫學信息學分支學科稱之為“醫學信息學元科學”。醫學信息學共同體會遵循學科發展史的軌跡,即經驗研究、方法論研究和理論研究,具體發展走向為病案管理、醫學信息檢索、衛生信息管理學、衛生信息化、衛生法律法規、醫學信息保護技術學、醫院信息系統、衛生信息系統、電子病歷、區域醫療合作和醫學信息學史等。在此基礎之上,醫學信息學科分支中會產生醫學信息學概論(衛生信息管理概論)——以“揭示醫學信息學現象本質和規律為研究目的”的學科。醫學信息學范式研究就是關于醫學信息學學科自身的深化與拓展,醫學信息學共同體立足于宏觀抽象層面,從根本上認識醫學信息學的元問題和本質規律?,F階段我國的醫學信息學研究已具備一定的規模和水平,其研究領域已經從醫學知識表達、衛生信息系統、生物信息學、醫學信息學教育與培訓l等傳統領域向面向語義互操作的知識體系構建、跨系統和跨應用的互操作標準制定、網格與云環境下的應用、轉化醫學、人體模型建設、臨床決策和認知學領域深入發展。盡管醫學信息學的發展已經進入了一個全新的發展領域,具有較快的發展速度,但是對元問題層面的挖掘探討仍對學科的發展是至關重要的。以醫學信息學元科學代表“醫學信息學概論”或“衛生信息管理概論”為例,現有的文獻僅有一本,即衛生部“十一五”規劃教材——《衛生信息管理概論》。筆者認為作為醫學信息學元科學的《衛生信息管理概論》應當注重對醫學信息學生存環境、發展史和共同體的研究,應從醫學信息學本身的問題出發建立起本學科研究問題的獨特視角,而不宜將大量的篇幅放在對“對象性事物”的描述和闡述上。基于元科學的重要性,醫學信息學理應將更多的空間設定在元科學領域的研究上,才能從根本上提升該學科地位。醫學信息學范式研究理應針對醫學信息學自身的探討和分析,立足于宏觀抽象層面認識醫學信息學基本問題和本質規律的研究。鑒于此,筆者認為醫學信息學范式研究與醫學信息學發展的要求是一致的,它是醫學信息元科學研究的最佳切入點,它是以醫學信息學發展史為研究主線,不僅涉及到醫學信息學未來的發展方向,還需要研究醫學信息學學科共同體主體作用、醫學信息范式變遷與學科外在環境因素之間的關系等。
2.2范式研究是醫學信息學汲取外學科精華的典型嘗試
較之于醫學信息學內部各分支學科之間的互相融合,醫學信息學對其他學科理論和技術應用的吸收、引進、消化、滲透、移植等將不斷推進醫學信息學的發展。即使醫學信息學在解謎過程中出現不可通約性,分歧未能達成一致意見,醫學信息學也會在反復的推敲和質疑中逐漸成熟。因為在外學科理論引入醫學信息學的磨合期中所產生的碰撞、摩擦和火花,可能為醫學信息學的發展提供爭論的焦點和學術的創新點。醫學信息學范式研究正是基于這一思考與目的。美國社會學家米爾斯在《社會學的想像力》中論及:“將自己的領域當作獨立的王國,而忽略它與其他領域,諸如經濟、政治等方面的聯系,造成了歸納的一般性無法演變成演繹的精確性,演繹的精確性又無法上升到歸納的一般性。最終的結果就是,個人困擾沒有成為公共論題,甚至于漸行漸遠。人文精神的組織力進化成為科學精神的機械性,而概念和方法則成為了問題的主導因素,這不禁有本末倒置之嫌。加之于我們對社會本身是如何形成的一無所知,而只是無意識地接受了其存在的合法性,這更容易加深身處其中人的無力和無助感?!贬t學信息學范式從本質上說就是社會學理論進入醫學信息學領域的一大嘗試。醫學信息學由單一研究方向向多重研究方向發展,從病案管理學向病案學、醫學信息檢索、衛生信息系統、醫學決策支持系統、認知學和醫學倫理與監管等方向發展,醫學信息學專業呈現日益增多,學科日趨分化的趨勢。從醫學信息學的發展趨勢來看,符合人類的認識發展規律。初期關于醫學信息學的知識是從病案管理實踐著手,對于學科還沒有一個完整、清晰的認識,隨著研究活動的深入、認識的推進,與學科內外發展動力因素的影響,對醫學信息學進行逐塊逐層的分解研究,于是出現了整體知識的不斷吸收、引進、消化、滲透、移植等,在學科組成上表現為學科不斷分化成病案學、醫學信息學、衛生信息系統等分支學科(或專業)。醫學信息學的發展理應汲取外學科的精華充實與強化本學科內涵建設,來解決醫學信息學科建設中的熱點、難點與焦點問題。因此,為了醫學信息學的科學發展,我們需要的是深刻剖析與之存在學科依賴關系及其運作原則,并結合其他學科的研究成果來探討此情境下的醫學信息學的學科發展問題,而不是脫離其中任何一方。我國的醫學信息學發端于2O世紀80年代初的醫學圖書情報學,研究體系不夠完整和成熟,研究領域也不平衡,例如重視文獻信息管理、技術路線和微觀實踐,但是對于理論研究和學科RESEARCHONLIBRARYSCIENCE19建設研究不夠深入,標準規范建設滯后,信息共享不足、缺乏系統規劃,人才數量不足、質量有待提高、結構不盡合理。新時期的醫學信息學又面臨學科外的政治環境、經濟環境的影響,與計算機技術、網絡技術、社會學、倫理學、認知學和人工智能技術的應用與滲透,意味著醫學信息學已經沿著范式理論的軌跡,發展成為一門綜合各學科精華的邊緣交叉學科。在醫學信息學研究呈現多樣化趨勢的今天,借鑒社會學方法有助于分析醫學信息學的發展方向、分支學科,或許會讓我們發現原來的封閉視野所不能看到的演進過程與規律;也有助于當我們習慣于現有學科思維框架下的醫學信息學發展之余,換之以外學科的視角重新審視和考察醫學信息學的發展和演變,給學科的發展與建設輸入新的血液。
3醫學信息學學科范式內涵探微
“范式(Paradigm)”一詞是托馬斯•庫恩首先在《科學革命的結構》一書中用于科學研究的,他在該書中指出:“范式通常是指那些公認的科學成就,他們在一段時間里為實踐共同體提供典型的問題和解答??梢杂脕斫忉尶茖W歷史發展軌跡及其科學知識增長模式的社會學概念?!薄胺妒降闹饕憩F為‘符號概括’、‘信念’、‘價值’和‘范例’等。”在解讀與理解庫恩關于范式的闡述的基礎上,筆者認為,醫學信息學范式是醫學信息學共同體在醫學信息生產和管理實踐活動中所共有的世界觀、方法論、理論成果和共同遵守的行為準則(即范例)等成分,是指醫學信息學共同體公認的“模式”。共同體、世界觀、方法論、理論成果和范例等是醫學信息學范式的重要組成成分,其雖不可能涵蓋醫學信息學范式全部的“應有之義”,但可以把這些當作醫學信息學范式的核心內容。
3.1共同體
科學共同體簡稱為共同體,最早運用可以追溯到1942年,英國物理學家、哲學家波朗尼(Polanyi)在其論文《科學的自治》中使用了這一概念。庫恩在《科學革命的結構》中把“共同體”理解為科學范式的承載體——“一個科學共同體由共有一個范式的人組成”。學科共同體是以上一切成分元素的執行者,也是經常被忽略的研究主體??茖W共同體研究在范式研究中的地位毋庸置疑,醫學信息學科共同體正因為有了共同的范式才能集中在相同的研究領域內,不受時間和空間的限制,進行交流和互動。因此在研究醫學信息學范式時,首先要明確醫學信息學共同體的概念。傳統的醫學信息學學科主要研究的是醫學信息學的對象、方法論、理論標準,而很少涉及醫學信息學的認識主體——醫學信息學共同體。醫學信息學共同體可理解為發展醫學信息學范式的主體,研究醫學信息學范式主體,擁護同一醫學信息學范式的主體。醫學信息學共同體由授受相應的醫學信息學教育背景和學科訓I練的學者構成,他們以發展醫學信息學為使命,具有共同的價值理念,遵循共同的學術規范和維護共同的學術尊嚴。醫學信息學科共同體通常遵循醫學信息學學科發展規律,致力于醫學信息學科學研究、教育教學、實踐,是醫學信息學學科的主體。醫學信息學共同體可以是相對穩定的正式組織形式,也可以是自由組合的非正式組織形式。前者具有相對穩定的組織機構、成員、規范和活動方式。如中國醫院管理學會下的病案管理委員會、醫學信息學會,全國33所開設醫學信息學相關專業(或方向)的院校教師組成的同事式組織、導師與學生組成的師徒式組織,以及其他醫學信息科研、實踐機構組成的固定團隊等。后者一般不具備嚴格意義上傳統固定的組織形式、規模和穩定人員構成等內容。如因課題立項而臨時組建的課題組形式,各地組織的擁有固定主題的學術研討會、學術論壇、博士論壇,同一學科領域或分支學科的共同愛好者等。從醫學信息學共同體發揮的作用來看,非正式組織形式的學科共同體不僅是學科建設與發展的生力軍,也是正式組織形式醫學信息學科共同體的補充力量。當他們的自身作用和地位日益得到社會及統治階層認可時,自組織形式隨時有可能轉化為有組織形式。
3.2世界觀
世界觀,又稱為宇宙觀,是哲學的樸素形態。由于醫學共同體所處的社會地位、觀察問題的角度不同形成不同的醫學信息學世界觀,這種觀點是共同體自身醫學信息學工作、學習和生活實踐的結果,往往是自發形成的,需要醫學信息學的相關研究者對其進行自覺地概括和總結并給予理論上的論證,才能成為指導學科發展的哲學。醫學信息學共同體的世界觀是形而上的部分,是共同體對整個醫學信息學學科,以及共同體與醫學信息學之間的總的看法和根本觀點,簡而言之即醫學信息學共同體對于醫學信息學這一學科的總體認識,對醫學信息學的共識,包括醫學信息學科共同體所共有的基本信念、價值取向、思維方式等,是本體論、認識論層面的承諾,以及對自身在醫學信息學學科中的地位和作用的看法。醫學信息學共同體的世界觀可作為指導思想,指導醫學信息學共同體開展醫學信息學研究。醫學信息的世界觀往往決定著一個學科的自身定位和發展方向,表現在醫學信息學范式研究中則是要解決“如何看待醫學信息學專業研究對象”的問題。當認為醫學信息體現為一種歷史記錄屬性時,要維護的是學科歷史有機聯系;當認為醫學信息體現為一種知識屬性時,要實現的是學科最大效益。
3.3方法論
醫學信息學方法論是醫學信息學共同體在醫學信息學學習、實踐和研究中所自覺沿襲的一般方法。醫學信息學方法論是以解決醫學信息學中的問題為目標的一種體系或系統,通常涉及問題分析、任務工具和方法技巧等方面的論述。方法論體現在世界觀、自然觀、社會歷史觀、倫理觀、審美觀、科學觀之中,可以是由模式、方式、方法、手段等組成的經驗研究成果、案例和實用技術方法。醫學信息學方法論會對一系列具體的方法進行分析研究、系統總結并最終提出較為一般性的原則。醫學信息學學科的發展范式按照庫恩的科學范式為一般原則,即從前科學——常規科學——反常與危機——科學革命——新的常規科學為醫學信息學的學科發展線索,并利用歷史主義方法構建醫學信息學范式理論;在經驗層面,方法論是理論適用的方式,如在病案科整理病歷資料時,利用來源原則與事由原則進行歸檔管理;在醫學信息學安全和實用技術中則是一些純事實性和操作性方法,如利用原型法指導醫院進行信息系統開發建設。醫學信息學方法論是用以指導醫學信息學進行學術研究和實踐活動的路徑與綱領,解決的是“醫學信息學如何從事專業學術活動”的問題。如研究方法中的歷史主義研究方法、實證主義方法、論證方法、比較方法和調查研究方法等。
3.4理論成果
醫學信息學理論成果是指對醫學信息學范式形成并起著決定作用的共有醫學信息學理論。理論需要尋求解釋,而范式則提供了尋找解釋的方法。醫學信息學理論在成為共有認識之后可以上升到范式層面,達到范式層面的理論成果同一般的理論成果有聯系,也有區別。聯系在于,范式層面的理論來自于一般理論而又高于一般理論,它是醫學信息學共有的概論、命題及其推理。概念是思維的基本單位,是反映事物本質屬性的思維形式。作為醫學信息學理論邏輯出發點的概念是基本概念。共有概念是對醫學信息學學科共有基本元素的約定,而這些概念必須是以醫學信息學學科的本源概念的面貌出現。如“病歷”、“醫囑”和“病案”。命題是表明判斷結果的陳述語句,有真假意義的語句才是命題。如病案的本質屬性是原始醫療記錄性——這是對病案本質屬性的肯定判斷,是一個可以做真假檢驗的語句。共有命題是指醫學信息學學科理論中類似自然科學中定理、定律性質的命題。推理是指一判斷借以另一判斷推出的思維功能。共有推理是由共有命題中引申而來的。如從病案的原始性可能推理出病案具有憑證性。雖然范式層面的理論已經得到充分的論證,成為共同體內部約定俗成的公理,但是醫學信息學共同體不會因為具體理論的不完善而影響范式共有理論的存在,對于共有理論,也不會因為研究主體的不同闡釋而影響其范式指導作用。雖然處于同一學科共同體的成員往往引用同樣的理論成果,得出類似的理論觀點,醫學信息學共同體能夠同意確認一個范式,但不會同意對范式的完整詮釋或合理化。缺乏標準詮釋或不能得出一致同意的規則并不會阻止范式指導研究。
3.5范例
中醫藥學強調整體功能,用陰陽五行學說描述疾病性質及人體病理;視邪正交爭、陰陽失調為主要的疾病觀;形神合一為主流的健康觀;診斷利用四診合參;貫穿治病求本、辨證論治、防重于治等理念。而西醫則強調局部微觀分析,內容涉及解剖、生理、病理、衛生、藥物等;主張重視實驗、疾病局部定位思想;研究對象為分子、基因、蛋白、亞細胞、細胞、組織、器官、個體、公共衛生等。不論是中醫學還是西醫學,從二者現有的思維方式的發展趨勢來看,均是走向現代系統論、信息論、控制論的思維,故可引入“三論”,用科學的方法論指導中醫藥信息學學科發展[1]。
2從概念比較
中醫藥信息學是基于動態現象運動規律理論,遵循整體準則和動態準則,運用計算機與網絡技術研究中醫藥學領域信息現象和信息規律,對中醫藥信息進行表示、管理、分析、模擬和傳播,以實現中醫藥信息的獲取、轉化與共享,提示中醫藥信息的實質與內在聯系的一門科學[2]。醫學信息學是探討生物學、醫學或者更廣義健康數據的采集、存儲、交互和展現過程的科學,探討如何利用信息科技來優化這些過程的科學,以及探討如何利用這些數據實現信息和知識層次各種應用的科學[3]。
2.1研究對象不同中醫藥信息學以中醫藥信息為研究對象,強調以“人”為中心,包括健康的、疾病的及其相互轉換的,并且是在時間、空間維度及背景方面的綜合多維信息;醫學信息學是以生物學的、醫學的或者更廣義的健康數據為研究對象,強調以“病”為中心,主要針對實驗室疾病數據的防病抗病信息。
2.2研究內容不同中醫藥信息學以中醫藥領域信息動態現象運動規律為研究內容;醫學信息學是以生物學相關領域的信息采集、存儲、交互、展現及優化,實現信息和知識層次的各種應用為研究內容。中醫藥領域信息強調動態的天地人三才一體的整體觀,說明中醫藥領域的信息主要反映人與自然、社會、人文及其相互關系的人體整體動態功能變化及其規律,所以中醫藥信息學與醫學信息學研究內容有著根本的不同。
2.3研究方法不同中醫藥信息學與醫學信息學研究對象、內容迥異,必然導致研究方法的不同。醫學信息學以信息科學方法論為研究方法,運用信息觀點分析和處理信息流程。中醫藥信息學也模仿和借鑒其研究方法,但中醫藥強調功能和整體準則,以中醫藥理論和經驗作為分析和處理人體生命過程中出現的問題,不側重人體解剖結構及其運動形態的改變。所以,在研究方法上需結合自身特點應用醫學信息學方法并予以升華。如研究時需要中醫藥領域專業知識平衡語義關系存在用自然語言描述時的多義性與用形式化語言描述的確定性之間的矛盾;需要領域專家對知識的準確理解和內涵外延的精確把握;需要結合時間維度體現哲學、自然科學和社會文化背景的專業知識等。
3從知識框架比較
中醫藥信息學知識框架與醫學信息學知識框架可概括如下。兩圖中從左至右分為四列,左起第一列為中醫藥信息或醫學信息研究的對象,第二列為由基本信息轉化專業應用領域的相關學科,第三列為兩種信息學均由相關專業學科組成,第四列為兩種信息學的知識結構,說明兩者都是交叉學科,涉及到一些中間領域學科的知識門類。雖然二者構建模式相通,但研究內容不同,因此其研究領域及方向必然不同。
4研究方向比較
中醫藥信息學研究范疇可概括以下3個方面:一是基礎領域研究,如中醫藥信息論、中醫藥知識整合論、中醫藥信息學原理等;二是技術領域研究,如中醫藥信息的收集、存儲、處理及輸出等技術;三是應用領域研究,如中醫藥信息標準化研究包括信息表達標準化、信息交換標準化、信息處理及流程標準化等,中醫藥知識體系計算機表示與模擬研究包括功能診斷信息系統、整體數據處理系統、臨床決策支持系統等、醫院管理系統、電子病歷、圖像處理等、中藥質量控制、中藥藥效評價、中藥優化設計與研發、中藥知識發現與管理等,中醫藥數據分析與利用研究包括利用文本挖掘方法、關聯分析方法、信息計量方法等對中醫藥研究中獲得的數據與信息及科技文獻信息進行分析與利用研究等,中醫藥文獻信息資源研究包括中醫藥文獻信息資源的獲取、保護、存儲、處理、傳播等,中醫教育科研研究包括多媒體教育、網上教育、遠程教育等[2]。醫學信息學研究范疇可概括以下4個方面:一是原始健康數據,如影像、微陣列、生理數據等。涉及到的研究包括數據采集和集成,如實時的生理信號分析、語音識別、傳感器采集、條形碼掃描等;二是從原始健康數據中分析出來的有組織的綜合數據庫,如基因分類及其外在表現形態。涉及的研究主要是數據整合及數據處理,如數據倉庫、數據模型、語義網絡、本體論、數據儲存、提取、可視化及圖像處理等;三是從數據庫中抽象出來的知識庫,如詞表、術語學、本體庫、語義網等。涉及到的研究主要是推理及知識管理,如自然語言處理、信息抽取、數據挖掘、文本產生、統計處理、自動學習及知識表達、知識模型等;四是從知識庫中驗證出來的可直接應用的知識結晶和理論,如協議、臨床實用手冊、概論等,涉及到的研究主要是知識獲取及知識應用,如機器學習、文本解釋、知識工程、決策理論及診斷、治療、預防等。綜上,中西醫在對待臨床信息的觀念、臨床信息的放置位置、采集內容、采集方法,尤其是臨床信息模型以及信息分析方法等均有很大區別。目前中醫藥數據庫系統廣為應用,用中醫電子病歷來保存臨床中醫病案,用數據挖掘技術來整理及查詢電子病歷等。中醫醫院已經普遍吸納了現代醫學的診療方法,如電子病歷在受到中醫學自身發展規律的約束之外,也必然兼容有西醫學的許多內容,體現著中西醫的有機結合。當然還存在一些有待提升的空間,如中醫專家系統進入了低潮期,中醫的四診信息還未達到客觀化、規范化,對于人工智能的研究還在起步階段等。
5總結
衛生信息學基礎理論研究現狀
缺失特色理論一門學科的特色理論至少有兩方面的作用:一是代表本學科的科研水平與發展趨勢,成為學科發展的里程碑標志;二是對專業特有概念和特有規則從理論的角度進行系統解釋,使本學科區別于其他學科。筆者認為,現階段還沒有一套成熟的基礎理論能夠明確標志衛生信息學成熟與完善程度,即衛生信息學尚缺乏較為系統的特色理論。究其原因,一是衛生信息學現有特色理論研究有待進一步的深化研究,理論闡述本身系統性欠缺,不能充分凸現衛生信息學的存在特征和發展需要;二是,衛生信息學的特色研究之間的關聯研究不夠。衛生信息學由于其是一門新興邊緣學科,主要由信息學、圖書館學和檔案學在衛生領域的應用而產生,因此,生命周期理論、核心價值理論、價值理論、全宗理論和價值鑒定理論被看作為衛生信息學基礎理論。但是衛生信息學有其本身學科特色,也有其特有的概念,這些特有的概念引伸出與衛生信息工作相符合的衛生信息工作規則與規律。如果簡單地把信息學、圖書館學和檔案學的理論套用到衛生信息學中,將會妨礙對衛生信息學自身理論特色理論深層面的挖掘。簡單套用現象從信息學、圖書館學和檔案學中“套用”其原理和方法應用于衛生信息學學科是現階段該學科的主要研究方法。衛生信息學中涉及情報學、信息學、圖書館學和檔案學等學科,它們之間的界限日趨模糊,套用信息學、圖書館學和檔案學的原理和方法,并移植于衛生信息學,能夠為本學科開拓出許多新的研究領域。然而這種方法容易造成簡單套用信息學等相關學科理論,使得衛生信息學基礎理論產生生搬硬套、生吞活剝的套用現象,失去學科生命力。筆者認為,應在衛生信息學研究中靈活運用信息學、圖書館學和檔案學相關學科的概念、理論、公式,并使之與衛生信息學進行有機融合,使套用而來的理論根植于衛生信息學學科,使衛生信息學學科理論更精巧、理論理解更簡便,并在此基礎之上發展衛生信息學的特色基礎理論。理論與應用脫節對衛生信息學進行理論與應用的研究有利于適應高科技帶來的新現象、新方法、新經驗。衛生信息學既是來源于實踐,又反作用于實踐?,F階段衛生信息領域的現狀是基礎理論研究遠落后于應用實踐。如電子病歷,由于衛生信息領域的特殊要求,信息技術、標準、電子簽名技術、數據庫技術等運用與信息學學科是相一致的,但是其理論研究卻遠落后于信息學學科,進而造成電子病歷的理論研究與實際操作相互隔閡,阻礙了電子病歷信息資源的進一步開發與利用。另外,在衛生信息學基礎理論研究中,對新事物、新技術不敏感,人云亦云,甚至生搬硬套外國衛生信息學者的研究,或把外國衛生信息學者的某些言論作為金科玉律。如對電子病歷的研究,其中有些研究者并不精通信息技術、計算機技術、通信技術與網絡技術方面的知識,對國外文獻不能領會其意,因此其研究成果讓人不知所以[3]。無庸諱言,如果這種情形得以存續,衛生信息學基礎理論研究將很難深入。
衛生信息學基礎理論研究思考
明確學科意義,調整理論研究的思維方式研究衛生信息學基礎理論的前提是明確什么是衛生信息學學科。衛生信息學學科是一個門類繁多、層次分明、結構復雜的知識系統,在這個系統中,不僅包括自然科學、技術科學和社會科學方面的知識,而且也包括在這三大領域之間由于門類交叉、學科交叉、知識交叉、方法交叉所產生的知識。但是任何科學知識,都有自己發育的過程,都有自己的演化歷史。衛生信息學學科知識也經歷了四個演化階段:準科學、前科學、常規科學、后科學[4]。該學科現階段仍處于前科學階段,它是研究者從各個不同側面觀察和研究事物表現效應的結果,因而對同一衛生信息實踐現象有著多種不同的認識和看法。前科學階段的批評或反駁對方的批評,無論怎么激烈,誰也難以取代誰。前科學階段,科學存在的形式乃是“多重態”的科學,不可能形成排斥異己的所謂“科學共同體”。這個階段的衛生信息學研究對象的眾說紛紜,衛生信息學內容結構劃分方法的各異,衛生信息學理論研究現狀的不同評價,片面追求學科分支的邏輯增長,過量移植相關學科的理論與方法等等。這是大科學觀正確認識某一學科的思維方式,這種思維方式,是以解放思想超越自身有限經驗的局限為前提,以人類衛生信息活動的全部歷史和實踐為對象的開放型思維,這一開放型思維是開展衛生信息學理論研究的思想基礎。拓展研究范疇,探尋理論研究生長點探尋衛生信息學學科新的知識生長點是面對新的信息環境研究衛生信息學基礎的重要課題,不研究這些新課題,衛生信息學基礎理論就沒有生命力,衛生信息學學科也就可能萎縮。研究衛生信息學基礎理論必須掌握衛生信息學學科堅實、寬廣的基礎理論和系統深入的專業知識,必須掌握與本學科研究領域有關的相關學科的理論知識和先進的技術方法,只有如此才能創新性研究衛生信息學基礎理論。衛生信息學基礎理論的研究范疇,始終處于不斷更新和拓展的過程中,沒有更新就沒有發展,沒有局部的拓展就沒有全局的進步。在這方面,既不可墨守陳規,也不可人為地設置和障礙。不能只強求“同”,而不謀求“和”。應更加注重學科和學者的多樣化,更加關注學科的融合,探求衛生信息學基礎理論多元發展模式[5]。衛生信息學研究不能僅從病案、醫院等實體來進行研究,而是要順應跨學科研究的趨勢,將現代信息技術與衛生信息學理論結合起來開展前沿性課題的研究。探尋學科新的知識生長點與加強衛生信息學理論研究不是矛盾的,而是有助于衛生信息學理論的創新。信息環境新變化和衛生事業的變革為衛生信息學基礎理論研究創造了發展的良機。在理論發展的前科學階段,衛生信息學基礎理論研究更多地是研究學科對象、性質、內容、結構、相關學科、研究方法等方面;而當衛生信息學處于整體變革這一特殊階段時,基礎理論研究應關注變革中出現的新問題,總結變革中出現的新理念和新方法,推動衛生事業變革的進行;要審時度勢,注重學科新的框架建構,為新理論、新方法的發展提供可容納的空間;還要關注衛生信息學應用領域中的基礎理論問題,離開了應用領域中具有普遍意義問題的研究,衛生信息學基礎理論就將成為無源之水。理論與技術融合,促進學科發展優勢融合理論與技術,創造學科發展新優勢,是衛生信息學基礎理論研究的一個新趨向。當前現代信息技術突飛猛進,衛生信息產業快速發展。衛生信息學特有的分類、編目、索引、文摘、檢索語言等專業理論和方法仍然占有重要的地位,衛生信息學在虛擬知識空間中并沒有失去繼續存在和發展的機會。信息技術專家主要考慮怎樣提供一種智能化、自動化、高效率的信息存取機制,而衛生信息學專家更多地考慮衛生信息內容本身的合理邏輯性,尋求科學的知識建構、組織和控制的途徑。這兩者應該相互補充和支持,因為衛生信息學是技術敏感型的學科,在衛生信息學發展史上,信息技術總是滲透到其業務工作和技術設備之中,并武裝了衛生信息管理員,成為衛生信息管理領域中最重要的生產力因素。在衛生信息學研究中,應用性技術研究無疑占有相當重要的地位。衛生信息學理論和方法必須與現代信息技術緊密地結合起來,只有這樣才能創造交叉發展的學科優勢,并繼而使之轉化成為資源優勢,在虛擬知識空間中產生顯著的效益。理論與技術相融合的關鍵,在于正確處理基礎與應用的關系。重應用輕基礎乃至否定基礎研究的價值,這是當前衛生信息學研究中應該反對的一種思想傾向?;A理論和應用技術既相對獨立而又不可分割,應用技術的發展與完善是以相應的理論和方法為條件的;沒有基礎理論的指導,便沒有應用技術的發展,也無法解決衛生信息實踐所提出的現實問題。