時間:2023-01-24 23:04:56
序論:在您撰寫生物信息學論文時,參考他人的優秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發您的創作熱情,引導您走向新的創作高度。
[論文摘要]生物信息學是80年代以來新興的一門邊緣學科,信息在其中具有廣闊的前景。伴隨著人類基因組計劃的勝利完成與生物信息學的發展有著密不可分的聯系,生物信息學的發展為生命科學的發展為生命科學的研究帶來了諸多的便利,對此作了簡單的分析。
一、生物信息學的產生
21世紀是生命科學的世紀,伴隨著人類基因組計劃的勝利完成,與此同時,諸如大腸桿菌、結核桿菌、啤酒酵母、線蟲、果蠅、小鼠、擬南芥、水稻、玉米等等其它一些模式生物的基因組計劃也都相繼完成或正在順利進行。人類基因組以及其它模式生物基因組計劃的全面實施,使分子生物數據以爆炸性速度增長。在計算機科學領域,按照摩爾定律飛速前進的計算機硬件,以及逐步受到各國政府重視的信息高速公路計劃的實施,為生物信息資源的研究和應用帶來了福音。及時、充分、有效地利用網絡上不斷增長的生物信息數據庫資源,已經成為生命科學和生物技術研究開發的必要手段,從而誕生了生物信息學。
二、生物信息學研究內容
(一)序列比對
比較兩個或兩個以上符號序列的相似性或不相似性。序列比對是生物信息學的基礎。兩個序列的比對現在已有較成熟的動態規劃算法,以及在此基礎上編寫的比對軟件包BALST和FASTA,可以免費下載使用。這些軟件在數據庫查詢和搜索中有重要的應用。有時兩個序列總體并不很相似,但某些局部片斷相似性很高。Smith-Waterman算法是解決局部比對的好算法,缺點是速度較慢。兩個以上序列的多重序列比對目前還缺乏快速而又十分有效的算法。
(二)結構比對
比較兩個或兩個以上蛋白質分子空間結構的相似性或不相似性。
(三)蛋白質結構預測
從方法上來看有演繹法和歸納法兩種途徑。前者主要是從一些基本原理或假設出發來預測和研究蛋白質的結構和折疊過程。分子力學和分子動力學屬這一范疇。后者主要是從觀察和總結已知結構的蛋白質結構規律出發來預測未知蛋白質的結構。同源模建和指認(Threading)方法屬于這一范疇。雖然經過30余年的努力,蛋白結構預測研究現狀遠遠不能滿足實際需要。
(四)計算機輔助基因識別
給定基因組序列后,正確識別基因的范圍和在基因組序列中的精確位置.這是最重要的課題之一,而且越來越重要。經過20余年的努力,提出了數十種算法,有十種左右重要的算法和相應軟件上網提供免費服務。原核生物計算機輔助基因識別相對容易些,結果好一些。從具有較多內含子的真核生物基因組序列中正確識別出起始密碼子、剪切位點和終止密碼子,是個相當困難的問題,研究現狀不能令人滿意,仍有大量的工作要做。
(五)非編碼區分析和DNA語言研究
在人類基因組中,編碼部分進展總序列的3-5%,其它通常稱為“垃圾”DNA,其實一點也不是垃圾,只是我們暫時還不知道其重要的功能。分析非編碼區DNA序列需要大膽的想象和嶄新的研究思路和方法。DNA序列作為一種遺傳語言,不僅體現在編碼序列之中,而且隱含在非編碼序列之中。
三、生物信息學的新技術
(一)Lipshutz(Affymetrix,Santaclara,CA,USA)
描述了一種利用DNA探針陣列進行基因組研究的方法,其原理是通過更有效有作圖、表達檢測和多態性篩選方法,可以實現對人類基因組的測序。光介導的化學合成法被應用于制造小型化的高密度寡核苷酸探針的陣列,這種通過軟件包件設計的寡核苷酸探針陣列可用于多態性篩查、基因分型和表達檢測。然后這些陣列就可以直接用于并行DNA雜交分析,以獲得序列、表達和基因分型信息。Milosavljevic(CuraGen,Branford,CT,USA)介紹了一種新的基于專用定量表達分析方法的基因表達檢測系統,以及一種發現基因的系統GeneScape。為了有效地抽樣表達,特意制作片段模式以了解特定基因的子序列的發生和冗余程度。他在酵母差異基因表達的大規模研究中對該技術的性能進行了驗證,并論述了技術在基因的表達、生物學功能以及疾病的基礎研究中的應用。(二)基因的功能分析
Overton(UniversityofPennsylvaniaSchoolofMedicine,Philadelphia,PA,USA)論述了人類基因組計劃的下一階段的任務基因組水平的基因功能分析。這一階段產生的數據的分析、管理和可視性將毫無疑問地比第一階段更為復雜。他介紹了一種用于脊椎動物造血系統紅系發生的功能分析的原型系統E-poDB,它包括了用于集成數據資源的Kleisli系統和建立internet或intranet上視覺化工具的bioWidget圖形用戶界面。EpoDB有可能指導實驗人員發現不可能用傳統實驗方法得到的紅系發育的新的藥物靶,制藥業所感興趣的是全新的藥物靶,EpoDB提供了這樣一個機會,這可能是它最令人激動的地方。
Babbitt(UniversityofCalifornia,SanFrancisco,CA,USA)討論了通過數據庫搜索來識別遠緣蛋白質的方法。對蛋白質超家族的結構和功能的相互依賴性的理解,要求了解自然所塑造的一個特定結構模板的隱含限制。蛋白質結構之間的最有趣的關系經常在分歧的序列中得以表現,因而區分得分低(low-scoring)但生物學關系顯著的序列與得分高而生物學關系較不顯著的序列是重要的。Babbit證明了通過使用BLAST檢索,可以在數據庫搜索所得的低得分區識別遠緣關系(distantrelationship)。Levitt(Stanforduniveersity,PaloAlto,CA,USA)討論了蛋白質結構預測和一種僅從序列數據對功能自動模建的方法?;蚬δ苋Q于基因編碼的蛋白質的三級結構,但數據庫中蛋白質序列的數目每18個月翻一番。為了確定這些序列的功能,結構必須確定。同源模建和從頭折疊(abinitiofolding)方法是兩種現有的互為補充的蛋白質結構預測方法;同源模建是通過片段匹配(segmentmatching)來完成的,計算機程棄SegMod就是基于同源模建方法的。
(三)新的數據工具
Letovsky(JohnshopkinsUniversity,Baltimore,MD,USA)介紹了GDB數據庫,它由每條人類染色體的許多不同圖譜組成,包括細胞遺傳學、遺傳學、放射雜交和序列標簽位點(STS)的內容,以及由不同研究者用同種方法得到的圖譜。就位置查詢而言,如果不論其類型(type)和來源(source),或者是否它們正好包含用以批定感興趣的區域的標志(markers),能夠搜索所有圖譜是有用的。為此目的,該數據庫使用了一種公用坐標系統(commoncoordinatesystem)來排列這些圖譜。數據庫還提供了一張高分辨率的和與其他圖譜共享許多標志的圖譜作為標準。共享標志的標之間的對應性容許同等于所有其它圖譜的標準圖譜的分配。
Candlin(PEappliedBiosystems,FosterCity,CA,USA)介紹了一種新的存儲直接來自ABⅠPrismdNA測序儀的數據的關系數據庫系統BioLIMS。該系統可以與其它測序儀的數據集成,并可方便地與其它軟件包自動調用,為測序儀與序列數據的集成提供了一種開放的、可擴展的生物信息學平臺。
參考文獻:
一、正在出現的技術
Klingler(Lncytepharmaceuticals,PaloAlto,CA,USA)強調基因組學正推動制藥業進入信息時代。隨著不斷增加的序列、表達和作圖數據的產生,描述和開發這些數據的信息工具變得對實現基因組研究的任務至關重要。他談到了Incytepharmaceuticals對大規模基因組數據和生物信息學的貢獻。
Lipshutz(Affymetrix,Santaclara,CA,USA)描述了一種利用DNA探針陣列進行基因組研究的方法,其原理是通過更有效有作圖、表達檢測和多態性篩選方法,可以實現對人類基因組的測序。光介導的化學合成法被應用于制造小型化的高密度寡核苷酸探針的陣列,這種通過軟件包件設計的寡核苷酸探針陣列可用于多態性篩查、基因分型和表達檢測。然后這些陣列就可以直接用于并行DNA雜交分析,以獲得序列、表達和基因分型信息。Milosavljevic(CuraGen,Branford,CT,USA)介紹了一種新的基于專用定量表達分析方法的基因表達檢測系統,以及一種發現基因的系統GeneScape。為了有效地抽樣表達,特意制作片段模式以了解特定基因的子序列的發生和冗余程度。他在酵母差異基因表達的大規模研究中對該技術的性能進行了驗證,并論述了技術在基因的表達、生物學功能以及疾病的基礎研究中的應用。
二、基因的功能分析
Overton(UniversityofPennsylvaniaSchoolofMedicine,Philadelphia,PA,USA)論述了人類基因組計劃的下一階段的任務——基因組水平的基因功能分析。這一階段產生的數據的分析、管理和可視性將毫無疑問地比第一階段更為復雜。他介紹了一種用于脊椎動物造血系統紅系發生的功能分析的原型系統E-poDB,它包括了用于集成數據資源的Kleisli系統和建立internet或intranet上視覺化工具的bioWidget圖形用戶界面。EpoDB有可能指導實驗人員發現不可能用傳統實驗方法得到的紅系發育的新的藥物靶,制藥業所感興趣的是全新的藥物靶,EpoDB提供了這樣一個機會,這可能是它最令人激動的地方。
Sali(Rockefelleruniversity,NewYork,NY,USA)討論了同源蛋白質結構模建。比較蛋白質模建(comparativeproteinmodeling)也稱為同源模建(homologymodeling),即利用實驗確定的蛋白質結構為模式(模型)來預測另一種具有相似氨基酸序列的蛋白質(靶)的構象。此方法現在已經具有了足夠的精確性,并且被認為效果良好,因為蛋白質序列的一個微小變化通常僅僅導致其三維結構的細微改變。
Babbitt(UniversityofCalifornia,SanFrancisco,CA,USA)討論了通過數據庫搜索來識別遠緣蛋白質的方法。對蛋白質超家族的結構和功能的相互依賴性的理解,要求了解自然所塑造的一個特定結構模板的隱含限制。蛋白質結構之間的最有趣的關系經常在分歧的序列中得以表現,因而區分得分低(low-scoring)但生物學關系顯著的序列與得分高而生物學關系較不顯著的序列是重要的。Babbit證明了通過使用BLAST檢索,可以在數據庫搜索所得的低得分區識別遠緣關系(distantrelationship)。Levitt(Stanforduniveersity,PaloAlto,CA,USA)討論了蛋白質結構預測和一種僅從序列數據對功能自動模建的方法?;蚬δ苋Q于基因編碼的蛋白質的三級結構,但數據庫中蛋白質序列的數目每18個月翻一番。為了確定這些序列的功能,結構必須確定。同源模建和從頭折疊(abinitiofolding)方法是兩種現有的互為補充的蛋白質結構預測方法;同源模建是通過片段匹配(segmentmatching)來完成的,計算機程棄SegMod就是基于同源模建方法的。
三、新的數據工具
Letovsky(JohnshopkinsUniversity,Baltimore,MD,USA)介紹了GDB數據庫,它由每條人類染色體的許多不同圖譜組成,包括細胞遺傳學、遺傳學、放射雜交和序列標簽位點(STS)的內容,以及由不同研究者用同種方法得到的圖譜。就位置查詢而言,如果不論其類型(type)和來源(source),或者是否它們正好包含用以批定感興趣的區域的標志(markers),能夠搜索所有圖譜是有用的。為此目的,該數據庫使用了一種公用坐標系統(commoncoordinatesystem)來排列這些圖譜。數據庫還提供了一張高分辨率的和與其他圖譜共享許多標志的圖譜作為標準。共享標志的標之間的對應性容許同等于所有其它圖譜的標準圖譜的分配。
Markowitz(LawrenceberkeleyLaboratory,Berkeley,CA,USA)討論了分布式數據庫與局部管理的關系,以及用基于工具的方法開發分子生物學數據庫(MDBs)的問題。許多方案當前正在促進搜索多種不同來源MDBs的數據,包括建立數據倉庫;這要求對各種MDBs的組合有一種全局觀,并從成員MDBs中裝填數據入中心數據庫。這些方案的主要問題是開發整體視圖(globalviews),構建巨大的數據倉庫并使集成的數據庫與不斷發展中的成員MDBs同步化的復雜性。Markowitz還討論了對象協議模型(objectprotocolmodel,OPM),并介紹了支持以下用途的工具:建立用于文本文件或者關系MDBs的OPM視圖;將MDBs作成一個數據庫目錄,提供MDB名稱、定位、主題、獲取信息和MDB間鏈接等信息;說明、處理和解釋多數據庫查詢。Karp(SRIinternational,MenloPark,CA,USA)解釋了Ocelot,一種能滿足管理生物學信息需求的面向對象知識陳述系統(一種面向對象系統的人工智能版)。Ocelot支持略圖展開(schemaevolution)并采用一種新的最優化并行控制機制(同時進行多項訪問數據的過程),其略圖驅動圖形編輯器提供了交互式瀏覽和編輯功能,其注釋系統支持數據庫開發者之間的結構通訊。
Riley(MarinebiologicalLaboratory,WoodsHole,MA,USA)在討論大腸桿菌蛋白質的功能同時,特別提到了GPEC數據庫,它包括了由實驗確定的所有E.coli基因的功能的信息。該數據庫中最大比例的蛋白質是酶,其次則為轉運和調控蛋白。
Candlin(PEappliedBiosystems,FosterCity,CA,USA)介紹了一種新的存儲直接來自ABⅠPrismdNA測序儀的數據的關系數據庫系統BioLIMS。該系統可以與其它測序儀的數據集成,并可方便地與其它軟件包自動調用,為測序儀與序列數據的集成提供了一種開放的、可擴展的生物信息學平臺。
Glynais(NetGenics,Cleveland,OH,USA)認為生物信息學中最關鍵的問題之一是軟件工具和數據庫缺乏靈活性。但是,軟件技術的發展已得到了其它領域如金融業和制造業的發展經驗的借鑒,可以使來自不同軟件商的運行于各種硬件系統的軟件共同工作。這種系統的國際標準是CORBA,一種由250多個主要軟件和硬件公司共同合作開發的軟件體系。聯合使用CORBA和Java可以開發各種通過一個公用用戶界面訪問任何種類的數據或軟件工具的網絡應用軟件,也包括生物信息學應用軟件。Overton不同意Glynias的這種想法,他強調說CORBA僅對軟件集成有用,不兼容的數據庫軟件可能是計算生物學所面臨的最困難問題,一些制藥公司和數據庫倉庫最近資助了一項用OCRBA鏈接不同的數據庫的計劃[2,3]。
四、制藥先導的發現
Burgess(Sturcturalbioinformatics,SanDiego,CA,USA)討論了填補基因組學和藥物設計之間鴻溝的蛋白質結構中的計算問題。在缺乏主要疾病基因或藥物靶的精確描述數據的情況下,藥物設計者們不得不采用大規模表達蛋白質篩選方法;而結構生物信息學則采用一種更為實用有效的計算方法直接從序列數據中確定靶蛋白質的活性位點的精細結構特征,它利用一種集成專家系統從現實的或虛擬的化學文庫中進行迅速的計算篩選,可以達到一個很大的規模。
Elliston(Genelogic,Columbia,MD,USA)討論了治療藥物開發中發現新的分子靶的過程,著重討論了基因發現方法。他認為,隨著日益臨近的人類基因組測序的完成,幾乎全部基因的特征將在序列水平得到揭示。但是,對基因的認識將有賴于更多的信息而不僅僅是序列,需要考慮的第一類信息是轉錄表達水平信息,而Genelogic公司的GeneExpress就是一個由mRNA表達譜、轉錄因子位點、新基因和表達序列標簽組成的數據庫。
Liebman(Vysis,Downessgrove,IL,USA)介紹了Vysis公司開發的計算和實驗方法,這些主法不僅用于管理序列數據,而且被用于以下用途:分析臨床數據庫和自然—突變數據庫;開發新的算法以建立功能同源性(區別于序列同源性)模擬生物學通路以進行風險評估;藥物設計的靶評估;聯系復雜的通路特性以便識別副作用;開發疾病發展的定性模型并解釋臨床后果。
隨著發現的新基因的日益增多,這個問題顯得格外重要:基因的功能是什么?Escobedo(Chirontechnologies,Emeryville,CA,USA)提出了這個問題的一種方法:將分泌蛋白質的基因的功能克隆與篩選這些克隆(可能的藥物靶)結合起來。在這種方法中,在微粒體cDNA文庫池中進行體外翻譯避免了勞動密集的克隆、表達和純化步聚,對文庫池中的翻譯產物在細胞水平進行篩選,測試其在細胞增殖和分化中的作用。例如,在用這種方法識別的111個克隆中,56個屬于已知的分泌蛋白質,25個為膜相關蛋白,另外30個功能未知,可能是新的蛋白質。一種相似的方法在轉移到小鼠模型系統中的基因傳導載體中構建分泌蛋白質的cDNA文庫來克隆特定的功能基因。
Ffuchs(Glaxowellcome,ResearchTrianglePark,NC,USA)討論了生物信息學更為廣義的影響:它不僅影響到新藥物靶基的發現,還對改善藥物開發的臨床前期和臨床期的現狀極具重要性。眾所周知,涉汲數以千計病人的臨床試驗(可能是藥物開發最為花錢的部分)的設計不論多么仔細,也不能為正確的藥物選擇正確的病人。而在基因組水平劃分病人群體的方法可以大大改善發現新藥的效率。Fuchs介紹了一種將病人的基因型和表型標志結合起來以改善臨床前期和臨床期藥物開發過程的系統GeneticinformationSystem.他強調將遺傳學和生物信息學數據同化學、生物化學、藥理學和醫學數據連接起來的集成信息管理和分析方法是極其重要的。
Green(HumanGenomeSciences,Rockville,MD,USA)介紹了他的測序工作中采用的數據管理工具?;贓ST的測序方法所面臨的挑戰是,在對幾百個cDNA克復測序之后,產生的數據堆積如山。由于大多數人類基因都是用這種方法發現并在么有數據庫中分類編排的,面臨的識別開放讀框、重疊序列的重疊圖譜、組織特異表達和低豐度mRNA基因的任務是令人生畏的。HumangenomeSciences公司開發了一些可用戶化數據庫工具,在同一個數據庫中可包括以下功能:WWW上訪問和檢索數據,序列拼接,臨視潛在藥物靶基因的研究進展等。這些能夠管理多項任務——從注釋基因序列到成功開發基因產物進入藥物發現的流程——的軟件工具,極其可望從一種基于基因組知識的藥物發現方法中得到新的藥物靶。
Summer-Smith(Base4bioinformatics,Mississauga,Ontario,Canada)描述了一種相關的策略。藥物發現階段中所要求的軟件工具的任務是多樣化的,要能注釋基因,并闡明它的生理和病理功能及其商業潛質。對這樣多種來源的信息的集成與分析,在派生的、項目取向的數據庫(project-specificdatabase,PSD)中可以很好完成。由于項目貫穿于發現到開發全過程,其間又不斷加入背景的成員,PSD在項目的管理與發展中成為一種關鍵性的資源。
按照Smith(Bostonuniversity,Boston,MA,USA)的觀點[2],我們并不需要更快捷的計算機或更多的計算機科學家,而是需要更的生物學家和生物化學家來解釋序列的功能。這對有些軟件或硬件專家來說是個打擊,但生物學系統的復雜性是令人生畏的,并且對基因功能的認識可能需要生物學方法和計算方法的結合。探索基因的功能很可能要花費生物學家們數十年的時間,本次會議表明沒有任何單一的方法可以得出一個答案;但是,將計算生物學同大規模篩先結合起來識別一種化學靶物(hit)是一種產生化學工具來探索基因功能的方法,這些化學工具接下來就可以用作理解基因功能的“探針”。這種方法在Butt(GeneTranscriptionTechnologies,Philadelphia,PA,USA)的描述中,既是一種檢查基因功能的簡單方法,也是為潛在的藥物靶發現化學先導物的簡單方法,他描述了一種可以在酵母中重建人類基因功能的酵母大規模篩選系統。在此系統中,可以迅捷地在一個化學文庫中發現配基。這種技術的重要特征是它不僅僅是發現一種藥物靶的配基的篩板(screen),相反,由于該系統的高速度,它也是發現先導靶基因的一種篩板。過去,世界上的制藥公司通常在某一時間內僅能對有限數目(約20多個)的藥物靶基因進行工作,鑒于此,我們需要根本不同的方法如基因組學來打開通向“新”生物學的通路。由于機器人和合成化學的進步,藥物發現中最關鍵的問題不再是得到一種先導化合物(leadcompound),而是得到導向靶基因。此次會議為從計算和實驗方法中發展出的新生物學邁出很好的一步。
參考文獻
1LimHA,BatttR.TIBTECH,1998;16(3)):104
關鍵詞:推薦系統;生物信息學
推薦系統(RecommenderSystem)[1]是個性化信息服務的主要技術之一,它實現的是“信息找人,按需服務”;通過對用戶信息需要、興趣愛好和訪問歷史等的收集分析,建立用戶模型,并將用戶模型應用于網上信息的過濾和排序,從而為用戶提供感興趣的資源和信息。生物信息學(Bioinformatics)[2,3]是由生物學、應用數學和計算機科學相互交叉所形成的一門新型學科;其實質是利用信息科學的方法和技術來解決生物學問題。20世紀末生物信息學迅速發展,在信息的數量和質量上都極大地豐富了生物科學的數據資源,而數據資源的急劇膨脹需要尋求一種科學而有力的工具來組織它們,基于生物信息學的二次數據庫[4]能比較好地規范生物數據的分類與組織,但是用戶無法從大量的生物數據中尋求自己感興趣的部分(著名的生物信息學網站NCBI(美國國立生物技術信息中心),僅僅是小孢子蟲(Microsporidia)的DNA序列就達3399種),因此在生物二次數據庫上建立個性化推薦系統,能使用戶快速找到自己感興趣的生物信息。特別是在當前生物信息數據量急劇增長的情況下,生物信息學推薦系統將發揮強大的優勢。
1推薦系統的工作流程
應用在不同領域的推薦系統,其體系結構也不完全相同。一般而言,推薦系統的工作流程[5]如圖1所示。
(1)信息獲取。推薦系統工作的基礎是用戶信息。用戶信息包括用戶輸入的關鍵詞、項目的有關屬性、用戶對項目的文本評價或等級評價及用戶的行為特征等,所有這些信息均可以作為形成推薦的依據。信息獲取有兩種類型[6],即顯式獲取(Explicit)和隱式獲取(Implicit),由于用戶的很多行為都能暗示用戶的喜好,因此隱式獲取信息的準確性比顯式高一些。
(2)信息處理。信息獲取階段所獲得的用戶信息,一般根據推薦技術的不同對信息進行相應的處理。用戶信息的存儲格式中用得最多的是基于數值的矩陣格式,最常用的是用m×n維的用戶—項目矩陣R來表示,矩陣中的每個元素Rij=第i個用戶對第j個項目的評價,可以當做數值處理,矩陣R被稱為用戶—項目矩陣。
(3)個性化推薦。根據形成推薦的方法的不同可以分為三種,即基于規則的系統、基于內容過濾的系統和協同過濾系統?;谝巹t的推薦系統和基于內容過濾的推薦系統均只能為用戶推薦過去喜歡的項目和相似的項目,并不能推薦用戶潛在感興趣的項目。而協同過濾系統能推薦出用戶近鄰所喜歡的項目,通過用戶與近鄰之間的“交流”,發現用戶潛在的興趣。因此本文所用的算法是基于協同過濾的推薦算法。
(4)推薦結果。顯示的任務是把推薦算法生成的推薦顯示給用戶,完成對用戶的推薦。目前最常用的推薦可視化方法是Top-N列表[7],按照從大到小順序把推薦分值最高的N個事物或者最權威的N條評價以列表的形式顯示給用戶。
2生物信息學推薦系統的設計
綜合各種推薦技術的性能與優缺點,本文構造的生物信息學推薦系統的總體結構如圖2所示。
生物信息學推薦系統實現的主要功能是在用戶登錄生物信息學網站時,所留下的登錄信息通過網站傳遞到推薦算法部分;推薦算法根據該用戶的用戶名從數據庫提取出推薦列表,并返回到網站的用戶界面;用戶訪問的記錄返回到數據庫,系統定時調用推薦算法,對數據庫中用戶訪問信息的數據進行分析計算,形成推薦列表。
本系統采用基于近鄰的協同過濾推薦算法,其結構可以進一步細化為如圖3所示。算法分為鄰居形成和推薦形成兩大部分,兩部分可以獨立進行。這是該推薦系統有別于其他系統的優勢之一。由于信息獲取后的用戶—項目矩陣維數較大,使得系統的可擴展性降低。本系統采用SVD矩陣降維方法,減少用戶—項目矩陣的維數,在計算用戶相似度時大大降低了運算的次數,提高了推薦算法的效率。
(1)信息獲取。用戶對項目的評價是基于用戶對某一個項目(為表示簡單,以下提及的項目均指網站上的生物物種)的點擊次數來衡量的。當一個用戶注冊并填寫好個人情況以后,系統會自動為該用戶創建一個“信息矩陣”,該矩陣保存了所有項目的ID號以及相應的用戶評價,保存的格式為:S+編號+用戶評價,S用于標記項目,每個項目編號及其評價都以“S”相隔開;編號是唯一的,占5位;用戶評價是用戶點擊該項目的次數,規定其范圍是0~100,系統設定當增加到100時不再變化。這樣做可防止形成矩陣時矩陣評價相差值過大而使推薦結果不準確。(2)信息處理。信息處理是將所有用戶的信息矩陣轉換為用戶—項目矩陣,使用戶信息矩陣數值化,假設系統中有M個用戶和N個項目,信息處理的目的就是創建一個M×N的矩陣R,R[I][J]代表用戶I對項目J的評價。
(3)矩陣處理。協同過濾技術的用戶—項目矩陣的數據表述方法所帶來的稀疏性嚴重制約了推薦效果,而且在系統較大的情況下,它既不能精確地產生推薦集,又忽視了數據之間潛在的關系,發現不了用戶潛在的興趣,而且龐大的矩陣增加了計算的復雜度,因此有必要對該矩陣的表述方式做優化,進行矩陣處理。維數簡化是一種較好的方法,本文提出的算法應用單值分解(SingularValueDecomposition,SVD)技術[8],對用戶—項目矩陣進行維數簡化。
(4)相似度計算。得到降維以后的用戶矩陣US,就可以尋找每個用戶的近鄰。近鄰的確定是通過兩個用戶的相似度來度量的。本文采用Pearson相關度因子[9]求相似度。(5)計算用戶鄰居。該方法有兩種[10],即基于中心的鄰居(Center-BasedNeighbor)和集合鄰居(AggregateNeighbor)。本系統采用了第一種方法,直接找出與用戶相似度最高的前N個用戶作為鄰居,鄰居個數N由系統設定,比如規定N=5。
(6)推薦形成。推薦形成的前提是把當前用戶的鄰居ID號及其與當前用戶的相似度保存到數據庫中,而在前面的工作中已找出各用戶的鄰居以及與用戶的相似度,推薦形成部分只需要對當前登錄用戶進行計算。推薦策略是:對當前用戶已經訪問過的項目不再進行推薦,推薦的范圍是用戶沒有訪問的項目,其目的是推薦用戶潛在感興趣的項目;考慮到系統的項目比較多,用戶交互項目的數量很大,所以只篩選出推薦度最大的N個項目,形成Top-N推薦集,設定N=5。
3生物信息學推薦系統的實現
生物信息學推薦系統的實現可以用圖4來表示。數據庫部分主要存儲用戶信息和項目信息,用SQLServer2000實現。
數據訪問層實現了與用戶交互必需的存儲過程以及觸發器,也使用SQLServer2000,主要完成以下功能:初始化新用戶信息矩陣;插入新項目時更新所有用戶的信息矩陣;用戶點擊項目時更新該用戶對項目的評價;刪除項目時更新所有用戶的信息矩陣。用戶訪問層主要涉及網頁與用戶的交互和調用數據訪問層的存儲過程,在這里不做詳細的介紹。
推薦算法完成整個個性化推薦的任務,用Java實現。(1)數據連接類DataCon。該類完成與SQLServer2000數據庫的連接,在連接之前必須要下載三個與SQLServer連接相關的包,即msutil.jar、msbase.jar和mssqlserver.jar。
(2)數據操作類DataControl。該類負責推薦算法與數據庫的數據交換,靜態成員Con調用DataCon.getcon()獲得數據庫連接,然后對數據庫進行各種操作。把所有方法編寫成靜態,便于推薦算法中不創建對象就可以直接調用。
(3)RecmmendSource與CurrentUserNeighbor。這兩個類作為FCRecommand類的內部類,RecmmendSource用于保存當前用戶的推薦列表,包括推薦項目號和推薦度;CurrentUserNeighbor用于保存鄰居信息,包括鄰居ID號、相似度及其訪問信息。
(4)協同過濾推薦算法FCRecommand。該類實現了整個推薦算法,主要分為鄰居形成方法FCArithmetic和推薦形成方法GenerateRecommend。
下面給出方法FCArithmetic的關鍵代碼:
Matrixuser_item=this.User_Item_Arry();//獲取用戶—項目矩陣
user_item=this.SVD_Calculate(user_item);//調用SVD降維方法
Vectorc_uservector=newVector();//當前用戶向量
Vectoro_uservector=newVector();//其他用戶向量
Vectorc_user_correlate_vector=newVector();
//當前用戶與其他用戶之間相似度向量
for(inti=0;ifor(intj=0;jc_uservector.addElement(user_item.get(i,j));
//1.獲得當前用戶向量
for(intk=0;ko_uservector.clear();
for(intl=0;lo_uservector.addElement(user_item.get(k,l));
//2.獲得其他用戶的向量
//3.計算當前用戶與其他用戶的相似度
usercorrelativity=this.Correlativity(c_uservector,o_uservector);
c_user_correlate_vector.addElement(usercorrelativity);
}
//4.根據當前用戶與其他用戶的相似度,計算其鄰居
this.FindUserNeighbor(i,c_user_correlate_vector);
}
根據鄰居形成方法FCArithmetic,可以得到每個用戶的鄰居。作為測試用例,圖6顯示用戶Jack與系統中一部分用戶的相似度,可以看出它與自己的相似度必定最高;并且它與用戶Sugx訪問了相同的項目,它們之間的相似度也為1,具有極高的相似度。
4結束語
在傳統推薦系統的基礎上,結合當前生物信息學網站的特點,提出一個基于生物信息平臺的推薦系統,解決了傳統生物信息網站平臺信息迷茫的缺點,為用戶推薦其感興趣物種的DNA或蛋白質序列。
優點在于協同過濾的推薦算法能發現用戶潛在的興趣,能促進生物學家之間的交流;推薦算法的鄰居形成與推薦形成兩部分可以單獨運行,減少了系統的開銷。進一步的工作是分析生物數據的特點及生物數據之間的關系,增加用戶和項目數量,更好地發揮推薦系統的優勢。
參考文獻:
[1]PAULR,HALRV.Recommendersystems[J].CommunicationsoftheACM,1997,40(3):56-58.
[2]陳新.生物信息學簡介[EB/OL].(2001).166.111.68.168/bioinfo/papers/Chen_Xin.pdf.
[3]林毅申,林丕源.基于WebServices的生物信息解決方案[J].計算機應用研究,2005,22(6):157-158,164.[4]邢仲璟,林丕源,林毅申.基于Bioperl的生物二次數據庫建立及應用[J].計算機系統應用,2004(11):58-60.
[5]AIRIAS,TAKAHISAA,HIROYAI,etal.Personalizationsystembasedondynamiclearning:InternationalSemanticWebConference[C].Sardinia:[s.n.],2002.
[6]BREESEJS,HECKERMAND,KADIEC.Empericalanalysisofpredictivealgorithmsforcollaborativefiltering:proceedingsoftheFourteenthConferenceonUniversityinArtificialIntelligence[C].Madison:WI,1998:43-52.
[7]SCHAFERJB,KONSTANJ,RIEDLJ.Recommendersystemsine-commerce:proceedingoftheACMConferenceonElectronicCommerce[C].Pittsburgh:PA,1999:158-166.
[8]PRYORMH.Theeffectsofsingularvaluedecompositiononcollaborativefiltering[EB/OL].(1998).cs.dartmouth.edu/reports/TR98-338.pdf.
關鍵詞:醫學檢驗;生物信息學;課程教學
近年來,生物信息學在各醫藥院校越來越受到重視,多所院校相繼在研究生教學中開設了生物信息學課程[1]。而對于醫學本科層次是否需要開設生物信息學課程這一問題,雖然目前各方面的觀點不一,但是已經有一些院校開始進行嘗試。目前醫學檢驗專業(五年制,畢業時授予醫學學士學位)已調整為醫學檢驗技術專業(四年制,畢業時授予理學學士學位),而生物信息學作為一門新課程,在醫學檢驗(技術)專業學生培養中的作用正日益受到關注,逐步被某些院校選擇作為必修課或者選修課。
一、開設課程的必要性
空前繁榮的生物醫學大數據的產出,及其蘊含的重大生命奧秘的揭示,將決定現代生命科技和醫藥產業研發的高度,決定人們對疾病的認識和掌控能力,也將對主導生物醫學大數據存儲、管理、注釋、分析全過程,解決生命密碼的關鍵手段———現代生物信息學技術的發展帶來前所未有的機遇和挑戰[2]。對于醫學專業學生而言,通過學習生物信息學,從而掌握利用各種網絡信息資源來檢索和獲取生物信息數據,并選擇和使用各種生物信息學軟件來分析數據。在當今大數據時代,這方面的知識和技能的培養對于醫學生今后從事醫學科研工作是非常重要的。因此,在醫學專業學生中開設生物信息學課程非常必要。我校從2010年開始將生物信息學設置為研究生教學的必修課;從2013年開始在醫學檢驗專業中開設生物信息學選修課,自2015年開始轉為醫學檢驗技術專業。在醫學檢驗技術專業中開設生物信息學課程,能夠為該專業學生的臨床和科研方面的素質積累提供必要的支持,更重要的是增強了在醫學和信息科學交叉領域解決問題的技能,其意義幾乎等同于在研究生教學中的設課意義。
二、教學內容的安排
醫學檢驗技術專業的教學任務非常緊張,幾乎將原來醫學檢驗專業前八個學期(最后兩個學期為實習階段)課程壓縮到六個學期來完成,學生學習壓力可想而知。我校為了減輕學生負擔,各課程的課時數都比醫學檢驗專業有所減少。但生物信息學并未改變,仍然為16學時。為了在較短的學時內實現教學效果的最大化,我們結合該專業學生的特點和需求,將授課內容分為理論課和實踐課兩部分,實踐課不占學時。理論課主要介紹基本的生物信息學理論、資源和數據的獲取、分析方法和工具的使用;實踐課則通過布置作業,課后上機操作來解決問題。理論課主要內容包括:生物信息學導論、DNA測序技術、序列的獲取、雙序列比對、多序列比對、蛋白質結構分析和預測共計六個專題。實踐課主要內容包括:cDNA及基因組參考序列的獲?。怀R娦蛄懈袷降尼屃x與轉換;雙序列比對(局部比對);多序列比對(全局比對);蛋白質綜合信息查詢;蛋白質基本性質、疏水區、亞細胞定位、信號肽、跨膜區、模體及結構域分析與二級結構預測;蛋白質三級結構預測。在理論課實施過程中,注重將與生物信息學相關的生命科學和醫學前沿的一些最新進展和最新成果引入理論知識講授中,讓學生在有限學時內能夠進一步認識生物信息學的內涵和課程的價值,追蹤前沿學科的動態,開拓視野。
三、教學方法的設計
生物信息學涉及多個學科領域,交叉性強,在較短的學時內學好這門課程的難度很大。學生的學習興趣與教學內容和手段關系密切,除了精心選擇教學內容外,教學方法上也有很多需要革新乃至創新的地方。在教學過程中,我們形成了頗具特色的教學經驗,由授課教師獨創的授課———實踐———演示(Teaching-Practicing-Showing,TPS)教學模式已應用于教學。TPS教學模式著力于以實際問題為引線,將理論授課與上機實踐有機地融為一體,逐步介紹生物數據分析的各項技能,并指導學生將其融會貫通以真正掌握相關的基本方法與常用工具。首先,在教學內容上引入具體實例來進行教學,比如講解生物信息數據庫(Gene、Nucleotide、UniProt、PDB等)時,通過給出檢索某個人類疾病基因數據的例子來學習數據庫的使用方法。課堂上教學實例的設計需要任課教師在備課時投入大量精力來完成,還需要教師具備多學科交叉的知識。教學實踐表明,與醫學相關的生物信息學分析實例可以讓學生更好地認識該課程的作用,大幅度提高學生的學習興趣和學習的主動性。此外,課堂教學手段也應該豐富多彩,多媒體教學中可以充分使用圖片、動畫等元素。其次,舉例分析時可以進行一定的現場演示,比如講解檢索Unigene數據庫時可以一邊上網演示一邊解釋說明。
四、考核方式的變革
生物信息學作為選修課,既要遵循學校相關的考試制度,也要通過對考試方式的變革來提高考試效果。我們將理論考核與學生的實踐能力考核聯系起來,結合學生課外實踐任務的完成情況和開卷考試成績進行綜合評定。在課程中安排一次課外實踐任務,要求每位學生獨立完成相關分析并提交書面分析報告,該部分占考核成績的20%。具體內容為自行選擇一個人類細胞外功能蛋白:1.利用ClustalX對各物種參考蛋白序列進行多序列比對(輸出PS格式結果);2.分析分子量、等電點、分子式、穩定性、親疏水性及亞細胞定位;3.預測二級結構并模擬三維結構。課程結束后進行開卷考試,內容包括基礎知識和綜合分析,盡量采取靈活的出題方式,并控制題量,該部分占考核成績的80%。近年來的教學實踐表明,這種綜合評定的方式能夠反映學生對該課程的掌握程度,體現學生利用生物信息學知識解決問題的能力。
五、展望
實踐表明,生物信息學課程教學能夠給學生提供所需要的生物信息學知識和技能,但是在教學內容安排、教學方法設計、教學手段使用和教學效果評價等諸多環節都需要進一步探討。在這個過程中,我們既需要吸收傳統教學模式中的優點和精髓,做到嚴謹和切合實際,又需要更新教學理念,突出醫學特色,大膽嘗試新的教學方法和手段,最終形成本課程別具一格的教學特色。
作者:倫永志 單位:大連大學
參考文獻
一、引言
隨著生物科學的發展,只有定性的結論已不能滿足實踐的需要,實現生物科學結論定量化是人們長期追求探索的目標;生物統計學是生物學科定量化的重要分析理論與方法,生物統計學是生物學科應具備的基本知識和素質,與生命活動有關的各種現象中普遍存在著隨機現象,大到森林陸地生態系統,小至分子水平,均受到許多隨機因素的影響,表現為各種各樣的隨機現象,而生物統計學正是從數量方面揭示大量隨機現象中存在的必然規律的學科。因此,生物統計學是一門在實踐中應用十分廣泛的工具學科,它是生命科學各專業的專業基礎課,對后續生命科學課程學習和生物科研有重要作用。
同時,生物統計作為數理統計在生本論文由整理提供物學領域的應用,是教學難度較大的一門課程。因此,在生物統計學精品課程建設過程中,針對各專業培養目標的定位,因材施教,更新教育理念,加強實踐訓練,在教學方法和教學手段上進行改革和大膽探索。
二、二十一世紀對生物統計學課程的重新定位
(一)新世紀對生物統計學課程提出的新要求。
二十世紀上半葉農業和遺傳統計學首先獲得了發展,在其基礎上發展起來的生物統計學、統計流行病學、隨機化臨床試驗學已經成為攻克人類疾病的一個里程碑。這在過去的半個世紀里顯著提高了人類的期望壽命。
21世紀人類基因組,基因芯片等實驗科學產生出的巨量數據,需要新工具來組織和提取重要信息。
將數據轉化為信息需要統計理論和實踐本論文由整理提供方面的洞察力、技術和訓練。
未來的生物統計學將會與信息技術密切結合,較少側重傳統數理統計,而會更多注意數據分析,尤其是大型數據庫的處理。生物統計學越來越不同于其它數學領域,計算機和信息科學工具至少和概率論一樣重要。
(二)生物統計學對大學生素質培養的作用。
生物統計學的一個重要特點就是通過樣本來推斷和估計總體,這樣得到的結論有很大的可靠性但有一定的錯誤率,這是統計分析的基本特點,因此在生物統計課程的學習中培養了一種新的思維方法———從不肯定性或概率的角度來思考問題和分析科學試驗的結果。
生物統計學是通過個別的試驗研究得出其一般性結論,屬于歸納推理的范疇。但其有別于簡單枚舉法和科學歸納法,是一種或然性歸納推理或者概率歸納推理。在生命科學的研究中絕大多數涉及到的是隨機事件,因此,生物統計學不僅是試驗設計與統計方法的教學,更重要的還是大學生思維方式的培養,這對提高大學生的素質很有必要。
生物統計學包括試驗設計和統計方法兩個有機聯系的組成部分。通過試驗設計的教學可提高大學生設計研究課題試驗方案的能力,使之明確課題的研究目的、試驗因素與水平以及試驗設計方法等方面的內容。通過統計方法的教學除讓學生弄清各種統計方法的內涵外,還需要使學生能夠正確地選擇最適合的統計方法,以揭示資料潛在的信息,達到研究的最終目的,從而提高大學生科學研究素質。
三、教學方法和教學手段的改革
(一)加強電子課件及網絡平臺本論文由整理提供建設。
生物統計學是應用概率論和數理統計原理研究生物界數量變化的學科,而概率統計的理論和思維方法對本科生來說有一定的難度,加之課程學時的減少(由原來的60-70學時,降到現在的40學時左右),如何深入淺出地引導學生入門,并使學生在了解概率統計思想的基礎上,掌握常用統計分析方法的應用及使用條件是課程的教學難點。為此,我們利用多媒體技術,制作了與教材配套的課件,通過在課堂上把抽象內容形象化與直觀化,收到了良好教學效果。建設了一個生物統計學教學網絡支撐平臺,現有課程簡介、教學大綱、師資力量、授課教案、電子版《生物統計學》教材、課程錄像、實習指導、在線測試題、參考文獻、其它教學資源等欄目,免費向全校師生開放。
(二)將多媒體教學優勢與學生的認知規律有機結合,用較少的學時得到良好的教學效果。
多媒體具有信息量大、形象化、直觀化的特點。
但是如果不能很好地將多媒體這些特點與學生的認知規律相結合,多媒體教學就可能會帶來一些弊端諸如:(1)內容多,幻燈片變換快,由照本宣科變為照屏宣科,為新的“滿堂灌”;(2)課件圖片多,內容以展示為主,缺乏啟發性;(3)教學內容常用滿屏的方式顯示(即所謂“死屏”),老師照著屏幕上的內容給學生講解,失去了傳統教學方法,老師邊講邊板書能給學生留下比較深刻印象的特點,缺乏吸引力。
而多媒體在教學中只能充當工具的角色,在教學過程中必須將多媒體信息量大、形象化、直觀化的特點與學生的認知規律緊密結合在一起。在制作課件時,采用啟發式教學方式,精煉教學內容,模仿傳統教學書寫板書的過程,根據教學內容的難易程度,采用逐字、逐句、逐段顯示教學內容的動畫方式。在課堂教學中,老師仍然保持傳統教學方法的教姿教態,在授課的過程中與學生保持互動,根據學生在課堂上接受知識的能力,掌握屏幕上顯示內容的速度,必要時輔以板書進行講解。這樣做既發揮了多媒體教學的特點,又充分照顧到學生的認知規律,在內容沒本論文由整理提供有縮減,學時減少近三分之一的情況下,仍然取得良好的教學效果。
(三)長期堅持教育教學方法及教學規律的研究。
生物統計學的理論基礎是概率論與數理統計,從這個層面上講,它有非常濃的數學味道,但是它又有別于概率論與數理統計,生物統計學更主要強調的是概率論及數理統計的思想和方法在解決生命科學中一些具體問題的應用。因此在教學過程中就存在一個“度”的把握問題,如果將概率論及數理統計的原理講得太多,一是學時不允許,二是學生難以消化,得不到好的教學效果;如果只注重方法的講解,學生知其然不知其所以然,就會誤入亂套公式的歧途。經過將教學的重點放在教學中引導學生重點掌握統計方法的功能與用途,方法與步驟,防止各類方法的誤用,淡化定理的證明與公式的推導。在教學內容的安排上采用“保干削枝”,即在學時減少很多的情況下,將一些次要的統計方法去掉,也要保證有足夠的學時講授理論分布與抽樣分布、統計假設測驗等方面的內容,讓學生掌握生物統計學中所蘊含的概率論及數理統計的思想精髓,從而避免學生亂套統計公式。
(四)密切跟蹤生命科學發展的前沿動向,探索生物統計學解決前沿問題的理論與方法。
統計學在生物學中的應用已有長遠的歷史,本論文由整理提供許多統計的理論與方法也是自生物上的應用發展而來,而且生物統計是一個極重要的跨生命科學各研究領域的平臺?,F在基因組學、蛋白質組學與生物信息學的蓬勃發展,使得生物統計在這些突破性生物科技領域上扮演著不可或缺的角色。
在課程建設中,隨時注意納入生物統計學在前沿領域研究應用的內容,增強課程的活力,提高教師和學生面向生物產業主戰場解決實際問題的能力。
四、加強實踐教學,注重學生能力培養
生物統計學要不要開實驗課,怎樣開實驗課,一直存在爭議,在此認為生物統計學不僅應該開設實驗課,而且還要將實踐教學的重點放在計算機技術和統計軟件的應用上,讓學生不僅掌握統計方法,而且加深對原理的認識,獲得就業或升學的必備計算機統計技能,提高解決復雜問題的能力。
(一)開展統計軟件的實習,擴大學生的視野,提高學生素質。
20世紀20年展起來的多元統計方法雖然對于處理多變量的種類數據問題具有很大的優越性,但由于計算工作量大,使得這些有效的統計分析方法一開始并沒有能夠在實踐中很好推廣開來。而電子計算機技術的誕生與發展,使得復雜的數據處理工作變得非常容易,所以充分利用現代計算技術,通過計算機軟件將統計方法中復雜難懂的計算過程屏障起來,讓用戶直接看到統計輸出結果與有關解釋,從而使統計方法的普及變得非常容易。在課程體系改革中,各課程的教學時數與達到培養目標所需完成的教學內容相比還是不足的。為此,可以通過標準的統計軟件的教學實習來達到以點帶面,擴大學生視野,提高學生素質。超級秘書網
為此我們建立了一個專用于實習教學的生物統計電腦實驗室?,F共有50余臺電腦,并連接到校園網。實驗室配備有指導教師,負責對上機的學生答疑。除按教學計劃進行的正常實習教學外,實驗室還對優秀學生免費開放,鼓勵他們結合教師的科研活動,應用所學生物統計學知識,學習新的生物統計學知識,掌握應用計算機解決生物統計學問題的技能。
(二)全方位、多層次的實踐教學。
為了進一步培養學生實際動手能力和科學嚴謹的治學態度,必須將本課程的實踐教學活動延伸到課堂教學外,開展全方位、多層次的實踐教學。
在原綿陽農專期間,主要在作物育種、作物本論文由整理提供栽培、動物營養等課程實驗與實習中,根據相關內容加入了試驗設計方法以及數據統計分析的相關內容。
組建了西南科技大學生命科學與工程學院以后,由原來的單一農科專業變成了理、工、農三大學科均有專業的格局。雖然專業的學科歸屬不同,但有一點是相通的,其內涵均屬于生命科學的范疇。以科學研究的方法進行劃分,均屬于實驗科學。
掌握正確的實驗設計方法,從不確定性數據中挖掘事物的客觀規律,是實驗科學工作者必備的技能。因此,我們將原來只是在農科專業上延伸實踐教學的作法推廣到全院的所有專業,結合實驗課教學的改革,對發酵工藝學實驗、植物細胞工程實驗、食用菌實驗、微生物學實驗等課程的內容全部或部分改為用生物統計學指導學生自主進行實驗設計,把過去單一的實驗流程、樣品觀察或檢測實驗改變為試驗條件的優化試驗,提出在不同條件下對樣品測定的比較試驗設計、單因素試驗設計、多因素試驗設計、正交試驗設計、均勻試驗設計,對試驗結果要求學生使用統計學的方法對進行分析和討論,最后得出最佳試驗條件。
這樣的實驗教學改革起到了一箭雙雕的作用,從專業基礎課或專業課的角度看,改驗證性實驗為設計型、綜合性實驗,增強了學生解決實際問題的能力,培養了學生創新思維的能力;從生物統計學角度看,將課程的教學實踐延伸到課程外,彌補了學時的不足,更重要的是學生將自己學到的統計學知識,轉化為解決實際問題的能力,知識得到很好的內化。
此外,在學生課外科技活動中指導學生選用正確的實驗設計和數據的統計分析方法,提升科技作品的檔次;在畢業論文(設計)中要求學生采用恰當的生物統計學方法進行設計與分析,寫出高質量的畢業論文(設計)。
通過這樣的教學實踐,訓練了學生的統計思維能力,使學生充分認識到掌握生物統計學這一工具的重要性和必要性,增強了學生學好用好這門工具的信心,提高了學生從復雜的生命現象中挖掘事物客觀發展規律的能力。
精品課程是集科學性、先進性、教育性、整體性、有效性和示范性于一身的優秀課程。作為精品課程的載體,應具有一流的教師隊伍、一流的教學內容本論文由整理提供、一流的教學方法、一流的教材、一流的教學管理等特點。與之相比,我們在生物統計學精品課程的建設上,才剛剛起步,今后還要在教材建設、師資隊伍建設、科學研究等方面加大力度,將生物統計學建設成體現現代教育教學思想、符合現代科學技術和適應社會發展進步的需要、能夠促進學生的全面發展而深受學生歡迎的一門課程。
(一)教師應通過積極主動的學習和應用,不斷加深對信息技術的認識我認為,要想實現信息技術和生物學科的“整合”,教師首先要對信息技術有一個全面的認識,至少每一位教師要能熟練使用電腦,平時要經常主動上網搜集各種與生物學科相關的信息資料來豐富自己的課堂教學資源,并結合課堂教學內容經常動手制作PPT、FLASH、AUTHWARE等,還要積極學習和掌握電腦的多種應用手段,在不斷嘗試中將其變成自己生活的一部分。
(二)對信息技術與課堂教學整合的理解“整合”實際上是一種課堂教學中呈現出來的狀態,或是效果,每一節課都有具體的任務,都有一定的教學目標。在信息技術的強大功能面前,教學不能退居于后,成為次要部分,無論如何,教學都是首要內容,教學目標的達成,學生獲得的學習結果,都是第一位的東西。利用信息技術的強大功能去實現課堂教學的目標是必要的,但信息技術從屬于課堂教學的地位也是必然的。若信息技術能在教學過程最需要的時刻發揮作用,非常自然真實地成為教學過程中一個環節、一個步驟、一段過程……,這樣狀態下的課堂教學,就成為一種整合狀態,它所達到的效果是我們所追求的課堂教學效果,此刻很難說是教學還是信息技術在起決定性作用,因為它們之間不分彼此,已經完全融為一體,也就整合在一起了。
(三)信息技術在生物課堂教學中的應用1.將微觀世界或宏觀現象通過視頻、動畫、聲音、圖片等形式展現在學生面前,加強了教學的直觀性,激發學生學習的興趣,有利于揭示事物本質,使抽象事物具體化。同時運用信息技術還可以刺激學生的視、聽、看等多種感官,如用形象生動的圖像信號吸引學生的視覺,用音響適中、悅耳精煉的語言信號吸引學生的聽覺,特別是電教媒體的特技效果突破了信息傳遞中的時間和空間的限制,使學生能直觀地看到宏觀世界、微觀世界、遠方或過去的事物,使信息通道得到了無限的延伸和擴展。2.關注全體、分層教學、因材施教,從而激發學生學習興趣,改變學生對學習的倦怠心理,提高學習效率。例如:在學生做題時,可以運用PPT打出不同難度的題,教師通過活動讓不同層次的學生參與其中,這樣既關注了全體,又達到了分層教學,同時也照顧了學困生的自尊心,起到了一舉兩得的作用。
二、在實踐中發現的一些問題
在信息技術與生物學科整合的實踐過程中,我有過困惑,總結過經驗教訓,主要表現在以下幾個方面:
(一)在課堂教學中不能盲目突出信息技術在實際教學中,不能片面追求效果的最優化,不分課型、內容,不顧實際教學需要,盲目使用各種媒體。信息技術只是一種教學工具或教學手段,如果利用得當,它就可以推動教學改革,提高教學質量;如果沒有正確認識信息技術,那么素材、課件等就會變為教師的“電灌”工具。我們如果片面夸大信息技術的效果,排斥傳統的教學手段和方法,如以電子板書替代傳統板書,或是本應使用實物、模型、掛圖等常規教具的情況下,一味使用多媒體技術,就會搞得學生視覺疲勞,失去了觀看的興趣。長此以往,不但會影響信息技術的使用效果,而且還會事倍功半。因此,我們在使用信息技術時,應注意時間長短適中,信息適量,媒體搭配合理、有序、適當,而且要根據不同年齡特點的學生及教學內容需要選擇不同的信息技術手段,內容、設計上不應過于花哨,以免分散學生的注意力。
(二)使用信息技術時,應處理好教師、學生、教材的關系“教師是主導,學生是主體”。我想,不論在傳統的教學模式中還是在信息技術環境下,都不能忽視教師的主導作用和學生的主體地位。在新型的課堂教學中學生應在教師的引導下適當地通過各種媒介進行自主探究、合作交流、主動質疑等來提高判斷事物、解決問題的能力,培養良好的思維習慣。同時教師也能對課堂收放自如,只有這樣才能達到信息技術與課程整合高效性。但大家要注意的是在使用信息技術時不能忽視教材,脫離教材,因為教材承載了當節課的教學內容、學習任務。
要想實現信息技術與生物教學的有效整合,要求教師投入大量的時間和精力挖掘備整合課程資源,這必然會給本來就辛苦備課,疲于奔命批改作業的教師帶來更大的壓力。同時,學校還必須投入大量的人力、物力、財力,構建校園信息化平臺,建設信息技術教師隊伍等。教師教得辛苦,教學輔助部門配合得辛苦,學生學的效果也不盡如人意,投入和產出不成比例,往往高投入的背后是很低的收益,這導致許多教師也不愿意進行整合。
二、解決信息技術與生物教學整合問題的辦法
1.明確整合的意義,確立正確方向
信息技術與生物教學整合的意義在于利用信息技術把枯燥、復雜、抽象的生物學知識生動、活潑、具體地呈遞出來,創造一種新型的教學環境去啟發學生的思維,減輕學生的學習負擔,提高學生的學習興趣,從而達到提高教學效率的目的。教師必須明確信息技術與生物教學整合的意義,以確立正確的整合方向。
2.加強理論學習,將整合落實
在信息技術與生物教學的整合過程中,要充分加強教法、教育心理學、教學論等理論的學習指導,把這些教學理論融入信息技術與生物教學的整合過程中,依據建構主義學習理論,結合生物學科的特點,構建易于實現生物教學與信息技術整合的新型教學模式。
3.結合生物學特點,進行科學整合
現行高中生物教材,并不是每一節課的內容都適合用信息技術來完成的。比如“細胞器”“遺傳的分子基礎”“生態系統”等用實物或投影演示,效果會很好。因此我們應該從具體的教學內容和目標出發,明確信息技術教學用在什么地方,什么時候用,怎么用,期望收到什么效果,以真正達到“信息技術與生物教學的科學整合”。信息技術與生物教學的整合應科學合理,其地位是“輔助”而不是“替代”。
4.建立評價機制,讓師生看到整合效益