時間:2023-03-15 15:06:10
序論:在您撰寫數據挖掘課程設計論文時,參考他人的優秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發您的創作熱情,引導您走向新的創作高度。
國外很多大學都開設了數據挖掘類課程,波士頓大學的“數據管理與商務智能”課程主要包括基礎、核心技術、應用三部分。授課方式包括理論內容講授、案例教學,以及學生以團隊合作方式完成項目并進行課堂演講。從麻省理工學院開放性課程資料(斯隆管理學院)中可以看出,在每章講解一種算法之后都盡可能地安排了商務實例的分析,并在課程后期安排了客座講座的形式。國內對于數據挖掘的教學類研究成果也很多,主要集中在三類問題的研究上,較為普遍的是根據專業建立大綱的研究,例如針對電子商務專業進行大綱設計;另外也有專注研究某一種或多種適合數據挖掘或商務智能的教學方法,如專題研討法;還有的討論算法理解與程序設計、軟件應用的關系。
2、基于模塊化方法的課程內容分析
模塊化教學模式是按照程序模塊化的構想和原則來設計教學內容的一整套教學體系,它是在既定的培養目標指導下,將全部教學內容按照一定標準或規則進行分解,使其成為多個相對獨立的教學模塊,且各教學模塊之間可以按照一定的規則有選擇性的重新組合。該方法在20世紀70年代,由國際勞工組織引入教學之中,開發出以現場教學為主,以技能培訓為核心的模塊化教學模式,在很多國家得到廣泛應用。由于該教學法具有針對性、靈活性、現實性等特點,越來越受到教育界的關注。模塊化教學本質上是以知識點與實踐的細化為出發點研究,本課程的知識點細化分為兩個層次:一是從宏觀角度,參考ACM的SIGKDD的數據挖掘課程建設建議,設計課程的基礎內容模塊和高級主題模塊;二是從微觀角度,針對較為復雜的算法進行的知識點劃分。課程內容的一至五章屬于基礎內容模塊,介紹本課程的基礎理論和入門的數據挖掘技術;六至第八章介于基礎內容與高級主題之間,介紹數據挖掘的核心算法,可以根據學生情況進行靈活處理,可強調應用,也可深化算法介紹;第九、十章為高級主題模塊,可以作為擴展材料介紹應用,或為感興趣同學提供算法介紹;課程實踐模塊包含數據倉庫建設與數據挖掘算法的應用,難度居中,可以在引導學生思考的前提下給出實驗步驟,并引導學生使用類似的方法處理不同的數據。
3、基于模塊化方法進行重要知識點的模塊化分析
重要知識點內涵較為豐富,一般體現在經典數據挖掘算法上,通常一大類算法下還分有多個算法,不同算法的在難度上有漸進層次,同一種算法也有很大改進研究空間,講授彈性比較大。因此,適合使用模塊化方法進行處理,并且需要在課程設計中明確一定課時量所要達到的內容和難度?;A部分為必選內容,介紹基本概念和基本原理;決策樹作為數據挖掘分類算法的最基礎算法也是必選內容,決策樹算法有多種分類,需要進行按照難易程度進行選擇;最后要根據難度選擇其他分類算法進行介紹。
4、結論
關鍵詞:醫學院校;目標驅動;課程設計;畢業論文
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2012)12-0218-02
一、背景
“數據倉庫與數據挖掘”是國內外高等院校一門重要的課程,是國家基礎教育較為重視的一門學科,受到不同專業學生的喜愛。其教學目標是提高學生的數據分析水平和能力,除了教授學生數據分析的常見方法之外,還將引導學生如何對實際的問題進行建模,如何對模型進行簡化和求解。利用實例教學等方法,可以很好地將數據挖掘中的抽象概念、模型、公式等闡述清楚,讓學生易于理解和接受。近年來,數據挖掘技術在醫學領域中的應用越來越廣泛。在疾病診斷、治療、器官移植、基因研究、圖像分析、康復、藥物開發、科學研究等方面都獲得了可喜的成果。運用各種數據挖掘技術了解各種疾病之間的相互關系、各種疾病的發展規律,總結各種治療方案的治療效果,以及對疾病的診斷、治療和醫學研究都是非常有價值的。因此,我們學院也把這門課程作為計算機專業及信息管理與信息系統專業的必修課。把計算機與醫學結合,使得學生的培養方案全面包括了計算機與醫學的知識點。由于該課程原本屬于研究生階段開設的專業課程,教材也大多側重于介紹體系結構、算法原理、效率分析與改進等理論知識,其中所涉及的內容大多比較深,許多知識都超出了本科生的接受范圍,此外,教材對相關理論在實際應用方面的說明也比較少,不利于安排實驗教學。因此要實現“數據倉庫與數據挖掘”課程的教學目標,必須在理論教學和實驗教學環節綜合考慮學時多少、教學條件以及學生的接受情況等因素,靈活地加以選擇安排。
二、存在的問題
主要包括以下幾方面:①課堂上以教師講、學生聽的教學形式為主,學生學習處于被動狀態,他們的創造性因此被嚴重扼殺;②教師對專業課程體系和學生的知識體系不夠重視,對課程體系的講解不到位,造成學生在學習時課程之間聯系不上,知識銜接不好,對知識的運用和融會貫通比較差;③實驗與理論脫節?!皵祿}庫與數據挖掘”課程理論講授的算法與實驗軟件中的算法有很大差距,使得學生難以理解。比如對于理論上講授的關聯規則算法,實驗中使用SQL SERVER 2005中的商務智能工具做實驗,學生發現有很多參數與理論上講授的有很大不同;④醫學院校的學生對純粹計算機理論知識接受困難。由于該門課程是交叉學科,涉及計算機、數學、統計學等知識,如果學生的其他學科學得不好,就會對該課程的學習產生障礙;⑤教師講授沒有把理論課程結合到實際應用中。有很多學生不知道學習這門課的意義,老師沒有很好引導學生,激活他們的學習熱情。
三、目標驅動的教學框架
對于以上問題,本文提出了一個新的教學體系,設計了一套基于目標驅動的教學框架,把教師與學生緊密聯系起來,從教學大綱的設置,教材的選擇,理論教學,實驗教學,課程設計及畢業論文,全面引導學生從初步了解到深入學習的過程。對于我們學校的實際情況,有兩個專業的學生要學習這門課程。一個是計算機科學與技術專業,一個是信息管理與信息系統專業。對于兩個不同的專業,我們設置不同的教學大綱。比如對于計算機專業的學生,數據倉庫和數據挖掘教學總時數為72學時,其中理論為54學時,實驗為36學時。
1.理論教學。對于信息管理與信息系統專業的學生,我們可以設置如下的教學計劃,可分為三個主要部分。我們教材選擇韓家煒的《數據挖掘概念與技術》,第一部分:第一至四章為數據挖掘的基礎知識,包括數據倉庫和數據挖掘的基本概念和相關知識介紹;第二部分:第五、六章介紹了數據挖掘的算法和工具;第三部分:第七章是數據挖掘的聚類分析的實際應用。本課程是信息管理與信息系統專業本科生專業必修課。通過該課程的學習,要求學生掌握數據倉庫和數據挖掘的基本概念,了解基本方法和應用背景。掌握數據倉庫的設計和建立,掌握數據挖掘的主要步驟和實現方法,數據挖掘的常用算法,實現數據挖掘的具體操作。理論學時的安排,第一章緒論(6學時);第二章數據倉庫(4學時);第三章數據預處理(8學時);第四章數據挖掘發現知識的類型(8學時);第五章數據挖掘中常用算法(12學時);第六章數據挖掘的工具及其應用(8學時);第七章數據挖掘應用實例(8學時)。
2.實驗教學。本課程配合理論教學,通過系統的實踐教學鍛煉,著重培養學生的獨立分析問題和解決問題的能力,熟練掌握數據倉庫的設計和建立以及各類數據挖掘方法,使學生具有一定的數據分析和挖掘能力,能在認識基礎上,提出有效的數據挖掘方法,依據實際例子,寫出解決方案。學生應在實驗課前明確實驗的目的和要求,然后針對相關問題寫出解決方案。實驗時對實際方案的運行結果應能進行分析并提出改進方法,最終寫出實驗報告。通過實驗教學應達到以下基本要求:①理解數據倉庫的工作機理及其構建過程;②掌握典型的數據倉庫系統及其開發工具的使用;③理解數據挖掘技術的工作原理與流程;④掌握典型數據挖掘工具的使用;⑤掌握幾種典型的數據挖掘算法;⑥掌握使用SQL SERVER 2000和SPSS工具解決實際問題。實驗成績包括:實驗教學過程成績、實驗報告成績,各占50%。實驗過程表現成績包括:學習態度是否認真、實驗操作是否正確規范、基本技能掌握程度是否具有創新意識等方面。實驗報告成績包括:實驗報告格式是否正確、原理是否論述清楚、實驗結果分析討論是否符合邏輯,報告字跡是否清楚等方面。
3.課程設計。理論課和實驗課接近結束時,我們把最后三周作為本門課程的課程設計。課程設計的目的是讓學生進一步深刻理解所學知識。由于本門課程很多算法不容易理解,如何讓學生把所學知識結合到醫學應用中是課程設計的關鍵。比如我們對信息管理與信息系統專業的學生課程設計,要求學生每人選擇一個老師給定的題目,課程設計有詳細的要求,比如題目“數據挖掘在醫學診斷中的應用”要求學生能把本門課程相關的算法結合使用,最后給出詳細的分析。通過課程設計,我們發現,學生對本門課程更有興趣。
4.畢業論文。我們把課程一般開設在大三的下學期,也就是說學生學完這門課程后,就做了該門課的課程設計,使得學生對數據挖掘相關知識有了比較深刻的認識。這樣,我們可以引導學生畢業論文的選擇。畢業論文畢竟是反映學生大學四年所學知識,也對他們將來就業起到提前培訓的作用。把理論結合實踐,老師對學生的引導也十分重要。
我們根據醫學院校的特征,提出了一套目標驅動的教學理念,從學生認識這門課程到學生理論課的學習,實驗課的學習,課程設計及畢業論文的完成,在老師的指導下,使用我們的考核體系,可提高學生對所學課程的興趣。
參考文獻:
1研究現狀
在網絡資源課程建設上,很多教育工作者都做了有益的嘗試。例如,文獻[1]建議基于學生網絡學習行為的特征來開發課程;文獻[2]建議基于數據挖掘知識體系運用模塊化方式組織數據挖掘課程內容;文獻[3]則認為數據挖掘教學內容的組織應注重培養數據意識和深入科學研究;文獻[4]認為將數據挖掘的內容貫穿于應用實例中易于傳授,或者設計合適案例來推進教學;[5]也有研究者認為直接帶領學生參與項目,通過項目開發重新組合課程內容,[6]能夠起到更加明確的效果。筆者認為將項目融合到教學中,往往受到眾多資源的限制,在教學層面難以有效拓展。本文將在深入學習已有研究成果的基礎上,探索適合職業院校學生的數據挖掘網絡資源建設模式和考核方式。
2金融數據挖掘課程實施方案設計實例
2.1設計理念在深入分析當前職業院校學生學習模式、興趣特點、課程特點的基礎上,擬按以下理念設計網絡課程內容。第一,采用“問題牽引、比較說明,解決問題,項目驅動”的教學方法。在教學中,首先說明開設內容的理由和方法,使學生對概念有充分的理解;更多地考慮到學習者的興趣和接受方式;教學中既正面闡述什么是正確的,也注重反面說明什么是錯誤的;用通俗的語言、具體實例闡述基本理論,突出重點,講透“難點”。采用“任務驅動模式”取代“順序教學模式”,以實際的項目開發任務為引導,進行示范性教學,讓學生在實踐、模仿、實踐中提高。第二,啟發式教學。數據挖掘是一門實踐性很強的科學,講解重點時注意對實驗方法要詳細介紹,這樣學生對教學重點就記得牢,并能以同理推演。實踐教學注意加強對學生發現、分析和解決問題能力的培養。第三,改革考核方式,采用多元評價方式考核實驗成績。為了提高學生的學習興趣,培養學生問題求解和創新能力,考核方式很有必要改革。針對數據挖掘這門課程,實驗成績和課程論文成績采用多元評價方式考核。經過三年的改革教學實踐,我們收到很好的教學效果,學生在獨立分析、解決問題和提供整體解決方案上的能力都獲得不同程度的提高。第四,加強實踐教學環節,注重學生綜合能力的培養。課內教師根據教材精心設計課程實驗教學和課程設計內容,注重實踐與理論相結合,突出產學結合特色。第五,在線答疑。教師充分利用網絡,建立在線討論欄目,就教學難點開展討論,并引入已畢業學生的社會資源進行拓展。第六,提供多種教學資源,引導學生自己解決學習問題。教學網站提供大量的教學資源,鼓勵學生自己在網上查找資料解決問題。實踐表明,這有助于激發學生的學習興趣,訓練學生的思辨能力。第七,多維實驗教學模式。金融數據挖掘的實踐教學分為三層教學體系,即驗證性實驗(基礎層)、設計型實驗(中間層)、綜合性實驗或課程論文(核心層)。在此基礎上,以任務驅動方式,構建實踐維三級目標體系,強化實踐技能操作,提高實踐教學質量?;A層,占總實驗學時的30%,主要包括驗證操作與驗證型實驗。學生直接操作驗證的內容與被列為實驗項目的基礎實驗,如數據預處理、數據可視化等。中間層,占總實驗學時的40%。例如,CRM操作實例、欺詐檢測等。核心層,占總實驗學時的30%。綜合設計型實驗,按照跨行業數據挖掘標準流程,完成商業理解、數據理解、數據準備、建模、評估、部署。
2.2內容設計金融數據挖掘網絡課程主要欄目包括:教師信息、課程介紹、指定教材信息、考核方法、學習方法指導、教學大綱、教學計劃、課件、案例、課程實驗、操作指引、數據挖掘實訓、課程論文、常用資源、他山之石等16個欄目,各欄目建設現已完成并應用于課程教學。金融數據挖掘網絡課程資源建設主要包括4個模塊:(1)教學文件模塊。該模塊主要欄目有教師信息、課程簡介、教學大綱、教學計劃,提供有關的課程教學指導性文件和教學進程安排,供教師和學生參考。(2)課程學習模塊。該模塊主要欄目有學習方法指導、授課課件、參考課件、課程實驗、課程論文等,主要向學生提供有關課程的學習和實驗指導。(3)教學資源模塊。該模塊主要向學生提供教學資源,作為課外教學的延伸。(4)課外互動模塊。該模塊主要通過網絡互動向學生提供課外答疑輔導環節。
2.3改革方案實施效果該課程改革方案的實施是基于BB(Blackboard)在線網絡平臺。由于本學期開始時,網絡課程平臺出現故障,數據挖掘網絡課程平臺正式使用時本學期已接近中段。使用綜合情況如圖1-3所示。結果顯示內容區、公告區、討論區獲得較高點擊量,其他模塊由于用戶體驗比其他平臺差,故暫無使用。圖2、圖3說明用戶的訪問還是與課程關聯比較大,即上課時段前后,學生訪問量增大,其他時段訪問量急劇下降。但是相比于筆者所教的其他課程,學生對該課程的興趣還是提升了許多。
3結論
一 課程體系設計和實踐實訓設計整體思路
1.遵照教育部對經濟統計學專業的要求
嚴格遵照教育部對經濟統計學專業的要求。主干學科為理論經濟學、應用經濟學、統計學,其中核心課程為西方經濟學(微觀經濟學、宏觀經濟學),計量經濟學,財政學,貨幣金融學,會計學,經濟統計學,國民經濟統計學,概率論與數理統計,抽樣技術與應用,應用時間序列分析。實踐性教學環節包括實驗課程(含基本統計分析軟件應用、統計實務模擬等),社會實踐(含經濟社會統計調查、統計工作實習等),科研和論文寫作(含畢業論文、學年論文、科研實踐等)。專業實驗包括計算機基本技能實驗、統計分析應用軟件實驗、經濟計量分析軟件實驗、數據挖掘技術與應用實驗。
2.參照其他院校的培養方案和課程設置
它山之石,可以攻玉。我們選擇了部分具有代表性的財經院校(如上海財經大學、中央財經大學、東北財經大學、西南財經大學、中南財經政法大學、北京工商大學、上海金融學院、 河南財經大學、浙江財經學院和山東工商學院)和綜合類院校(如浙江大學、吉林大學、南京大學和云南大學)以及師范類院校(如北京師范大學、華東師范大學、東北師范大學、南京師范大學)作為參照院校。通過比較分析得出,在統計學經濟統計、商務統計、金融統計方向中,財經類院校主要突出經濟學課程,招生偏重理科生。綜合性院校和師范類院校主要課程為理學類,招生偏重理科生。
綜上所述,經濟統計學專業應培養適應信息化社會需要,熟練掌握現代統計理論和經濟數量分析方法,具有扎實的統計學、經濟學和金融學基礎,能熟練應用計算機軟件處理統計數據的復合型高素質經濟管理統計人才。學生畢業后可在政府部門、金融機構、外資企業和大中型公司等從事經濟統計分析、管理咨詢、市場調研和商務數據分析等管理工作。
3.與學院培養方案形式統一
新制訂的培養方案和整個學院的形式保持了統一,以便于教務人員管理工作的開展。
二 經濟統計學培養方案專業課的設置
經濟統計學的培養目標與基本規格和招收對象為理科生,設置了保險精算、金融統計和商務統計三個方向。學生修滿培養方案規定的學分并達到學位授予要求者,授予經濟學學士學位。
由于經濟統計學對統計學和經濟學知識的要求較高,我們提高了課程總學分和總學時,注重主干學科和專業課程的開課順序和教學周學時分配,強化實訓實踐課程,實行理論和實踐并行。
培養方案確定了5門學科基礎課程,分別為宏觀經濟學、微觀經濟學、C語言程序設計、概率論與數理統計、管理學。確定了5門專業基礎課程,分別為基礎會計學、經濟統計學、貨幣金融學、財政學、計量經濟學。確定了9門專業核心課程,分別為國民經濟統計學、多元統計分析、統計預測與決策、抽樣技術與應用、應用時間序列分析、金融統計學、市場調查與分析、投資學、數據挖掘。
分設了三個專業方向,分別為保險精算(開設保險學、保險統計學、利息理論、壽險精算、非壽險精算5門課程)、金融統計(開設商業銀行經營管理、金融市場、金融資產評估、金融工具與金融風險管理、投資組合分析 5門課程)和商務統計(開設信息檢索與利用、企業經營統計學、投入產出分析、項目管理、質量控制統計方法5門課程)方向。
【關鍵詞】經濟統計學專業 培養方案 設計
【中圖分類號】G642 【文獻標識碼】A 【文章編號】1674-4810(2013)32-0060-01
經濟統計學專業是統計學在經濟領域中的應用學科,是以經濟數據為研究對象,包括經濟數據的采集、生成和傳輸,用統計方法分析經濟數據背后的經濟現象以及復雜經濟系統的規律,從而為經濟和管理決策服務。2013年,我國首次設置經濟統計學專業。作為地方二本師范院校的經濟統計學培養方案設計,沒有任何成功經驗可以借鑒。因此,我們在按照教育部要求,根據經濟形勢發展情況,借鑒財經類、綜合類和師范類院校的統計學專業經濟統計方向的課程設計,結合院校實際,依托學校建設應用型教學的平臺,來確定經濟統計學專業的培養理念并建立課程和實訓設計體系,進行經濟統計學的培養方案設計。
一 課程體系設計和實踐實訓設計整體思路
1.遵照教育部對經濟統計學專業的要求
嚴格遵照教育部對經濟統計學專業的要求。主干學科為理論經濟學、應用經濟學、統計學,其中核心課程為西方經濟學(微觀經濟學、宏觀經濟學),計量經濟學,財政學,貨幣金融學,會計學,經濟統計學,國民經濟統計學,概率論與數理統計,抽樣技術與應用,應用時間序列分析。實踐性教學環節包括實驗課程(含基本統計分析軟件應用、統計實務模擬等),社會實踐(含經濟社會統計調查、統計工作實習等),科研和論文寫作(含畢業論文、學年論文、科研實踐等)。專業實驗包括計算機基本技能實驗、統計分析應用軟件實驗、經濟計量分析軟件實驗、數據挖掘技術與應用實驗。
2.參照其他院校的培養方案和課程設置
它山之石,可以攻玉。我們選擇了部分具有代表性的財經院校(如上海財經大學、中央財經大學、東北財經大學、西南財經大學、中南財經政法大學、北京工商大學、上海金融學院、 河南財經大學、浙江財經學院和山東工商學院)和綜合類院校(如浙江大學、吉林大學、南京大學和云南大學)以及師范類院校(如北京師范大學、華東師范大學、東北師范大學、南京師范大學)作為參照院校。通過比較分析得出,在統計學經濟統計、商務統計、金融統計方向中,財經類院校主要突出經濟學課程,招生偏重理科生。綜合性院校和師范類院校主要課程為理學類,招生偏重理科生。
綜上所述,經濟統計學專業應培養適應信息化社會需要,熟練掌握現代統計理論和經濟數量分析方法,具有扎實的統計學、經濟學和金融學基礎,能熟練應用計算機軟件處理統計數據的復合型高素質經濟管理統計人才。學生畢業后可在政府部門、金融機構、外資企業和大中型公司等從事經濟統計分析、管理咨詢、市場調研和商務數據分析等管理工作。
3.與學院培養方案形式統一
新制訂的培養方案和整個學院的形式保持了統一,以便于教務人員管理工作的開展。
二 經濟統計學培養方案專業課的設置
經濟統計學的培養目標與基本規格和招收對象為理科生,設置了保險精算、金融統計和商務統計三個方向。學生修滿培養方案規定的學分并達到學位授予要求者,授予經濟學學士學位。
由于經濟統計學對統計學和經濟學知識的要求較高,我們提高了課程總學分和總學時,注重主干學科和專業課程的開課順序和教學周學時分配,強化實訓實踐課程,實行理論和實踐并行。
培養方案確定了5門學科基礎課程,分別為宏觀經濟學、微觀經濟學、C語言程序設計、概率論與數理統計、管理學。確定了5門專業基礎課程,分別為基礎會計學、經濟統計學、貨幣金融學、財政學、計量經濟學。確定了9門專業核心課程,分別為國民經濟統計學、多元統計分析、統計預測與決策、抽樣技術與應用、應用時間序列分析、金融統計學、市場調查與分析、投資學、數據挖掘。
分設了三個專業方向,分別為保險精算(開設保險學、保險統計學、利息理論、壽險精算、非壽險精算5門課程)、金融統計(開設商業銀行經營管理、金融市場、金融資產評估、金融工具與金融風險管理、投資組合分析 5門課程)和商務統計(開設信息檢索與利用、企業經營統計學、投入產出分析、項目管理、質量控制統計方法5門課程)方向。
關鍵詞:實驗平臺;教學管理;數據倉庫;數據挖掘
中圖分類號:G642 文獻標志碼:B 文章編號:1674-9324(2013)09-0253-03
一、引言
21世紀是國家全面推進學生素質培養的時期,計算機專業課既具有較強的理論性,又具有較深的實踐性。目前,計算機專業的教學過程中往往理論教育與實際脫節,很多學生通過了專業理論課的考試,卻不能將理論付諸于實踐,學生對課程知識并沒有深刻的理解和消化,對課程理論的實際應用沒有感觀上的體驗。經調查顯示,60%以上的學生認為在校期間的計算機理論課的學習對就業和實際工作幫助不大,這給學生學習計算機理論的積極性帶來了消極的影響,更有很多學生熱衷于參加社會上的計算機培訓機構,放棄在高校的課程學習。因此,在培養學生的理論創新能力的同時,提高學生的動手操作能力,加強學生理論聯系實際的能力是計算機教學十分緊迫和必要的任務。
隨著信息技術和網絡技術的快速發展,在短短幾年內數據倉庫和數據挖掘就已經成為IT信息領域廣泛應用和熱點研究的領域。該領域主要是研究如何從浩如煙海的海量數據中有效地提取并挖掘知識,對其進行自動分析和匯總,是計算機行業中最熱門、最有前景的領域之一[1]。數據倉庫與數據挖掘課程也順應計算機發展的需要,進入到高校計算機教育的專業課課程列表中。
本論文在深入研究了數據倉庫和數據挖掘課程的內容和特點的基礎上,采用B/S(Browser/Server)架構,即瀏覽器/服務器架構,開發了web課程教學實驗平臺。
二、數據倉庫與數據挖掘學科教學現狀
隨著數據倉庫與數據挖掘課程在各大高校成功試教后,近年來各大高校都為計算機專業都設立了數據倉庫和數據挖掘課程,時至今日,其課堂理論教學已經比較成熟。然而,絕大多數學生在經過該課程的學習后,普遍反映雖然基本了解了數據倉庫和數據挖掘相關理論知識,卻缺乏感性認識和實踐應用能力。這主要是因為該課程的實驗教學較難開展,缺乏一個符合以下特點的教學實驗平臺。
市場中通用數據倉庫和數據挖掘軟件昂貴且難以使用,大量的專業術語、專業業務理論、數學知識和挖掘模型讓人無從下手。因此我們需要的僅僅是一個實驗平臺,并非大型企業應用軟件,只要學生能通過它更簡易地完成該課程的實驗環節即可。
1.可視化、易操作??梢暬鸵撞僮骺梢蕴岣邔W生的學習興趣,讓學生更直觀的參與到教學活動中來,而不是苦惱于如何使用該平成實驗。
2.交互性。一個好的教學平臺不僅是一個可以提供給學生傳授知識的平臺,還應該是一個可以和學生及老師有交互性的平臺,并且使學生和學生有交互性,老師和學生有交互性[2]。
3.教學與實驗相結合。我們需要不僅僅是一個數據倉庫與數據挖掘實驗軟件,而是綜合課程教學和課程實驗的平臺。教學與實驗相結合、理論與實踐并重,這才是計算機專業教育的核心。
4.擁有合理和充足的實驗數據。對于一個實驗平臺來說,數據的缺乏將使得實驗無法進行。尤其是對于數據倉庫與數據挖掘這個特殊的領域,數據不僅要足夠的多而且要合理,否則會嚴重影響實驗結果和教學效果。
三、數據倉庫與數據挖掘學科教學實驗平臺的構建
為適應教育發展需要,秉承深化教學改革的方針,改革數據倉庫和數據挖掘課程原有的普通教學模式,啟動了“數據挖掘課程設計平臺建設”教學改革項目。該平臺依托我校電信學院985平臺的優良硬件環境,由遠程開放實驗平臺服務器和終端PC機組成,其成本低廉、維護方便、部署容易。該實驗平臺服務器直接部署于本校的學院985實驗基地,具有操作穩定性、魯棒性和容錯性。通過該實驗教學平臺,學生對該課程的學習過程將不受場地限制,只要通過網絡就可以登錄該平臺。該平臺主要框架如圖1所示。
1.用戶管理模塊實現了對不同用戶的權限設置、登錄和注冊等功能,超級管理員可以為普通學生用戶分配權限。
2.實驗平臺模塊給學生提供了算法模擬和試驗的平臺,主要分為以下兩個部分。
(1)數據倉庫的維度建模設計模塊。雪花模型設計案例;星型模型設計案例;ETL抽取操作平臺。
(2)數據挖掘算法實驗模塊。數據預處理程序實現算法平臺;Apriori算法實驗平臺;ID3算法實驗平臺;BP算法實驗平臺;K-Mean和K-Medoid算法實驗平臺;C4.5算法和決策樹算法實驗平臺;KNN算法實驗平臺;貝葉斯算法實驗平臺。
維度建模設計平臺和數據挖掘算法實驗平臺模塊是該平臺的核心模塊。
3.實驗課程模塊主要向學生介紹該實驗課程的相關內容、教學大綱和教學任務,也包含數據倉庫環境的具體安裝和配置視頻演示。
4.作業提交模塊更是改變了傳統的提交紙質作業的模式,讓學生將動手完成的實驗和相關作業通過該平臺提交,一個學生一個賬戶,避免了作業抄襲和拷貝。學生提交的作業只要運行正確,按題目要求編程,不論采用何種語言或者何種算法都是可以的,并沒有唯一性的標準答案。當實驗課程考核的時候,學生能夠通過作業提交系統向服務器提交指定課程內容的作業,供教師在線評閱和打分。
5.教學資源下載提供給學生自學的資料,給感興趣的學生提供了進一步學習的捷徑。
6.當有學生對實驗環節和該課程有任何疑問,都可以登錄在線答疑系統,給授課老師留言,這些信息都會以郵件的形式發送到授課老師的收件箱,從而實現即時的答復,讓學生在第一時間接受老師的指導。當有問題重復出現三次以上,系統就會自動識別,將問題和答復展示在FAQ中,提供給更多的學生共享該問題和該問題的解答,避免重復提問,也給還未遇到該問題的學生共享和學習。在線答疑給學生和教師提供了交互、交流和學習的平臺。
7.數據挖掘實驗平臺的在線代碼編譯環境主要采用gcc編譯器,能夠對學生提交的各種代碼進行實時編譯,給用戶的感覺就像是在本地執行一樣。它能夠支持的在線運行編程語言包括java、C和C++等,給學生提供多樣化的語言實現方式,體現了非機械化的計算機應試理念。
四、數據倉庫與數據挖掘學科教學實驗平臺的教學效果
在數據倉庫和數據挖掘課程中使用該教學實驗平臺,具有教育的先進性和優越性。
(一)建設了數據倉庫和數據挖掘課程的實驗教學體系
1.數據倉庫和數據挖掘模型。本平臺可以培養學生自己動手創建多維星型模型、多維雪花模型、緩慢變化維、ETL模型、數據立方體模型及其實例等,還可以增加學生對各類重要挖掘算法的特點和應用場景的理解,讓學生在實驗平臺上體驗基于數據倉庫的主要數據挖掘算法。
2.模型評估。當學生創建完畢自己的數據倉庫和數據挖掘模型后,可以通過調整不同的參數值和更改數據集來檢驗算法的輸出結果,并通過記錄在不同的應用場景下的參數值和結果值得到最優值。
3.優化創建模型和算法的性能。學生通過使用計算機領域中的一些經典優化技術,如創建位圖索引、哈希索引、S-tree索引等來優化模型和算法的性能,并記錄和比較不同優化技術對模型和算法的效率和響應時間的影響。
4.定期對學生所學實驗內容進行測試,根據學生的實驗測試結果對平臺的遠程實驗操作功能進行改進和完善。
(二)部署和實施了基于網絡的數據倉庫和數據挖掘課程遠程實驗教學環境
本項目通過構建基于網絡技術的遠程實驗教學平臺,不僅給學生和教師提供這樣一個教學實驗平臺,而且還實現了實驗教學的網上開放式管理,改革原有相對封閉的實驗教學模式為開放的實驗教學模式,構建了一個符合實踐教學環節需求、虛擬和真實環境相結合、基于Web的多應用場景的遠程開放實驗平臺。
(三)基于采樣評估證明了遠程網絡實驗教學的可行性和優越性
根據采樣評估結果,該系統體現了遠程網絡實驗的可行性和優越性。在該平臺真正投入使用之前,我們將一批學生分為兩個組進行數據倉庫和數據挖掘課程的學習,A組學生使用現有的課程教學方法,而B組學生使用該平臺的遠程實驗教學環境。具體教學內容為多維數據模型和數據立方體的概念以及k-means聚類和Apriori關聯分析算法。兩組學生通過不同的教學方式學習后,對他們進行了問卷調查和統計,結果如圖2所示。
從圖2的數據結果可以看到,無論是從學生興趣程度、作業完成度還是考試成績的角度對兩組學生的學習效果進行評估,使用該數據倉庫與數據挖掘課程教學實驗平臺的教學方式都具有明顯的優勢。在實驗過程中學生是主體,用所學知識發揮創造性思維進行實踐。當實驗取得結果時,不論結果成功與否,都能帶給學生一定的鼓勵,從而在某種程度上激發學生的創造力和積極性,真正加速問題解決和理論創新。因此,我們有理由相信該平臺的使用可以極大地提高學生的學習興趣,促進教學目標的實現。
五、結論
在計算機專業的教學中,如何提高學生的實踐能力和獨立解決問題的能力是當前高等教育發展的新形勢下所面臨的主要問題。本文首先介紹了基于數據倉庫和數據挖掘課程的實驗平臺的整體架構,展示了該平臺的優點,證明了該平臺可以將課堂學習和課后練習、理論教育與工程實踐有機結合,為實施更加行之有效的教學組織和教學管理模式提供了可能。只有教育者和學生充分認識到計算機課程中實驗環節的重要性,更有效地利用現有的社會資源和計算機技術為我們的教育服務,專業學科教學模式和方法才能不斷推陳出新,不斷進步和發展。
參考文獻:
[1]Jiawei Han,Micheline Kamber.Data Mining Concept and Technology[M].Beijing:China Machine Press,2007:10-12
[2]李旭晴.學科教學網站設計的應用探討[J].計算機教育,2009,(02):1-2.
1 統計學介紹
統計學是認識現象規律的一種方法,它的特點是揭示現象量變到質變的規律,具有普適性。對于高校學科體系來說,統計學已經從經濟學和數學中獨立出來作為一級學科,足以表明統計學在理論研究與實際應用中的巨大作用。隨著數據時代到來,統計學作為一門工具學科,越來越廣地應用到生物、醫藥、物理、水利、工程技術、人文社科等其他學科的研究中,統計學專業課程設置向多樣性發展,以期培養出能為社會所用的人才。
高校統計一般分為數理統計和經濟統計兩個方向,部分高校在理學院和經管學院分別設置統計學專業,比如:暨南大學經濟學院的統計學專業學生獲得的是經濟學學位,信息科學技術學院的應用統計專業學生獲得的是理學學位。雖然分為不同學院,設置的專業基礎課程卻有很大部分重疊。本文著重討論經濟統計專業人才培養現狀。
2 人才培養目標
目前統計學人才培養目標是培養具有良好的數學基礎和統計學、經濟素養,掌握統計學基本理論和方法,能熟練運用統計軟件分析數據,能在企事業單位從事統計調查、統計信息管理、數量分析等開發、應用與管理工作,或在金融、貿易等領域從事統計分析工作的復合應用型人才。
3 課程設置
高校統計學課程分為理論課程和實踐教學課程。理論課程包括思想道德修養、中國近代歷史、大學英語等通識課程,高等數學、概率論與數理統計、西方經濟學等學科基礎必修課程,財務管理、國際金融等基礎選修課程,統計學、計量經濟學、抽樣調查、時間序列分析等專業必修課程,博弈論、非參數統計、數據挖掘、市場調研等專業選修課程。實踐教學課程包括實習、學術活動和課程設計等。其中理論課程學分占總學分的80%左右,實踐教學課程占總學分的20%左右。理論課程中通識課程和基礎課程一般安排在大一和大二上學期;大二到大三主修專業必修課程和選修課程,專業課程大部分是理論課和實驗課相結合,理論課主要講授模型方法論,通過設計實驗課,學習統計分析軟件,并實現模型案例實證分析;大四理論課程基本結束,主修教學實習和課程設計。
高等學校核心課程體系尚屬完善,大多數課程偏重理論教學,忽視實踐教學,人才培養計劃中未設置實踐教學環節或者實踐教學課時偏少。實踐教學是以實踐性知識為課程內容,以生成實踐性知識為目標的課程。以實踐過程和實踐性知識的掌握為課程結構展開的起點,讓學生在一定程度實踐的基礎上建構所需的理論知識,以教學實踐任務為中心來組織課程內容,所需要的理論知識也圍繞實踐過程來選擇、組織和學習,以實踐過程作為學生學習的主要形式,并通過實踐報告、實踐表現等來評價學生的學習結果。實踐課縮短了從理論向實踐轉化的時空上的滯后,比如市場調查分析,通過學生親手設計調查問卷、選取合適的抽樣方法展開問卷調查、后期問卷數據匯總分析,最終生成調查分析報告,在實踐課程中加深統計專業知識的掌握和綜合運用。因此,應適當提高實踐教學課時比例。課程設置上,專業選修課程安排相對獨立,忽視了與其他學科的交叉融合學習,可適當增加交叉學科基礎知識的課程設置。
4 理論教學分析
教學方式上,大部分教師采取傳統的課堂面對面教學,仍停留在傳統統計專業教學模式。互聯網時代,隨著互聯網+教育的興起,由于網絡課程的低成本和便利性,其在大學教育中占據越來越大的比重。微課、慕課等互聯網教學模式,通過科學的設計將課程重點知識碎片化、網絡化,便于更多學生隨時隨地進行學習,而現今大部分高校形式上鮮有統計學的慕課、微課等網絡課程教學。教學手段上都是以理論講解為主,專業知識枯燥無味,不能最大程度激發學生的學習興趣,缺乏探討式、研究式、報告式等多樣化教學研討形式。
課程設計是教師形成具體教學方案的過程,特別是對于統計學這門應用性、實踐性都很強的課程,不僅要求學生能夠熟悉和掌握統計學基本理論知識及常用的統計分析方法,更要求能夠結合實際問題,應用最合適的統計方法,借助統計軟件,完成對問題的研究分析,真正達到學以致用的目的。統計學課程的教學設計尤為重要。課程設計需要綜合考慮教師自身教學技能、知識結構和教學經驗,學生的知識儲備情況和學習能力,課程本身所承載的信息技能。課程設計聯系經濟生活中的實際問題,有助于開拓學生的思維空間,學以致用、觸類旁通,作為理論知識到實際應用的橋梁工程,合理規范的課程設計起到將抽象理論具化到應用的紐帶作用。
教學內容上,統計軟件應用教學大部分限于Excel、SPSS、Eviews等傳統老舊的軟件,以致大部分學生的畢業論文或者課程設計都是對照陳舊的教材生搬硬套,用SPSS或Eviews做一個簡單的因子分析、主成分分析或者多元回歸模型,而SAS、R語言、Python等功能強大兼具實用性的潮流軟件學習課程欠缺。使用的教材著重對統計基礎知識的講解,對于變量選取、文本分析、隨機森林等實用性強的模型講解欠缺。
考核形式上,課程大部分以閉卷、開卷形式考核,造成學生只會死讀書、讀死書的弊病,靈活跳躍的邏輯思維能力和分析表述能力都是卷面考試考查不到而對于統計分析人員至關重要的能力。課程考核模式方面可以考慮加入分組開展調研、總結報告等開放式考核形式,變革考核情境,激發學生主動學習的積極性,在考核過程中塑造學生的統計思想。
5 實踐教學分析
大學生實踐學習分為實習和參加學術科研活動兩方面。大學生實習課程一方面從傳統意義上提高實踐技能,另一方面轉變為尋找就業的試水,本科生實習已經從過去的專業實踐直接指向就業,學生可以在實習過程中對所學專業有客觀實際的認識,不再局限于書本上教條案例,有助于學生拓展眼界,找到自身發展的興趣點。對于應用性較強的統計專業,實習課程的開展、實習基地的選擇、實習任務與時間的安排等都起到很重要的作用。實習基地的建設使學生在政府部門、企事業單位中了解部門統計、不同行業工作的內容和特點,拓寬學生的就業渠道。
高校學生實習有兩種形式。一種是院系組織,建立校企合作實習基地,定期輸送學生到實習崗位實踐學習。大學中實習基地掛牌很多,但是限于學生和企業之間關于交通、住宿、實習時間等問題難以協調,或者受其他因素影響,實習基地能夠提供給學生的實習機會較少。有待加強學校與企事業單位合作,建立友好長期的合作實習基地,為學生提供高質量的實習機會。另一種是學生自主尋找興趣相關的實習機會,這一類實習需要付出較多的時間成本,很難找到專業對口的實習崗位,學生實習期間的安全問題也難以得到保障。校方應做好留底審核實習協議資料等工作,實時掌握校外實習的學生動向,確保實習的合法合規。
高校大學生參加實踐競賽等科研活動是培養創新型人才的有效途徑。本科生參加實踐競賽有利于培養團隊協作精神和創新精神,了解學科前沿動態,了解國家產業政策及區域社會經濟發展問題,提高創新實踐綜合素質。另一方面也彌補了教師科研人員不足的問題。構建基于實踐競賽等科研活動的教學體系,對于學生明確學習目標、提升自主學習熱情、培養科研興趣具有積極推動作用。
科研競賽方面,學校會給參加科研競賽的學生學分獎勵,提升學生在學術競賽和科研活動上的積極性。目前各種國家級、省級科研競賽有大創項目、挑戰杯、數學建模競賽、統計建模競賽、數據挖掘競賽、SAS數據分析大賽、市場調查大賽等。學生初期報名熱情高漲,但常常由于指導教師欠缺、教學軟件資源不足等原因,培訓指導不能滿足學生參加競賽的知識需求,學生大部分是靠自學獲取相關知識,競賽結果不盡如人意。實踐競賽項目報名、培訓、參賽等組織過程起著重要輔助作用,實踐類競賽項目的組織迫在眉睫。
6 總結
統計學的產生發展來源于實踐,依賴于應用,并在應用過程中發展壯大,統計學的生命力就在于其能不斷滿足社會應用的需要。我國設有統計學及相關專業的高校數量也在明顯增多。近些年來,隨著信息產業發展,大數據環境對統計學專業的教學理念和教學模式產生變革性影響,統計基礎的數據分析人才將是社會最需要的人才。針對當前統計學教學中存在的問題,以及統計學與其他學科的交叉融合這一事實,培養統計人才需要對高校統計學教學進行改革。
隨著知識經濟和信息時代的到來,信息量越來越大,統計工具越來越多地滲入其他學科的研究,信息處理技術愈加復雜。大數據時代的來臨和大數據處理技術的發展,深深影響著統計學的發展。如何改革統計學專業課程設置?能否利用傳統的統計理論和統計方法對海量數據做出快速、精準的處理?如何在大數據時代背景下培養符合市場需求的統計分析師或數據分析師?如何實現統計學基礎方法論和數據挖掘的深度結合?如何將大數據處理技術融入相關統計學課程教學,探索統計工具和不同學科的融合,培養出創新型人才,以促進數據處理與分析技術的發展?這些都是在當前大數據背景下,統計教育工作者必須認真思考的問題。高校應從課程設計的開展及考核方式、實踐性質類課程選擇、實習課程調研、實踐競賽組織等方面改革完善統計學專業培養模式,做到與時俱進,合理設置專業課結構,平衡理論課與實踐課的時間,拓寬實習面,完善競賽組織工作,培養出創新型統計人才。