時間:2023-03-17 18:05:29
序論:在您撰寫中文科技論文時,參考他人的優秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發您的創作熱情,引導您走向新的創作高度。
關鍵詞:自然語言處理;特征提取;語法;語義;語用
中圖分類號:TP391.4 文獻標識碼:A文章編號:1009-3044(2007)16-31112-03
Feature Selection Research of the Chinese Technology Text based on Natural Language Processing
CHEN Pin
(Automation Department, Xiamen University,Xiamen 316005,China)
Abstract:With the development of China’s technology and economy, Chinese technology texts are full of the whole Net in the form of electronic text. So, Chinese technology text classification research has become a hot theme in the information domain. This paper set up a new feature selection model based on natural language processing. And based on this model, analyses in terms of syntax , semantics and pragmatics .
Key words:Natural Language Processing; Feature Selection; Syntax; Semantics; Pragmatics
1 引言
從50年代的機器翻譯和人工智能研究開始,自然語言處理(Natural Language Processing,簡稱NLP)已有長達半個多世紀的歷史。自然語言處理是研究如何讓計算機理解和生成人們日常所使用的語言(如漢語,英語等)。目的在于建立起一種人與機器之間的密切而友好的關系,使之能進行高度的信息傳遞與認知活動。[1]
本文基于自然語言處理理論及方法[1][2],以及中文科技論文文本其自身較強的領域特征,建立了文本特征提取模型,并從語法、語義和語用三個層面來分析處理,同時也用于解決自然語言中的多義、同義和相關性問題。
2 基于自然語言處理的特征提取模型
本文研究的對象是中文科技論文文本,很自然會遇到自然語言的各種問題。因此構建一個優秀的自然語言處理模型[3],是我們有效處理自然語言的關鍵所在,具有深刻的意義?;谧匀徽Z言處理的特征提取模型由詞匯層特征向量輸入、語法分析、語義分析、語用分析和概念層特征向量輸出等部分組成。模型結構如圖1所示。
基于自然語言處理的特征提取模型過程如下:首先輸入詞匯層特征是已經經過預處理后的詞匯,包括詞性標注、句子編號等等。然后對相同句子編號的詞匯采用分而治之的方法進行語法分析,即組塊分析。再是利用已經經過處理的語料庫中的詞匯建立領域概念樹,并基于領域概念樹進行概念語義分析。最后是語用分析,利用詞間相似度和關聯度進行語境分析。整個模型中,隨著語法層面到語義層面再到語用層面,語言的處理程度逐步趨于細化,其精度也隨之提高。
圖1 基于自然語言處理的特征提取模型
3 語法分析
語法分析雖然經過幾十年的研究和發展,但仍然是一個瓶頸問題。因此目前通常采用“分而治之”的原則,來降低完全句法分析的難度,進行部分的句法分析,我們也稱之為組塊分析。因此,本文結合Abney組塊描述體系[4],定義漢語語法基本成分為各組塊形式。并在此基礎上提出了一種基于詞性判斷規則的組塊分析策略,用于解決中文科技論文文本分類過程中的自然語言問題。
其中,組塊標記集如表1所示。
表1 組塊標記集
詞性標記集如表2所示。
表2 詞性標記集
在本論文中,我們分析組塊的方法主要是采用基于詞性判斷規則的組塊分析策略(Chunk Analysis base on Part of speech Rule,簡稱CABPos):
設組塊標記(Chunk Sign)記為CS;詞性標記(Pos Sign)記為PS;->表示前后標記符,如s->p表示主語組塊在謂語組塊前;每一個進行語法分析的句子(即詞串),記為Seni=ti1ti2…tim,其中seni為第i個句子,tij為第i個句子中的第j個詞匯;把每個句子等分為前、中、后三部分,分別記為Ti1,Ti2,Ti3;關聯詞表為RT。
判斷規則如下:
4 語義分析
目前,比較成熟的語義分析手段主要有格語法,語義網絡,義素分析法,優選語義學和蒙塔格語法等等[6]。本文將結合中文科技論文文本的強領域特征在原有概念樹模型的基礎上創建一個領域概念樹模型,并在此基礎上進行概念語義分析。從而很大程度上解決了自然語言的同義現象和相關性問題,提高了文本分類的準確率。
4.1 領域概念樹
從語義角度上分析,中文科技論文文本往往具有強的領域特征。比如說,“禪宗”、“僧人”等詞匯就明顯地帶有強烈的“人文科學-宗教-佛教”領域的詞匯色彩;而“中超”、“切爾西”、“角球”等詞匯就明顯地帶有濃郁的“人文科學-體育-足球”領域的詞匯色彩。因此,本文在傳統概念樹基礎上結合中文科技論文文本強領域特征構建一個新的語義模型――領域概念樹。如圖2所示。
圖2 領域概念樹
4.2 基于領域概念樹模型的概念語義分析算法
向量空間模型是文本分類特征提取中用得最多的特征模型,因為它夠簡單,而且特征提取的效果也不錯。那么在VSM中,如何才能把領域概念樹中的概念反映到特征項中,我們是這樣處理的。
在數學上,詞匯層映射到概念層,可用下式表示:
(8)
式中,T0為詞匯層特征向量,Ts為概念特征向量,T可以用標題名B、作者情況Z、中文摘要W、關鍵詞G、正文ZW和參考文獻CK等替代。
基于領域概念樹的概念語義分析算法主要包括下列操作:
設概念領域樹中各概念詞匯集,標記為CDS。
Step1 輸入詞匯層特征向量:
(9)
式中Fi表示特征向量中的第i個特征項。該特征項函數主要變量是ti、wi和CS(ti),也可以包含其他特征項信息;其中ti是特征詞匯;wi是特征詞匯的權重,CS(ti)是詞匯ti的組塊標注。
Step2 對詞匯層特征向量中各特征詞匯,通過領域概念路徑以及組塊標注歸并屬于同一概念層次的特征詞匯。
式中T′i表示屬于同一概念層次的詞匯;ci表示歸并后Ti概念層次代碼標記。
Step3 計算屬于同一概念層次的特征詞匯T′i所對應的概念權重。
式中ρi表示同一概念層特征詞匯T′i的概念權重。
Step4 輸出基于領域概念樹的概念層特征向量:
由此可見,基于領域概念樹模型的概念語義分析,如果特征項中參數詞匯屬于領域概念樹中的某領域層的概念詞匯,那么該詞匯就能增強它在該領域層的權重系數,極大地解決了同義詞等語義問題,提高了分類的精確度。
5 語用分析
語用分析可以理解為詞匯的上下文語境的分析。本文中,自然語言處理在語義、語用層面上所描述的詞匯是基于領域概念樹中的概念詞匯。因此,本文基于詞匯間相似度和關聯度,提出了一種語境分析方法。
從數學角度上來分析,基于詞匯間相似度和關聯度的語境語用分析過程,可以用下式來表示:
式中Ts是概念語義分析后的特征向量,Tr是語境語用分析后的特征向量,T可以用標題名B、作者情況Z、中文摘要W、關鍵詞G、正文ZW和參考文獻CK等替代;ξ是詞匯間相似度的閾值;η是詞匯間關聯度的閾值。
基于詞匯間相似度和關聯度的語境分析算法主要包括下列操作:
Step1輸入概念語義分析后的特征向量:
Step2對概念層中的詞匯進行詞間相似度計算,如公式(16)和(17):
Step3對概念層中的詞匯進行詞間關聯度計算,如公式(18)-(20):
Step4通過實驗獲得詞匯間相似度的閾值ξ和詞匯間關聯度的閾值η,取詞匯間相似度Simlexical(ti,tj)>ξ和關聯度Relaxical(ti,tj)>η的詞作為新的特征項。
Step5 輸出經過語境語用分析后的特征向量:
此算法主要是通過詞間相似度和關聯度來判斷同一概念層次上詞匯間的相關性,從而進一步改善了自然語言處理過程的性能,來提高文本分類的準確率。
6 舉例
為了具體說明該方法,以某標題名來舉例說明,如下所示:
標題名:計算機病毒防治的協同理論與法律對策
設t1="計算機",t2="病毒",t3="防治",t4="協同",t5="理論",t6="法律",t7="對策"。B0表示標題名原始特征向量;Bs表示標題名經過語義分析后的特征向量;Br表示標題名經過語境分析后的特征向量。
首先語法分析(組塊分析):
表3 組塊分析結果
然后語義分析:
標題中詞匯在領域概念樹模型中所對應的概念,如表4所示。
表4
所以該標題名的原始特征向量B0為:
最后語用分析:
詞間相似度關系(a=2),如表5所示。
表5 詞間相似度
詞間關聯度關系(K=4),如表6所示。
7 結論
本文利用自然語言處理的理論與技術,構建了基于自然語言處理的文本特征提取模型,并從語法、語義和語用三個層面分析,使自然語言的處理程度逐步深化。語法層面上,我們利用了基于詞性判斷規則進行組塊分析;語義層面上,則結合中文科技論文文本的強領域特征創建了領域概念樹模型,并在此基礎上進行了概念語義分析;語用層面上,基于概念層上詞匯間的相似度和關聯度,進行了語境語用分析。
參考文獻:
[1]劉穎.計算語言學[M].北京:清華大學出版社,2002.
[2]張春霞,郝天永.漢語自動分詞的研究現狀與困難[J].系統仿真學報,2005(17),1:138-145.
[3]Mladenic D, Grobelnik M.Feature selection for unbalanced class distribution and Na?ve Bayes [A].Proc of 16th Inter Conf on Machine Learning ICML-99[C].San Francisco, CA: Morgan Kaufmann Publishers, 1999:258-267.
[4]王怡,蓋杰,武港山等.基于潛在語義分析的中文文本層次分類技術[J].計算機應用研究,2004,8:151-154.
[5]姚天順.自然語言理解[M].北京:清華大學出版社,1995.
[6]王曉龍.自然語言處理的若干問題研究.哈爾濱工業大學,2004
[7]劉挺.語言模型.哈工大信息檢索研究室,2004
科學技術是第一生產力,科學技術的創新離不開科技論文。通常人們將科技會議論文和科技期刊論文統稱為科技論文??萍颊撐陌磳懽髡Z言的不同可分為中文科技論文和外文科技論文。外文科技論文以英文科技論文為主。英文科技論文比中文科技論文的數量多。眾多的科研成果以英文科技論文形式發表,因此很有必要提高英文科技論文的閱讀水平。
科技論文與科普文章不同。科普文章是寫給公眾看的,它具有一定的文學性和藝術性。科技論文是寫給同行專家看的,它具有很強的邏輯性??萍颊撐牡倪壿嬓栽谖淖稚媳憩F為句子之間的銜接十分緊密,因此掌握句子之間的各種銜接方法有助于提高英文科技論文的閱讀水平。
1 語法銜接
語法銜接包括省略、替代、照應和連接等多種方法,這些方法有助于增強英文科技論文的邏輯性和連貫性。
(1) Computers exist in a wide range of sizes and power. (2) The smallest are embedded within the circuitry of appliances, such as televisions and wrist watches.
句(2)中The smallest后面省略了在上文句(1)中已經出現的computers。采用省略的銜接方法避免了在句(2)中重復出現computers,突出了句(2)中的新信息“The smallest”,使得句子之間更加緊湊。
(3) Laptop computers and PCs are typically used in businesses and at home to communicate on computer networks, for word processing, to track finances, and to play games.
(4) They have large amounts of internal memory to store hundreds of programs and documents.
(5) In 1975, Gates and Paul Allen collaborated on the first version of the BASIC programming language.
(6) This led to the formation of Microsoft in Albuquerque, New Mexico, in the same year.
句(4)用人稱代詞They指上文句(3)中的Laptop computers and PCs,用人稱代詞起到照應的作用。句(6)用指示代詞This指前面In 1975, Gates and Paul Allen collaborated on the first version of the BASIC programming language整個句子所表達的意思,用指示代詞起到照應的作用。這種照應的銜接方法使得科技論文更加簡潔,表達的意思更加清晰。
(7) A laser used with the erbium-doped fiber can then be triggered without first having to convert weakened light pulses into electrical signals.
(8) As a result, with no intervening optical / electronic conversions to slow down transmissions, fibers can carry more information in the form of higher speed signals.
句(8)中的As a result表示句(7) 與句(8)之間是一種因果關系。還有一些過渡性的詞語可以表示轉折、時間、條件和因果等邏輯關系。掌握起銜接作用的過渡性詞語,有助于把握科技論文的內在邏輯。
2詞匯銜接
為了進一步增強英文科技論文的邏輯性和連貫性。英文科技論文除了應用語法銜接的方法,還大量使用詞匯銜接的方法。詞匯銜接包括重復、同義、反義、上下義等多種方法。
(9) The secret to perfect timing is to make an extra satellite measurement.
(10) If three perfect measurements can locate a point in 3-dimensional space, then four imperfect measurements can do the same thing.
句(9)中出現了measurement(單數形式),句(10)中又重復出現了measurements(復數形式),這種詞匯重復方法不但使得兩個句子更加緊密,而且突出了論文要表達的重要信息(measurement)。
(11) If everything were perfect (i.e. if our receiver’s clocks were perfect) then all of our satellite ranges would intersect at a single point (which is our position).
(12) But with imperfect clocks, a fourth measurement, done as a cross-check, will NOT intersect with the first three.
(13) Funding such an immense project would cost more than $230 billion over several decades.
(14) To make this investment economically feasible, phone companies want new laws that would let them supply programming as well as carry it for other companies.
(15) Some cable-TV companies, broadcasters, (下轉第79頁)(上接第74頁)and publishers strongly oppose the entry of such powerful competitors.
(11)中的perfect與句(12)中的imperfect是一對反義詞,利用反義詞銜接兩個句子,起到了強烈的對比作用。句(13)中的Funding與句(14)中的investment是一對同義詞,利用同義詞銜接兩個句子,不但可以避免用詞過于單調,還可以起到了強化同義詞所表達意思的作用。句(14)與句(15)利用上下義詞銜接兩個句子,句(14)中的companies是個上義詞,它抽象地指公司,句(15)中的cable-TV companies, broadcasters和 publishers是下義詞,它們具體指有線電視公司、廣播公司和出版商。
熟練掌握各種銜接方法,有助于把握科技論文的內在邏輯性,并快速準確地獲取英文科技論文所包含的信息,達到提高英文科技論文閱讀水平的目的。
一、中外科技學術期刊出版及其數據庫的模式對比
到目前為止,西方先進國家的科技學術期刊的出版一般有下述三種主要的模式。
第一種模式是編輯部與出版社合作的模式,首先由主辦單位的期刊編輯部負責收稿、稿件審理和修改、決定稿件錄用與否等工作。一旦稿件定稿,則以后的排版、版權認定、校對、出版、(網絡)單行本寄送、紙本期刊發行、數據庫收錄發行等工作全部由出版社負責,包括與作者的聯系和互動。一般來說,一個出版社與很多期刊社或編輯部簽訂合作協議,其中網絡投稿軟件的開發通常由出版社統一負責開發,交給期刊社或編輯部使用,因此通??梢钥吹剑赏患页霭嫔绯霭娴牟煌诳兄愃频耐陡逑到y和主頁,它們都在出版社的主頁下有鏈接。
第二種模式是學術團體式的出版形式,有些大的學術團體或研究所,同時主辦好幾份期刊,學術團體同時兼備出版社的資格和功能,專門出版相應的科技期刊,這些期刊通常由學術團體負責審稿和出版的全過程,例如,美國電氣電子工程師協會(IEEE)、美國化學會(ACS)、美國數學會(AMS)、英國皇家學會(RS)和英國皇家化學會(RSC)等都有自己的科技期刊及數據庫。
第三種是期刊社把所有的流程都包攬了,這種模式通常是一些電子版期刊,他們實行網絡化出版和OpenAccess(OA)的模式,讓讀者免費下載瀏覽。
與上述三種模式相對應的數據庫通常是:第一種模式的全文數據庫就在出版社,這個數據庫是出版社的商業盈利資源,如SpringerLink數據庫、ElsevierScienceDirect數據庫;第二種模式的全文數據庫在學術團體如學會,雖然學會是非營利機構,但是數據庫也是盈利資源;第三種模式的全文數據庫就在期刊社,通常主要以交流被引用為目的,不以營利為目的。目前,也有一些出版社旗下的部分期刊實行OA模式,例如,HandawiPublishingCorporation旗下就有不少實行OA的期刊。
至于二次文摘數據庫,通常與學會、信息研究所(公司)、科技情報研究所等研究單位相聯系在一起,如美國數學學會(AMS)的MR、美國化學文摘服務社(CAS)的CA、美國工程信息公司(EngineeringInformationInc.)的EI、美國科學研究所(ISI)的SCI和ISTP、德國數學文摘社的ZBLMATH、英國機電工程師學會(IEE)的INSPEC、俄羅斯全俄科學技術信息研究所(VINITI)的《文摘雜志》AJ。這類數據庫主要提供一次文獻的摘要、評論、索引信息、檢索,旨在為科學研究者和工程技術人員提供專業、實用的數據、知識等信息服務,支持最新的研究。
科技期刊數據庫的發展是伴隨科學技術的發展而發展的,數據庫產品的傳播由紙本、磁帶、軟盤、光盤等發展到今天的網絡數字化傳播,西方發達國家的學術期刊出版和數據庫已經形成了成熟的模式,嚴格遵循版權保護的基本原則,除了OA期刊,全文數據庫和二次文獻數據庫基本是商業操作的模式。
長期以來,中國的科技學術期刊的出版基本上停留在編輯部負責審稿出版的全過程(各自為政)的階段,當然有些編輯部把排版印刷工作交給一些專業的排版公司和印刷廠,發行方面一般是郵局發行、代辦發行、自辦發行3種形式。目前,已經有一些英文版的中國科技學術期刊與國外的出版社合作,走上述的第一種模式的路子,但是這只占很小的比例,因為中文期刊畢竟占絕對多數。
我國的科技期刊數據庫始于1989年由重慶維普資訊有限公司(其前身為中國科技情報所重慶分所數據庫研究中心)創建的以軟盤形式發行的中文科技期刊篇名數據庫,后發展成為網路版的中文期刊數據庫(簡稱維普)。維普與中國知網(CNKI)、萬方數據化期刊合稱為3大中文電子期刊數據庫。其中中國知網是中國知識基礎工程(NationalKnowledgeInfrastructure,CNKI)中的一個重要組成部分,由1995年立項的清華大學《中國學術期刊(光盤版)》發展而來,是目前國內最大的網上期刊信息資源之一。萬方數據化期刊是科技部“九五”重點科技攻關項目“科技期刊網絡服務系統”的一個組成部分,由中國科技信息研究所主辦,1990年建成并出版了涵蓋1.6萬家企業的中國第一家商業化商情類數據庫。3家中文科技期刊數據庫的主體都是針對科技期刊的全文收錄,其操作模式基本上是由期刊編輯部提供期刊的紙本或電子資源,再制作成數據庫的資源。與國外文獻數據庫載體的發展模式相同,我國的文獻數據庫同樣經歷了從磁帶—光盤—網絡的發展過程,且目前網絡型數據庫已成為中文科技期刊數據庫的主要形式。
與國外科技期刊數據庫的發展不同,中國的國情決定了我國的全文數據庫與西方發達國家的學術期刊全文數據庫有明顯的不同。
首先,中文科技期刊數據庫與其所收錄的科技期刊之間不存在從屬關系,這是與外文科技期刊數據庫的巨大差別。上面提到的國外科技期刊第一種和第二種出版模式,它們與科技期刊數據庫有明顯的從屬關系和統一的操作模式。但我國的科技期刊數據庫的服務商是由各情報所、研究院所和高等院校衍生出的公司,數據庫的內容是由各科技期刊社(編輯部)所出版的科技期刊,兩者間不存在從屬關系。公司要以經濟效益為首要目的。而數據庫的建設要借助于各家獨立于這些公司的科技期刊社(編輯部),其協調過程的困難性可想而知。
其次,我國科技期刊數據庫所收錄的期刊具有很大的重復率。無序競爭、政企不分、以權代法是造成這一現象的重要原因。另一方面,全社會知識產權意識不強,沒有形成尊重知識的社會氛圍,是這種現象產生的社會根源。中文科技數據庫建設初期,由于各數據庫的建設單位多為情報所、研究院所和高等學校等國家事業單位,缺乏市場經濟的體制規范和競爭意識,各個數據庫并沒有在信息資源建設上爭取各家科技期刊社(編輯部)的獨家授權。而各科技期刊社(編輯部)對被哪家數據庫的收錄所產生的知識產權等方面的問題并不太在意,任由各大數據庫對期刊文章進行收錄、整理和分類,甚至以進入數據庫的多寡作為期刊的評價指標,似乎進入越多數據庫就越“高檔”和光榮。在這樣的背景下,形成了中文科技期刊數據庫所自身特有的一個不同于外文科技期刊數據庫的怪現象,這就是數據庫所收錄期刊的高重復率,尤其以三大中文科技期刊數據庫最為明顯。
三大中文科技期刊數據庫雖然所收錄期刊不完全相同但存在相當高的重復率。這一方面造成了資源的大量浪費;一方面也為使用者帶來巨大的不便。由于各數據庫均為收費數據庫,各圖書館在購買時往往需要購買2到3種,而其中一大部分都是相互重復的。針對這種情況,一些文章試圖從各個數據庫的異同進行比較來對圖書館的購買進行指導。
二、中文科技學術期刊數據庫發展現狀和挑戰
由于中文科技期刊數據庫必然走向商業化之性質,數據庫商之間的競爭其實從各自成立的那天起就已經存在。只是數據庫建設之初,由上所述各種原因,表現得不甚明顯。進入21世紀以來,隨著數據庫產品移市場中所展現的巨大盈利能力和產品開發的逐漸完善,各數據庫商之間的競爭日益激烈。尤其在數據庫內容的爭奪上表現得尤其明顯。2000年某數據庫公司被多家期刊雜志社因著作權問題,這當然是由各期刊社日益增加的版權意識所導致的必然結果,但更深層次的是數據庫商之間的競爭結果。
這一時期,各家中文科技期刊數據庫服務商為了擴大規模從而取得更大的經濟效益,開始了針對科技期刊的“爭奪戰”。這個階段的特點主要有幾方面:
首先,以內容爭奪為主,通過內容爭奪實現經濟效益最大化。由于數據庫技術的普遍性和成熟性,數據庫服務商所提供的服務業趨同化,即通過對所收錄的各種科技期刊整理成數據庫(網絡版和光盤版)來提供文獻檢索和閱讀的服務。因此,數據庫的內容建設變得重要起來,從而形成了數據庫服務商對信息資源——科技期刊的全文信息這一資源的爭奪,而且各數據庫商更加傾向于對科技期刊的獨家收錄。2008年下半年,多家科技期刊社(編輯部)收到了某數據庫商關于獨家收錄的協議(征求意見版),競爭的激烈性由此可見一斑。目前,部分期刊社已實行獨家授權的方式,這無疑會調整現有產業鏈中的關系,且迫使數據庫商和刊社加強合作,從期刊內容的單純數字化和網絡向深層次的網絡出版和信息服務拓展??萍计诳男畔①Y源獨家授權的爭奪將是這段時期最顯著的特征。
其次,過程中更重視著作權問題的處理。各個數據庫在建設之初,我國關于數據庫的版權問題尚無相應的法律法規,使得數據庫商在信息資源建設過程中缺乏法律觀念,忽視甚至侵害著作權人的著作權。為日后科技期刊數據庫的發展帶來了諸多隱患。隨著我國法治化進程的加快,各家科技期刊著作權意識不斷增強,且對科技期刊數據庫重復收錄的利弊有了更加深刻的認識。各數據庫服務商也更加重視其所收錄期刊文章的著作權問題。因此,在競爭過程不論是數據庫商還是各種科技期刊都更加重視法律法規,通過運用法律法規來維護自身權益。
再次,數據庫商以合作協商的姿態與各科技期刊社(編輯部)進行溝通。在尊重科技期刊社(編輯部)的意愿上,本著互利互惠、合作共贏的精神爭取各科技期刊的全文收錄。例如,中國知網將全年的財務收支情況公開發給各科技期刊社(編輯部),并通過提供各種有益信息,提供各種服務(如召開編輯培訓會議)等方式來與各科技期刊社(編輯部)維護相互之間的關系,使各社(編輯部)對其增深了解、增進感情,贏取各社(編輯部)的信任和支持。
這一時期,各數據庫商把主要精力放在數據庫的內容建設上,通過各種方式爭取更多科技期刊的收錄直至獨家收錄。由于科技期刊社(編輯部)與數據庫商的非從屬關系,這個過程將是漫長、曲折的。實際上,早期一些英文版的科技學術期刊曾經被國內的這幾家全文數據庫所收錄,隨著它們投于Springer或Elsevier出版社麾下,它們所屬的論文已經全部撤出中文數據庫。那么,可以想象得到,如果要做到像國外一樣,全部科技期刊獨家收錄,中國的全文數據庫將經歷一場痛苦的重組。
中文科技期刊數據庫的發展也面臨著諸多挑戰。
首先,是來自國外科技期刊數據庫的挑戰。雖然隨著我國科技實力的不斷增強和科研人員數量的不斷增多,各科技期刊的稿件資源比較充沛。但由于國外科技期刊影響力大,大部分國內科研人員的優秀稿件都被國外期刊吸引過去,這一現實直接影響了國內科技期刊的質量,進而間接影響了中文科技期刊數據庫的質量。
其次,一些先進的出版理念也給科技期刊數據庫甚至整個出版行業帶來挑戰,如OA出版。OA出版理念是一種新的出版理念,并在實踐中被積極探索。OA是OpenAccess的縮寫,國內翻譯為開放存取或開放獲取。其倡導為促進學術交流而進行文獻的免費獲取。OA文獻的出版是通過一些官方機構及非營利組織建立的開放存取網站或其他形式的出版物,出版成本一般由作者、政府及出版機構等提供。目前,已形成一些有較大規模的網絡OA出版項目,如美國學術出版與資源聯盟項目(SPARC)、科學公共圖書館項目(PLoS)等。國內也有一部分高校學報實行免費全文下載,教育部科技發展中心所建立的科技論文在線網站也已頗具規模。這種新的出版模式無疑將挑戰現有的科技期刊數據庫的利益鏈條。
三、關于中文科技期刊全文數據庫發展的思考
數據庫資源的爭奪自始至終無論在國內國外都在進行著,但國外的競爭多是在稿件(上游)資源的爭奪上,而國內則是在期刊(下游)資源收錄的爭奪上。因此,中文科技期刊數據庫的各服務商必須在合理處理與各科技期刊社(編輯部)的關系上多下工夫。尤其重要的是,各數據庫服務商和各科技期刊社(編輯部)要有明確定位。
首先,數據庫服務商定位。
針對中文科技期刊數據庫的特點,數據庫服務商要合理定位,結合自身優勢,發掘數據庫自身特色。一定要認識到數據庫向精專細化發展的大趨勢,例如做好某些學科期刊的數據庫,專門收錄某一學科的期刊。另外,要密切聯系各中文科技期刊社(編輯部),爭取收錄更多的優秀刊物;同時,要把握市場規律,積極探索合理的市場化道路。積極開拓國內外市場,擴大數據庫在國內外市場的影響力,這不僅能為數據庫商帶來更多的利潤,而且也為中文科技期刊擴大影響力作出貢獻,這將是中文科技期刊社(編輯部)在是否接受被該數據庫獨家收錄時所考慮的一個重要因素。另外,必須明確把獨家收錄作為數據庫收錄的原則,不能一味遷就期刊社,必要時必須擯棄違反原則的期刊入庫。實際上,各全文數據庫必須明確意識到,放棄部分期刊,是勢在必行的事情,除非有哪家數據庫全面倒閉,不然你總得有所舍棄,讓所有的數據庫都能生存下去。
其次,中文科技期刊自身定位。
中文科技期刊的自身定位是中文科技期刊數據庫發展的另一個關鍵環節。各期刊必須充分了解全文數據庫收錄的原則和版權的重要性,要形成關于數據庫獨家收錄的統一認識。要結合本刊的辦刊宗旨,從提高刊物質量和影響力的角度進行思考。不要盲目服從于被動的收錄,應在認識到數據庫收錄重要性的基礎上與各個數據庫進行積極溝通,從而解決刊物是否要被收錄、需要被具有何種特色的數據庫收錄以及收錄方式等問題。
再次,政府在加強針對數據庫發展的法制建設,規范數據庫的發展,為數據庫發展提供系列、持續的指導意見也是必不可少的。
政府有關部門應該積極探討,協調各方利益關系,使我國的中文科技期刊數據庫形成科學良性的發展和有序合理的競爭,避免資源的浪費。其中引入市場機制和制定相應法律法規是重要的手段??上驳氖牵瑪祿彀l展這種無序競爭、政企不分、以權代法所帶來的不良社會影響,已引起國家有關部門的高度重視,并相繼出臺了一些政策法規。強調“激勵創造、有效運用、依法保護、科學管理”。引導各數據庫商遵紀守法,有序競爭,自由重組。實際上,據我們上面的分析,數據庫的調整、合并、重組,應該是不可避免的。
值得提到的是:中國科技論文的各大數據庫已經意識到上述的問題,一些措施正在逐步醞釀或實施中,例如合并調整,收錄期刊精專細化等等。
在科技期刊中,英文摘要決不是一個無足輕重的部分,英文摘要質量的好壞直接關系到論文是否能被SCI、EI、ISTP收錄,因而英文摘要的撰寫十分重要。國內學者對中文刊物的英文摘要有過不少論述,如:沈育英分別從時態、語態、常用句式、篇幅長短等方面對科技論文英文摘要應遵循的原則進行了歸納總結。方紅列舉了科技論文英語摘要的常見形式和常用句型。趙有斌從科技論文英文摘要的構成入手探討了其語言特點。這些研究從不同方面對英文摘要進行論述,在很大程度上對科技論文英文摘要的寫作有指導意義。本文把重心放在句法的語體特征上(不討論詞匯的語體特征),因為對英文摘要的論述雖多,但對語體問題卻鮮有提及,然而,任何寫作都涉及到語體,科技論文英文摘要的語體就應當適合科技論文這一語域,這種語體應當是正式的、簡潔的、明確的、語義濃縮的。張德祿先生就將科技英語在句法上的語體特征歸納為三點:第一,被動語態的使用頻率高;第二,名物化成分多;第三,非謂語動詞形式多。這里的“高”和“多”都是相對于普通語體而言。這些特點同樣適用于科技英文摘要。本文通過使用統計手段將50篇中文期刊的英文摘要和50篇英文期刊的英文摘要的這三個語體值進行對比分析,有根據地指出其中的差異,分析其中的原因,提出改進的辦法。
二、語體值的對比分析
本研究從2007-2008年國內外公開發行的科技期刊中隨機抽取了100篇英文摘要,其中,中文期刊的英文摘要50篇,涉及理工、農業、電子技術與信息科學、經管等專業,包括《計算機工程》、《材料熱處理學報》、《電工技術學報》、《農業工程學報》、《振動工程學報》、《航空動力學報》、《粉末冶金技術》、《建筑材料學報》、《工程力學》、《系統仿真學報》、《管理科學學報》等中文核心期刊。英文期刊的英文摘要50篇,主要是從劍橋科學文摘(CSA) 隨機抽取的,包括:“Biomedical Materials”.
本研究參照程雨民先生的語體計量研究方法及其語體成分表,結合科技論文摘要中上述三個語體因素,將這些語體因素量化得到語體值。根據語體成分表,被動語態、名物化以及非謂語動詞均為語體的正豐滿成分(+1),因此出現一個被動語態記+1分,名物化與非謂語動詞也這樣操作,然后分別累計這三個語體因素的得分,再分別除以總詞數,就得到了每一項的語體值。這樣中文期刊英文摘要的50個語體值就組成一個樣本,而英文期刊英文摘要的50個語體值就組成另一個樣本,然后做這兩個樣本的獨立樣本t檢驗,看兩者是否具有統計意義上的顯著差異,結果見以下各表。
如表1-1所示,在中文期刊的英文摘要中被動語態的語體值(3.5640)大于英文期刊的英文摘要中被動語態的語體值(2.8306),對這兩組語體值進行平均數差異性t檢驗,結果如表1-2所示樣本的方差齊(P=.250>α:0.05),兩組英文摘要中被動語態語體值有顯著性差異(P=0.020
如表2-1所示,在中文期刊的英文摘要中名物化的語體值(1.4506)小于英文期刊的英文摘要中名物化的語體值(2.5576),對這兩組語體值進行平均數差異性t檢驗,結果如表2-2所示樣本的方差齊(P=.075>α:0.05),兩組英文摘要中被動語態語體值有顯著性差異(P=.000
如表3-1所示,在中文期刊的英文摘要中非謂語動詞的語體值(1.7720)小于英文期刊的英文摘要中非謂語動詞的語體值(4.0784),對這兩組語體值進行平均數差異性t檢驗,結果如表3-2所示樣本的方差不齊(P=.009
三、討論
表1顯示兩組刊物的被動語態的語體值有統計意義上的顯著差別。中文期刊英文摘要的語體值顯著大于英文期刊的。在中文期刊中,有些英文摘要句句都是被動態,而且還出現如下嚴重失衡的句子,如:A strategy of feedback control optimization of stochastic dynamic systems via stationary response is proposed.這種頭重腳輕,信息分布不均衡的句子不符合英文表達習慣,但在中文期刊的英文摘要中俯首即拾,英文句型是頭輕腳重的,是正三角形的,是后續性的,而漢語句型恰恰是倒三角的,前置性的。受母語負遷移的影響,中國作者在寫英文摘要時善于進行RL逆線性擴展。按照英文主述位信息結構來講,主位提供的是舊信息,述位提供的是新信息,而這種句子結構的述位幾乎沒有提供任何實質的信息,而主位的信息負載量卻過大,這種句式不符合英文表達習慣。其實漢語也很少使用被動態,只是英文摘要一般都是從中文摘要翻譯而來,在中文摘要中使用的漢語無主句就被統統譯為英文被動句,直接把動詞甩到其他成分之后,然后給動詞披上被動態的外衣。這其中的原因是大家在學英語時,對被動態形式的習得普遍是很好的,在使用時似乎沒有什么障礙。再者是十九世紀以來直到第二次世界大戰前,英文科技論文中非常流行使用被動態,在大學英語和研究生英語的教學中,對于科技英語寫作,教師強調最多的就是被動語態的使用,并鼓勵學生把能變為被動態的句子全變為被動態。被動態的使用必須兼顧句子的平衡以及主位和述位的信息連貫,否則就顯得有些生硬了。中文期刊的英文摘要中存在被動語態濫用的情況,這不是讓我們拋棄被動態統統轉向主動態,也不是說被動語態這種語體因素喪失了它正式語體正豐滿成分的地位。應該看到的是,英文期刊摘要中被動態的使用頻率仍遠遠高于普通語類,被動語態仍然是語體正豐滿成分。但必須要意識到國際主流英文期刊在時態使用上發生的變化,主動語態比過去更頻繁地使用了。
表2顯示兩組刊物的名物化的語體值有統計意義上的顯著差別,英文期刊比中文期刊更多地使用名物化。通過對比這100篇英文摘要可以看出不論是中文期刊還是英文期刊都較少使用復句,句子結構傾向于簡潔,這是撰寫摘要的一個原則,但中文期刊的英文摘要多使用一致式,即通常用名詞體現過程的參與者,用動詞體現過程本身,用形容詞來體現事物的特征,這些動詞短語、名詞短語以及形容詞短語在一致式中都沒有經歷濃縮的過程,詞匯密度難以增大。較之漢語,英語屬于濃縮性語言,往往使用較低級階的句法單位,將意義濃縮在一個較小的單位里加以表達;而漢語取較高級階的語法單位,將意義擴展成較高句法單位來表達。而名物化是英文實現意義濃縮的主要手段,是語法中產生詞匯高密集度的主要來源。中國作者由于受到母語負遷移的影響,當語義需要擴張時往往斷句另起,信息較為分散。事實上,名物化屬于語法隱喻范疇,熊和劉(2005)指出二語習得中語法隱喻的個體發展遵循了從一致式到隱喻式的規律,也就是說要英語水平高的作者才會自覺自如地使用這種名物化的隱喻式。
表3顯示了兩組刊物的非謂語動詞的語體值存在統計意義上顯著差別,英文刊物中更頻繁地使用非謂語動詞結構而中文刊物則很少用這種結構。在中文期刊摘要中出現的非謂語動詞結構通常是些約定俗成的表達,如:based on,according to,compared with等,較少使用分詞作定語特別是分詞作狀語。產生這種情況的原因是漢語不是一種屈折語,形態特別是動詞的形態穩定自足,無限定性和非限定性之分,往往使用連動和兼動式,不恪守動詞形式的各種規范,如時態、語態、數等。由于母語負遷移的作用,中國人對英文句法的掌握往往遵從單句-復句-非謂語的發展路徑,并且在復句這一層次就停滯不前出現化石化現象。
四、結語
由于科技語域的名物化、分詞化與關系過程化的特點突出,科技語體的句法特點是名詞詞組龐大、復雜,但句子結構簡單。本文通過分析兩組摘要中被動態、名物化以及非謂語動詞的語體值,證明了中文科技刊物和英文科技刊物在這三方面有顯著性差異。為了和國際主流期刊接軌,在撰寫英文摘要時應注意在句法方面提升語體的正式性、正豐滿性。
參考文獻:
[1].沈育英:《科技論文英文摘要的特點及寫作》,《中國科技翻譯》,2001.2。
[2].方紅:《科技論文英文摘要寫作》,《西安科技大學學報》,2005.3。
[3].趙有斌:《科技論文英文摘要的特點》,《中國科技翻譯》,2001.1。
[4].張德祿:《功能文體學》,山東教育出版社,1998。
關鍵詞: 科技文 翻譯 功能翻譯理論
1.引言
較之其他翻譯文本,科技文本具有較強的專業性,譯文要求兼顧精準性和規范性,這就對翻譯工作者提出了更高的要求。在實際情況中,作為中西方科技活動交流的主要媒介,科技論文由于其較強的專業性,使得英譯工作發展緩慢,無論是科技工作者還是專業翻譯者,都很難保證譯文質量,致使科技文英譯水平良莠不齊,這與中國的科技迅猛發展之勢形成落差,提高中文科技文獻英譯水平是適應中國科技“走出去”形勢的當務之急。
具體而言, 科技文英譯存在的主要問題是英譯工作多著眼于單句詞語、語句或語段層面上的翻譯,如何將科技文英譯兼顧句法(包括語句內部的詞匯和語法)和篇章層面應作為研究重點。文本類型理論及翻譯目的論為探索科技文英譯技巧和策略提供了理論支撐。
2.功能翻譯理論
功能翻譯理論中最具影響力的德國學派整合了費米爾的目的論、賴斯的功能翻譯批評理論、曼塔利的翻譯行為理論及諾德的“功能加忠誠原則”。
其中,目的論現已成為功能翻譯理論的核心理論之一。該理論將翻譯闡述為承載著本身的目的,并通過沖破文化障礙促進文化間交流的行為。選擇翻譯方法或策略的標準在于翻譯本身的預期目標。目的論是建立在目的原則、連貫原則、忠實原則基礎上的[1]。
賴斯將語言學的文本功能理論遷移到翻譯行為的研究中,提出了功能翻譯批評理論。該理論建立在布勒的語言功能三分法基礎上,將文本分為信息型、表情型、感染型和視聽媒體型四種類型[2]。
翻譯行為理論是目的論的深化與發展。從翻譯過程出發,曼塔利將翻譯闡釋為一種“跨文化合作”的行為,認為其是有自身目的并注重結果的活動,翻譯過程則是文化轉化關聯的交流過程;從翻譯參與者行為及作用角度出發,曼塔利認為翻譯并不是單純的文字本身的翻譯,而是通過翻譯打破語言障礙,從而促進文化的交流[3]。
諾德的“功能加忠誠原則”是對功能翻譯批評理論的補充,不僅強調翻譯本身的功能,還重視翻譯對原著及讀者的忠誠。在此,“功能”指譯文可以在目標語國家的文化體系中起到學術交流作用;“忠誠”指翻譯既要忠實原著又要兼顧讀者的語言習慣。這一理論給出了翻譯過程中經常碰到的一些問題的具體解決方案,如哪些語句屬于可以保留,而哪些屬于必須保留并進行相應的改寫。
綜上,功能翻譯理論內部主流理論相互聯系、相互補充,系統解決翻譯實踐中遇到的問題。
3.功能翻譯理論指導下的科技文的翻譯
功能翻譯理論的某些特征能夠迎合科技文在句法翻譯(包括詞匯&語法)和整體篇章翻譯方面的特點。
3.1詞匯翻譯
3.1.1動詞名詞化
與漢語動詞使用的靈活性不同,英語中動詞的形態改變有嚴格限制,動詞名詞化的方式在不影響原文意義的同時,有利于句子結構的精簡。在忠實性原則指導下,科技文英譯傾向使用名詞化動詞,以順應目標語的表達習慣與文本特點。舉例如下:
原文:……打造醫療旅游資源的品牌價值,開拓醫療旅游市場的規模,提升醫療旅游服務與產品的質量……
譯文:…the building of brand value of medical tourism resources, the expansion of medical tourism market, the improvement of the quality of medical tourism services and products…(動詞的處理在此加粗標注)
分析:原文中使用了多個并列動詞,使得句子更加簡短有力。翻譯時應將這些動詞名詞化(“打造”翻譯為“the building of”;“開拓”翻譯為“the expansion of”等),以保證句子結構與層次的清晰性,更符合英文表達習慣。
3.1.2渲染詞的省譯
為增強語氣,中文科技文通常帶有很多中國特色的渲染詞匯,是中國人獨特思維方式的體現;然而,科技英語更關注文章的周密嚴謹,用簡練的表達突出文章的重點信息。在翻譯過程中,可以將渲染詞省譯。舉例如下:
原文:……對我國醫療旅游資源的空間布局、特征、類型等更加深入地討論……有利于醫療旅游資源的合理使用,大力提高我國醫療旅游資源的市場競爭力,有針對性地創新更多的醫療旅游產品……
譯文:… the discussion of the spatial distribution characteristic and type of medical tourism resources, and the exploration of China’s unique medical resources are favorable to the use of medical tourism resources, the improvement of market competitiveness of China’s medical tourism resources, the creation of more medical tourism products…(省譯部分加粗標注)
分析:原文中使用了很多渲染詞,例如“更加”、“深入地”、“合理”、“大力”、“有針對性地”等,都采取了省譯策略,使譯文更加簡潔易懂。
3.1.3術語的處理
科技論文專業性強,術語使用密度高,翻譯應當關注術語表達的準確性。舉例如下:
原文:該文主要運用了定性的研究方法,包含網絡分析法、實地調研法、SWOT分析法等。
譯文:Qualitative research method is the main method of this paper, including network analysis method, field research method and SWOT(Strength, Weakness, Opportunity, Threat) analysis method.
分析:對于專業人士而言,原文中的SW OT分析法不難理解,但是考慮到非專業讀者的閱讀體驗,因此在括號中將各字母的含義表示出來。
3.2語法翻譯與篇章翻譯
語法翻譯通常融于篇章翻譯中,在此將二者結合闡述。較之其他文體,科技文英譯應注意的語法點主要在于主動變被動的處理。根據相關統計,在科技文教科書中,大約有將近一半的動詞使用了被動語態,而漢語中更習慣主動語態的使用。因此,為了使得譯文讀者更容易理解,在翻譯過程中要對語態作適當的轉換。舉例如下:
原文:……制訂合理的醫療旅游方案,深入挖掘我國醫療旅游的獨特優勢,并進行醫療旅游產品的設計與創新。
譯文:… a reasonable medical tourism scheme is developed, the unique advantages of medical tourism are exploited, and medical tourism product is designed and created.
分析:由于原文較長,而且結構相對復雜,因此在翻譯時首先進行了斷句。在翻譯后半部分時,將漢語中的主動語態轉換成被動語態,將漢語主動語態“制訂”翻譯成英語被動語態的“is developed”,將漢語主動語態的“挖掘”翻譯成英語被動語態的“are exploited”,將漢語主動語態的“設計與創新”翻譯成英語被動語態的“is designed and created”。這種不具備感彩的翻譯方式,不但能夠客觀地將原文的語態特點表示出來,還能夠讓科技文的信息功能更加明顯。
4.結語
在功能翻譯理論的指導下,翻譯不僅僅是不同語言之間的轉變,更是一種具備較強目的性的交際行為。在翻譯過程中,應當使用合理的處理策略,將譯文的信息功能充分體現出來,實現交際目標。科技文是一種專業性很強的、以內容表達為目標的信息文本,為了將科技文的功能體現出來,需要運用交際翻譯的合理處理策略,在保持原文信息不變的前提下,按照實際語體的習慣與結構進行適當的調整、轉換與刪減,從而使得科技文翻譯質量更高。
參考文獻:
[1]楊瑛.功能翻譯理論與科技英語文體翻譯方法分析[J].陜西科技大學學報(自然科學版),2008(05).
模擬實驗是一種重要的科學技術研究方法,已廣泛應用于許多領域[1-3]。社會發展與人類進步,迫切要求研究者日益關注新模擬實驗方法的探討,以發現越來越復雜的科學技術問題的未知特性,更好地揭示其內在運行機制。同時,研究者在科技論文中如何有效展示其模擬實驗方法產生的效果,對提升論文價值,突出研究成果的創新性有重要意義。為此,在論述基本模擬類型的基礎上,以近年來航空航天領域的某些中文科技論文為主要案例,探討模擬實驗方法的最新進展特征,提出屬性依賴法與現場依賴法,為解決更復雜的科學技術問題提供新思路。
一、模擬的類型
1.模擬的基本類型
模擬是以科學技術理論與實踐為基礎,在一定環境與條件下,將研究對象用其它手段進行模仿的一種實驗方法。該方法不直接涉及研究對象固有的現象與過程本身,而是設計一個和該現象與過程相似的模型,并通過該模型間接地呈現出該現象與過程。模擬實驗的目的主要是便于經濟地檢驗、驗證、再現、發現或揭示該現象與過程的特征、演變規律與內在機制。
模擬的基本類型有物理模擬與計算機模擬。
物理模擬是制作和某現象與過程相似的物理模型,并對該模型研究,獲取該現象與過程的特征。
計算機模擬是利用計算機對某現象與過程進行求解、分析、判斷以及圖像顯示等,得出該現象與過程的特征。計算機模擬有模型模擬和統計模擬兩種基本方法。
2.模擬實驗方法的進展特征
科學技術的發展,對許多航空航天系統有越來越嚴格的性能要求[4-7]。為探索性能的未知特性,實時評估與預測性能退化軌跡,科學技術研究已經從靜態發展到動態、從線性發展到非線性、從確定性參數發展到不確定性參數、從不變性函數發展到多變性函數。面對這些新問題,現有研究所采用的模擬實驗方法取得了許多進展。
以近年來航空航天技術領域的某些中文科技論文為案例,經研究發現,模擬實驗方法的最新進展以依賴問題的屬性信息和現場信息為特征,旨在求解動態、非線性、不確定性與多變性等復雜問題,根據對問題信息的依賴特征,將現有的模擬實驗方法歸納為屬性依賴法與現場依賴法。
二、屬性依賴法
屬性依賴法是基于屬性、目標屬性與層次屬性等3個信息要素的模擬實驗方法。
屬性是問題的抽象刻畫,表示問題的性質與關系。性質表示問題的固有特征,關系表示不同問題之間的性質傳承與影響。
目標屬性是期望得到的對問題屬性的某種解答或認知。
層次屬性是目標屬性的分解,即將目標屬性分解為若干個子屬性。若子屬性彼此獨立,則稱為同層次子屬性;否則稱為非同層次子屬性。層次按從低到高的順序分為多層,目標屬性依賴于最高層子屬性,最高層子屬性依賴于次高層子屬性,依次類推,直到最低層子屬性。
根據目標屬性的不同,屬性依賴法又細分為同步進化法與層次進化法。
1.同步進化法
同步進化法是將問題分解成低一層次的多個彼此獨立的子問題,用基本模擬方法逐個解決各子問題,最后融合出結果。這是一種化整為零、逐個擊破、同步進化的方法。具體做法是,若目標屬性是由多個低一層次的獨立子屬性綜合構成,則可以根據各獨立子屬性的特征,進行子屬性模擬,然后推斷各子屬性的模擬結果,使各子屬性由低層次同步進化至高層次,獲得目標屬性特征。
例如,揭示航空發動機非線性動力學特征是相關領域的一個重要問題。為此,文獻[7]綜合現有方法的優點,提出一種振動耦合動力學模型,計算出系統非線性響應,并在兩個航空發動機轉子模擬裝置上進行模態實驗,發現計算結果與實驗結果有很好的吻合性。
在這個案例中,非線性響應特征問題被分解為2個同層次的子問題,即理論建模計算與模態實驗,2個子問題解答的融合是將計算結果與實驗結果進行對比分析。可以看出,解決這2個子問題的實驗模擬方法分別是物理模擬和計算機模型模擬,經過對2種模擬結果的對比檢驗,最終推斷出航空發動機非線性響應的某些特征,為探索航空發動機非線性動力學特征提供了新思路。
2.層次進化法
層次進化法是將問題按屬性層次由低到高地分解成多個前后有聯系的子問題,用基本模擬方法逐步解決各子問題,最后直接得到結果。該方法的特點是化整為零、逐步擊破、依次進化。具體做法是,若目標屬性可以分解為多個彼此低一層次的關聯子屬性,則可以根據各子屬性的特征,按照設計好的步驟,依次進行子屬性模擬,逐步使屬性由低層次向高層次進化,逼近目標屬性特征。
例如,航空發動機的故障診斷技術對發動機性能的可靠性、維護性和保障性有重要影響。但是,現有研究主要關注故障診斷算法的有效性,尚未有效驗證故障檢測率、定位率與虛警率等指標,從而無法定量評價故障診斷系統性能。這里的問題是如何定量評價故障診斷系統性能?
為此,文獻[4]將問題分解為混合卡爾曼濾波器組故障診斷理論,發動機故障診斷系統和故障診斷實驗等3個不同層次的子問題。這3個層次的進化關系為:(1)用計算機模型模擬方法構建混合卡爾曼濾波器組,為發動機故障診斷系統奠定理論模型基礎;(2)基于理論模型,針對民用渦扇發動機常見的4種故障,用物理模型模擬方法搭建發動機故障診斷系統,為故障診斷實驗奠定基礎;(3)基于故障診斷系統,用統計模擬法評價出發動機故障診斷系統性能的定量指標值。
在該案例中,依次解決3個子問題的實驗模擬方法分別是計算機模型模擬、物理模型模擬和統計模擬,最終目標是實現故障診斷系統性能的定量評價,為工程實踐提供了重要依據。
三、現場依賴法
現場依賴法是基于時間序列和參數序列的模擬實驗方法,時間序列和參數序列統稱為序列。時間序列是將某現象的某一個指標在不同時間上的各個數值按時間先后順序排列而形成的序列,序列中的信息與時間密切相關。參數序列是由某現象的某些特征值構成的序列,序列中的信息與時間沒有關系。
現場依賴法是指依賴于問題真實現場信息的一種模擬實驗方法,其特點是,在模擬實驗中有現場的實時信息輸入、輸出與交流,可以及時矯正評估與預測結果。按照現場實時信息特征,現場依賴法可以細分為時間序列依賴法與參數序列依賴法。
1.時間序列依賴法
時間序列依賴法是根據現場實時信息的輸入時間序列來實施輸出序列運行軌跡評估與預測的一種模擬實驗方法。
不確定性的輸入時間序列干擾會導致輸出時間序列運行軌跡發生未知的非線性與多變性演化,通過將外界的真實或模擬真實的時序干擾輸入模擬實驗系統,獲取輸出時間序列的演化響應機制,及時預測與矯正其運行軌跡,可以為真實航空航天系統的可靠運行奠定基礎。
例如,為揭示大氣阻力導致衛星軌道衰減的機制,文獻[1]構建了模擬實驗系統,將地球扁率與大氣阻力攝動影響作為輸入時間序列,通過模型模擬輸出軌道根數變化,獲取衛星軌道高度衰減結果即輸出時間序列。其中,依賴的現場實時信息是經模擬改進的用某衛星高精度加速度儀測量得到的大氣密度數據。盡管熱層大氣密度數據呈現出明顯的動態、非線性、不確定性與多變性時序特征,模擬軌道序列與衛星實際軌道序列仍然保持一致,發現了衛星運行軌跡演變的新特性,研究成果具有創新性。
2.參數序列依賴法
參數序列依賴法是根據現場實時信息的輸入參數序列來實施輸出序列運行軌跡評估與預測的一種模擬實驗方法。
常見參數有剛度、阻尼、固有頻率、壓力、流量與溫度等,多種參數的組合構成參數序列。模擬實驗系統的參數序列取值應該與真實系統的參數序列保持一致,才能可信賴地實施輸出序列運行軌跡評估與預測。
例如,文獻[8]的衛星在軌微振動環境模擬實驗,用物理模擬方法構建出低頻彈性支撐裝置,揭示出自由邊界條件對衛星動力學特征的影響機制,為提高衛星在軌微振動地面模擬實驗精度奠定了基礎。其中,依賴的現場實時信息是微振動擾振,輸入參數序列為激振力參數,輸出序列為模擬衛星彈性體的模態相應。
四、結 語
基于科學技術問題的屬性信息和現場信息特征,提出模擬實驗的屬性依賴法與現場依賴法,可以解決動態、非線性、不確定性與多變性問題,為模擬實驗方法的發展提供新思路。
模擬實驗方法歸類為科學技術研究方法論,合理運用屬性依賴法與現場依賴法可以有效地驗證或再現研究對象的表現,揭示其演變規律,發現某些未知特性。
在科技論文中,將屬性依賴法與現場依賴法產生的效果充分展示出來,能更好地突出研究成果的創新性。
1.本科畢業論文實踐中的計算機應用現狀
1.1 計算機知識儲備量不足
目前,各高校都開設有計算機課程,但仍不能滿足本科畢業論文實踐的需求。對于本科畢業論文,主要會用到Office辦公軟件中的Word、Excel、PowerPoint(PPT,Internet文獻數據庫,以及文獻管理軟件等。雖然各高校一般都開設有計算機基礎類課程,介紹MicrosoftWindows、Office軟件、Internet的使用,但所授內容還不能滿足本科畢業論文實踐的需要。在畢業論文寫作時,畢業生往往感到Word文檔的編排非常的麻煩,需要花費相當的精力和時間,也給指導老師增添了不少指導負擔。同樣,Excel、PowerPoint、Internet的使用也不盡如人意。除此之外,還有部分軟件知識在已有課程中完全沒有涉及,如文獻管理軟件的使用等。
1.2 計算機硬件設施不足
計算機資源不足嚴重影響畢業論文的撰寫。學生可利用的計算機資源主要有三種:自有計算機,學校計算機,網吧計算機。對自有計算機而言,雖有調查表明大學生電腦的擁有率已達到50%左右,但對于大多數來自農村的大學生而言,他們的電腦擁有率依然很低。對學校計算機而言,雖然各學校都建立有計算機房,但相比于龐大的學生群體,學校計算機依然不能滿足學生需求,而且學校計算機主要用于教學使用,學生的使用有時間限制。在這種情況下,許多學生不得不求助于網吧,而網吧一般不安裝OFFICE辦公軟件,更不會安裝如AutoCAD這種專業軟件,也無法訪問學校圖書館數據庫。與此同時,畢業論文的撰寫時間比較集中,往往在一兩個月內完成,特別是臨近答辯的幾天里,幾千畢業生需要計算機修訂論文,計算機的緊張程度可想而知。因而,學生在畢業論文撰寫過程中,常遇到沒有計算機可以使用的情況。
1.3 計算機使用缺乏指導
學生進行計算機操作時,缺乏足夠的指導。由于高校擴招,學生數量急劇增大而教師數量增加緩慢,導致師生比偏高,嚴重影響教學質量。作為公共基礎課程,幾千名學生的教學工作,往往由十多名教師來完成,師生比甚至高達1:250,很難說學生可以充分得到教師的指導在畢業論文進行階段,也同樣遇到師生比過高的問題,經常遇到一個老師同時指導十幾名學生的現象,教師指導任務重,很難保證指導質量。
2.本科畢業論文實踐中計算機應用需求
2.1 WORD大型文檔編排
畢業論文是一種較長的文檔,編排難度相對較大般而言,畢業論文字數要求5000字以上,頁數一般在10頁以上,編排的版式幾乎與出版社正規出版的書籍類似。這對于平時很少利用Word軟件的學生而言,具有很大的難度,需要重新學習Word的編排技巧。在論文寫作過程中,也容易出現論文排版上的各種問題。
目前,文檔編排軟件很多,但一般采用Mi-crosoftWord完成.對于Word排版問題,應著重解決以下幾方面的問題:①頁面設置;②文字格式的設置;③樣式的應用;④分節的設置;⑤頁眉頁腳的設置;⑥圖表的繪制;⑦公式的錄入;⑧自動生成目錄。
2.2 Excel表、圖與統計分析
對于大多數的畢業論文,都會涉及插入圖表,以及數據的統計分析。除文科類論文較少涉及圖表知識外,理工科、農科、醫學等學科的大部分畢業論文,都會涉及圖表的制作以及數據的統計分析。在畢業論文寫作過程中,部分學生對圖表的制作很是陌生,甚至不知道標準的圖表要求是什么,因而做出來的圖表不僅不美觀,而且也不符合要求。Excel還具有統計分析功能,不僅方便快捷,而且準確可靠,但不少同學不知道Excel具有統計學功能,更不會使用。他們往往采用手算的方法來進行統計分析,耗時耗力,而且還容易出錯。
圖表與統計分析,不僅可以采用Excel,也可以采用更為專業的軟件,如Origin制圖、Sigmaplot制圖、SAS統計分析、SPSS統計分析等,但以Excel更為方便。對于Execl圖表與統計,應著重解決以下幾方面的問題:①Excel表格的制作(特別是三線表的制作);②Excel圖表的制作;③Excel函數與公式;④Excel統計分析工具。除此之外,也可以介紹Origin、Sigmaplot、SAS、SPSS等軟件的使用。
文檔演示畢業論文答辯時,_般采用PPT展示其研究課題。答辯過程主要包含兩部分,學生陳述和老師提問。學生的自主陳述過程,不僅需要其精彩的陳述,更需要映襯陳述的多媒體展示。目前,大多數學生往往直接將論文內容粘貼到PPT當中,卻不知如何精簡和美化,結果導致PPT臃腫,條理不清晰,沒有層次感。導致這一情況的直接原因就是學生缺乏PPT制作的技巧。
對于PPT的制作,應著重解決以下幾方面的問題:①整體結構設計;②頁面布局設計;③色彩搭配設計;④演講內容提煉;⑤媒體元素設置;⑥動態效果設置;⑦播放策略。
2.4 INTERNET文獻檢索
Internet是獲取科技信息非常方便的渠道。畢業論文的實踐不是閉門造車,而是他人研究成果的繼續。因而在研究之前需要查閱大量的文獻。文獻資料主要分為兩種資料:文本資料和電子資料。大部分的研究成果是以期刊論文、會議報告、學位論文等形式最先展示出來的,而這部分資料目前基本都被相關數據庫所收錄,存儲在數據服務器上。利用互聯網技術,可以非常方便地查閱到所需要的資料。
對于Internet文獻檢索,應著重解決以下幾方面的問題:①主要中文期刊數據庫;②主要英文期刊數據庫;③其它類型數據庫(如:電子圖書、電子報紙、會議論文、學位論文、標準、專利等);④檢索策略;⑤檢索技巧。
2.5 ENDNOTE文獻管理
在畢業論文撰寫過程中,根據撰寫需要,要對參考文獻進行插入、移動、刪除等各種管理操作。本科畢業論文的參考文獻數量一般在20篇左右,而研究生畢業論文的參考文獻數量可達100篇以上,對于如此多的文獻,如果采用人工管理的方式,不僅工作量巨大,而且非常容易出錯。通過專業的文獻管理軟件,可以非常方便地對參考文獻進行處理。文獻管理類軟件有多種,如:醫學文獻王、風^-express、Endnote、Referencemanager、Notefirst等。不同軟件有自己的特點和優勢,重點推薦Endnote文獻管理軟件,當然像Notefrst這種推出時間較短的國內免費軟件,也有不錯的口碑。
以Endnote文獻管理軟件為例,應著重解決以下幾方面問題:①參考文獻格式標準;②創建End-note圖書館;③文獻信息錄入;④Word中使用文獻格式模板設置;⑥高級應用。
3.本科畢業論文實踐中的計算機應用指導
3.1 加強計算機教育課程建設
通過調整課程設置和課程內容,引入相關計算機教育內容。同時,提高教學質量和水平,加強學生計算機實踐能力的培養。在《計算機基礎》課程中,要將Office辦公軟件引入到課程中,并要達到一定的應用水準。在《試驗設計與統計分析》課程中,可以引入Excel和SAS等軟件知識。在《文獻檢索》課程中,可以引入Internet的使用,數據庫查詢和Endnote軟件等知識。在其它專業課程中,凡涉及到計算機內容的,也要盡可能進行上機訓練,提高計算機應用能力。
3.2 加強計算機專業知識講座
通過專題講座的形式,講解畢業論文實踐過程中所使用的軟件知識。在畢業論文撰寫期間,可以通過專題講座,具有針對性地進行輔導。因此,學生可以及時的了解相關知識,并立即加以應用。除了現場的講座形式外,還可以利用網絡的優勢,建立網上學習平臺,將學習資源放在網絡上,學生可以隨時查詢相關計算機應用知識。
3.3 加強計算機硬件建設
加大計算機硬件設施的投入力度,優化計算機機房管理,提高計算機利用效率。根據學校人數和計算機使用的實際情況,合理投入資金進行計算機房的建設,增加計算機的臺套數。其次,制定合理的管理措施,適當延長計算機房的使用時間,提高計算機房的利用效率,減少計算機的非學習性占用。
3.4 加強指導老師的指導職責
制定畢業論文指導教師的考核體系,強化指導教師的責任意識,督促教師加強對學生的指導。從學校和學院兩個層次,學校層次要做好畢業論文指導的全面工作,同時要對計算機應用指導工作提出明確統_的要求,學院則有必要對學校的規定做出具體的安排和實施辦法。
4.小結