曾有一段時間,國內(nèi)科研活動的跟隨式弊端受到各界熱議,使國人對創(chuàng)新發(fā)展成效倍感懷疑。我們從論文數(shù)據(jù)挖掘的角度,選取兩個研究領(lǐng)域(神經(jīng)影像、海洋工程)進(jìn)行分析,以管中窺豹。數(shù)據(jù)來源為湯森路透的ISI數(shù)據(jù)庫。
1
神經(jīng)影像[1]
此領(lǐng)域主要發(fā)表國家情況如下:通過CiteSpaceV軟件分析文獻(xiàn)所在的國家/地區(qū),各國發(fā)表的論文數(shù)量可繪制出如圖1所示的網(wǎng)絡(luò)地域圖譜(年輪越大,說明發(fā)表文章越多)。從圖中可以看出,美國占有絕對優(yōu)勢,發(fā)表論文數(shù)量最多,達(dá)到17447篇,占所有發(fā)文量的42.04%,遙遙領(lǐng)先于其他國家;其次是德國,占所有發(fā)文量的12.91%。中國發(fā)表論文數(shù)為1295篇,在所有國家地區(qū)中名列第9位,不及英國(3428篇)、日本(3298篇)、法國(2878篇)、意大利(2841篇)、加拿大(2167篇)、荷蘭(1638篇)。
圖1 1980-2015年神經(jīng)影像學(xué)科(WoS)論文的主要發(fā)表國家
從主要國家發(fā)表趨勢來看:論文發(fā)表量前9的國家(含中國)歷年發(fā)表量走勢見圖2。美國發(fā)表量36年來一直保持第一,且發(fā)表量呈總體增加趨勢。中國起步較晚,1986年開始出現(xiàn)神經(jīng)影像學(xué)科的第1篇論文,且在本世紀(jì)初才呈現(xiàn)出明顯上升趨勢。不過2010年后,中國發(fā)文開始趕超部分神經(jīng)影像學(xué)科總發(fā)文量排名居前的歐美發(fā)達(dá)國家,特別是2015年,發(fā)文207篇,已超過日本、法國、意大利和荷蘭,居全球第5位。這里顯示出在量的角度上,我國從跟蹤到超越的發(fā)展過程,當(dāng)然未能從“跟隨”與“創(chuàng)新”的角度來反映科研質(zhì)量。
圖2 1980-2015年神經(jīng)影像(WoS)主要發(fā)表國家的發(fā)表量變化趨勢
研究熱點(diǎn)統(tǒng)計(共現(xiàn)關(guān)鍵詞出現(xiàn)年代統(tǒng)計)[2]:從1980-2015年神經(jīng)影像學(xué)科發(fā)文情況來看,美國發(fā)文一直遙遙領(lǐng)先,而中國起步較晚,不過2010年后發(fā)展較為迅速。為具體了解中國在該學(xué)科與總發(fā)文量居于前8位的國家的差距,需要對共現(xiàn)頻次排名靠前的關(guān)鍵詞所代表的研究方向進(jìn)行詳細(xì)分析。表1呈現(xiàn)的是1980-2015年神經(jīng)影像學(xué)科所有論文的共現(xiàn)頻次排名前200個關(guān)鍵詞所屬論文 在該學(xué)科總發(fā)文量前9位國家的歸屬情況。表1可見,有63.5%的最早共現(xiàn)關(guān)鍵詞來自美國發(fā)表的論文,27%來自法國發(fā)表的論文,18.5%來自德國發(fā)表的文獻(xiàn),英國、日本和意大利均為12%左右,而僅有1.5%的最早共現(xiàn)關(guān)鍵詞來自中國發(fā)表的論文。表1還分別統(tǒng)計了晚于最早年代1-5年,6-10年,10年以上共現(xiàn)的關(guān)鍵詞的個數(shù)。由此可以,在該領(lǐng)域最早的研究基本來自于美國,德國、英國、日本、法國、意大利和加拿大等國會在接下來的5年緊緊跟隨,而中國近8成的共現(xiàn)詞是出現(xiàn)在10年以后,也就是說中國是從10年左右再開始跟隨。所以,就這個領(lǐng)域來看,以共現(xiàn)詞分析為角度的質(zhì)量結(jié)果顯示出我國存在的較為嚴(yán)重的跟隨式科研現(xiàn)象。
表1 共現(xiàn)頻次排名前200個關(guān)鍵詞所屬論文的歸屬國家
備注:
1. 這里的共現(xiàn)頻次排名依據(jù)是Citespace軟件計算的論文的Author keywords(DE)和Keywords plus(ID)字段中的關(guān)鍵詞的共現(xiàn)次數(shù)。
2. 由于數(shù)據(jù)庫的限制,本次檢索分析不包括1980年之前的相關(guān)文獻(xiàn)。
3. 由于數(shù)據(jù)庫中年代較早的文獻(xiàn),尤其是1990年之間的相關(guān)文獻(xiàn),大部分沒有關(guān)鍵詞字段的信息,因此本次分析也不包括這些文獻(xiàn)。
4. 由于發(fā)表國家眾多,本次只選擇了發(fā)表量前5的國家的文獻(xiàn)進(jìn)行關(guān)鍵詞分析。
5. 由于以上1-3中的一個或多個因素,出現(xiàn)了關(guān)鍵詞最早年代未知的情況,并且獲得的分析數(shù)據(jù)也僅在分析數(shù)據(jù)集中有參考價值,其他情況下參考此數(shù)據(jù)請再斟酌。
2
海洋工程[3]
通過“Citespace v”軟件分析本領(lǐng)域主要發(fā)表國家/地區(qū),我們繪制出圖3所示的網(wǎng)絡(luò)地域圖譜(年輪越大,說明發(fā)表文章越多)。從圖中可以看出,美國占有絕對優(yōu)勢,發(fā)表論文數(shù)量最多,達(dá)到8832篇,占所有發(fā)文量的39.04%,走在世界前列;中國位居第二,發(fā)文量2340篇,占所有發(fā)文量的10.35%。其他主要發(fā)表國家為英國(England,1834篇)、加拿大(1145篇)、日本(1125篇)、澳大利亞(857篇)、韓國(826篇)、意大利(723篇)、法國(712篇)、挪威(704篇)等。
圖3 1980-2015年海洋工程學(xué)科(WoS)論文發(fā)表量前20的國家
主要國家發(fā)表趨勢:論文發(fā)表量前5的國家歷年發(fā)表量走勢見圖4。美國連續(xù)36年發(fā)表量第一,且呈總體增加趨勢;中國總發(fā)表量是第二,發(fā)表量呈逐年持續(xù)增加趨勢。但中美發(fā)表量差距較大,早期(1996年之前)中國的發(fā)文量只有個位數(shù),而且能在web of science檢索到的最早中國論文的發(fā)表年份是1984年(其他4個國家都是1980年或許更早);中國2002年起,發(fā)表量都是第二;直到近幾年,發(fā)表量與美國逐年接近。這顯示了在數(shù)量上“跟隨”特征。
圖4 1980-2015年海洋工程學(xué)科(WoS)論文主要發(fā)表國家發(fā)表量變化
研究熱點(diǎn)統(tǒng)計(共現(xiàn)關(guān)鍵詞出現(xiàn)年代統(tǒng)計):通過設(shè)置“Citespace v”的相關(guān)屬性,主題詞類型“Term Type”中選擇“Burst Terms”,“Node Types”中選擇“Keyword”,選擇Pathfinder 算法,設(shè)置相應(yīng)閾值。為使圖譜的主要節(jié)點(diǎn)更加清晰,節(jié)點(diǎn)數(shù)選擇為30-50個。分析結(jié)果如圖5、圖6、圖7所示。可見,3個圖中知識點(diǎn)重合度很高。
圖5 1980-2015年海洋工程學(xué)科(WoS)論文的知識圖譜
圖6 1980-2015年美國海洋工程學(xué)科(WoS)論文的知識圖譜
圖7 1980-2015年中國海洋工程學(xué)科(WoS)論文的知識圖譜
共現(xiàn)關(guān)鍵詞年代統(tǒng)計:從1980-2015年學(xué)科發(fā)文情況看,美國總體成果一直遙遙領(lǐng)先。為具體了解中美在該學(xué)科的發(fā)展差距,需要對共現(xiàn)頻次排名靠前的關(guān)鍵詞所代表的研究方向進(jìn)行詳細(xì)分析。由表2可見,共現(xiàn)頻次排名前200個關(guān)鍵詞中,有53%最早共現(xiàn)的關(guān)鍵詞來自美國發(fā)表文獻(xiàn),有13.5%來自加拿大發(fā)表文獻(xiàn),有10%來自英國發(fā)表文獻(xiàn),有6%來自中國發(fā)表文獻(xiàn),有3%來自日本發(fā)表文獻(xiàn),還有23.5%的高頻關(guān)鍵詞分布于其它國家。此外表2還分別統(tǒng)計了晚于最早年代1-5年,6-10年,10年以上共現(xiàn)的關(guān)鍵詞個數(shù),中國在海洋工程學(xué)科領(lǐng)域的共現(xiàn)詞主要集中在晚于最早6年以上,也就是說中國在該領(lǐng)域的研究基本晚于國際前沿6年以上。這從研究質(zhì)量維度反映了總體上我國的跟蹤現(xiàn)象,當(dāng)然還不能完全對應(yīng)“跟班”現(xiàn)象,因?yàn)楹蟪霈F(xiàn)的研究不一定就是在原有框架中的小修小補(bǔ)或者重復(fù)。
表2 共現(xiàn)頻次排名前200個關(guān)鍵詞所屬論文的歸屬國家
備注:
1. 這里的共現(xiàn)頻次排名依據(jù)是Citespace軟件計算的論文的Author keywords(DE)和Keywords plus(ID)字段中的關(guān)鍵詞的共現(xiàn)次數(shù)。
2. 由于數(shù)據(jù)庫的限制,本次檢索分析不包括1980年之前的相關(guān)文獻(xiàn)。
3. 由于數(shù)據(jù)庫中年代較早的文獻(xiàn),尤其是1990年之前的相關(guān)文獻(xiàn),大部分沒有關(guān)鍵詞字段的信息,因此本次分析也不包括這些文獻(xiàn)。
4. 由于發(fā)表國家眾多,本次只選擇了發(fā)表量前5的國家的文獻(xiàn)進(jìn)行關(guān)鍵詞分析。
5. 由于以上1-3中的一個或多個因素,出現(xiàn)了關(guān)鍵詞最早年代未知的情況,并且獲得的分析數(shù)據(jù)也僅在分析數(shù)據(jù)集中有參考價值,其他情況下參考此數(shù)據(jù)請再斟酌。
總而言之,以上兩個隨機(jī)抽取的行業(yè)領(lǐng)域案例分析,展示了我國在主題選擇上的“跟隨”性質(zhì),中國對研究熱點(diǎn)或領(lǐng)域的開拓性沒有表現(xiàn)出來,反而具有顯著的跟隨特點(diǎn),而共現(xiàn)關(guān)鍵詞分析比較充分地說明了這一點(diǎn)。當(dāng)然,這個分析只能從一個側(cè)面來展示某種程度上的跟隨式科研狀況,并不能從深層次來反映我國科技創(chuàng)新的總體狀況,在“后出現(xiàn)的成果不一定就完全是重復(fù)或跟班”這個意義上,更是如此。
[1] 檢索條件
出版年:(1980-2015)精煉依據(jù): 文獻(xiàn)類型: (ARTICLE) AND Web of Science 類別:(NEUROIMAGING) 索引:SCI-EXPANDED。檢索時間:2016.10.27
檢索結(jié)果
1980年至2015年,被SCI-EXPANDED收錄的神經(jīng)影像學(xué)科論文數(shù)(article),共41502條
[2] 通過設(shè)置CiteSpaceV的相關(guān)屬性,主題詞類型“Term Type”中選擇“Burst Terms”,“Node Types”中選擇“Keyword”,選擇Pathfinder算法,設(shè)置相應(yīng)的閾值。
[3] 檢索條件
出版年:1980-2015 精煉依據(jù):文獻(xiàn)類型(ARTICLE)AND Web of Science 類別(ENGINEERING OCEAN)
檢索結(jié)果
1980年至2015年,被Web of Science收錄的海洋工程學(xué)科論文數(shù)(article),共22622條
(作者:吳偉,博士|副研究員,浙江大學(xué)中國科教戰(zhàn)略研究院;余敏杰,浙江大學(xué)圖書館參考咨詢部副主任)
聯(lián)系客服