目 錄
一、CiteSpace——基于文獻計量法設計的數(shù)據(jù)可視化軟件
(一)研究方法——文獻計量法
二、以CNKI 為例進行案例分析
(一)數(shù)據(jù)處理
1. 獲取數(shù)據(jù)
2. 轉(zhuǎn)換數(shù)據(jù)
(二)建立項目/設置參數(shù)
(三)可視化結(jié)果
1. 關鍵詞共現(xiàn)圖譜的方法論基礎、含義及分析
2. 聚類的功能
三、教師駐校培養(yǎng)模式研究的計量學分析結(jié)果
(一)教師駐校培養(yǎng)模式研究文獻年度分布
(二)作者分布
四、教師駐校培養(yǎng)模式研究熱點分析
(一)研究熱點主題分析
(二)研究領域分析
五、教師駐校培養(yǎng)模式研究的演進路徑
教師駐校培養(yǎng)模式研究發(fā)展及熱點演進的文獻計量學分析
——基于CitesSpace的可視化分析
本文旨在通過借助工具CiteSpace(可視化文獻分析軟件),來歸納和展望國內(nèi)外對于教師駐校培養(yǎng)模式研究的發(fā)展歷程、宏觀趨勢以及研究熱點變化,達到論述文獻計量法這一方法的目的。
一、CiteSpace——基于文獻計量法設計的數(shù)據(jù)可視化軟件
(一)研究方法——文獻計量法
圖1.CiteSpace支持數(shù)據(jù)庫導出的文獻題錄及參考文獻數(shù)據(jù)
圖2.StartCiteSpace界面
圖3.CiteSpace主界面
菜單欄是CiteSpace的功能與參數(shù)區(qū),包括File(文件)、Projects(項目) 、Data(數(shù)據(jù)) Network(網(wǎng)絡) 、Visualization(可視化) 、Geographical(地理化) 、OverlayMaps(疊加分析) Analytics(文獻網(wǎng)絡分析報告) 、Text(文本) 、Preferences(偏好設置) 、Tutorials(教程)、Resources(資源)、Community(社區(qū))、Help(幫助)、Donate(捐獻)。
工程區(qū)又叫操作區(qū),該區(qū)域主要用于新建項目,點擊New即可進入新工程的設置界面。運行進度區(qū)可以展示CiteSpace在運行過程中的數(shù)據(jù)操作。
功能選擇區(qū)包括
1、Time slicing時間切片區(qū),可以選擇待分析文獻的起止時間;
2、Text Processing文本處理區(qū)(包括Term source 選擇聚類詞來源和Term type聚類詞類型);
3、Node types網(wǎng)絡配置功能區(qū),這部分可以選擇節(jié)點類型,選擇將直接決定會生成什么樣的圖譜(在其中,不同顏色的選項代表不同的含義:藍色部分關于合作網(wǎng)絡分析,對象可以是作者、機構(gòu)或國家,如可以分析哪些作者、機構(gòu)或文章的發(fā)文量比較多,哪些作者之間的合作比較多;綠色區(qū)是共性分析,其對象可以是主題、關鍵詞、來源或WOS的分類,其中主題和關鍵詞回答的問題是:哪些主題詞或關鍵詞出現(xiàn)的次數(shù)比較多,以及哪些詞常常在同一篇文章中出現(xiàn),反映了研究領域的熱點詞;紅色部分是共被引分析,對象可以是參考文獻、文獻作者和期刊,回答的問題是哪些文獻、作者和期刊被引用的次數(shù)最多,哪些常常被一起引用,這樣的問題則反映了內(nèi)容的相關性;灰色部分則是耦合分析);
4、Links連接強度計算(·Strength分析對象數(shù)據(jù)之間的連接強度 ·Scope范圍);
5、Select criteria閾值選擇標準;
6、Pruning 剪枝方式選擇(優(yōu)化結(jié)果);
7、Visualization可視化模式。
二、以CNKI 為例進行案例分析
本文以中國知網(wǎng)(CNKI)為例,以“教師駐校模式”為檢索關鍵詞用CiteSpace進行數(shù)據(jù)分析。分析過程包括以下幾個部分:數(shù)據(jù)處理、建立項目/設置參數(shù)、可視化結(jié)果、結(jié)合圖譜結(jié)果進行初步解讀、分析結(jié)果并完成撰寫報告。本文著重對前三個過程展開論述。
(一)數(shù)據(jù)處理
1.獲取數(shù)據(jù)
(1)在桌面建立一個名為“data for citepace”(可任意命名)的數(shù)據(jù)庫,用來專門存放citespace的數(shù)據(jù)。在其下以自己的研究主題再命名一個子文件夾(如圖4,本文命名為“教師教育”),在子文件夾下新建四個文件夾:“input”、“output”、“project”和“data”。
圖4.新建“data for citespace”的數(shù)據(jù)庫
(2)進入中國知網(wǎng)(舊版)進行數(shù)據(jù)下載,在高級檢索中限定主題或者關鍵詞(本文在高級檢索中輸入“教師駐校模式”的關鍵詞,選擇中文文獻)。
(3)點擊“全選”之后有35篇文獻,篩選并剔除無直接相關的文獻兩篇,分析剩余33份與研究主題直接相關的。若要導出大批量數(shù)據(jù),可以在“每頁顯示”中選擇50,再根據(jù)研究需要,如剔除報告、會議等相關文獻。進入下一步,在“導出/參考文獻”跳轉(zhuǎn)的頁面“請點擊這里”中進行篩選。
圖5.選擇數(shù)據(jù)
(4)點擊“導出/參考文獻”選項,點擊“文獻導出格式”-“Refworks”-“導出”,將這份下載的txt文本格式的文件命名為download1,并放入“input”的文件夾中。
圖6.文獻輸出
圖7. 命名導出的參考文獻
2.轉(zhuǎn)換數(shù)據(jù)
(1)打開5.7.R2(64-bit),等待片刻后進入主界面(圖3),點擊Data(Import/Export)選擇CNKI
——————————————————————————
(2)Data →Import→download1
(3)Input directory選擇“input”文件夾,Output directory選擇“output”文件夾
點擊CNKI Format Conversion2.0,完成轉(zhuǎn)換。可點擊output文件夾檢查數(shù)據(jù)轉(zhuǎn)換與否。
(4)把output里的數(shù)據(jù)復制到“data”文件夾下
(二)建立項目/設置參數(shù)
1、新建項目?;氐街鹘缑?,在控制面板菜單欄中點擊File建立新項目,在“Title”中命名英文格式的項目,本文命名為Teacher Residency。
2、功能選擇區(qū)進行參數(shù)選擇。時間切片區(qū)From 2001 JAN To 2020 DEC,Node Types選擇Keyword,Pruning在循進中選擇Pruning sliced networks。點擊”GO!”出現(xiàn)圖8選項。
3、點擊可視化操作”Visualize”
圖8.可視化選項
(三)可視化結(jié)果
圖9.菜單欄的工具功能簡介
1.關鍵詞共現(xiàn)圖譜的方法論基礎、含義及分析
共現(xiàn)分析的方法論基礎是心理學的鄰近聯(lián)系法則和知識結(jié)構(gòu)及映射原則。鄰近聯(lián)系法則是指曾經(jīng)在一起感受過的對象往往在想象中也聯(lián)系在一起,以致于想起它們中的某一個的時候,其他的對象也會以曾經(jīng)同時出現(xiàn)時的順序想起。關鍵詞共現(xiàn)、作者共現(xiàn)、機構(gòu)共現(xiàn)、國家共現(xiàn)、論文共現(xiàn)、期刊共現(xiàn)都是共現(xiàn)分析的一種。其中,作者共現(xiàn)分為作者合作網(wǎng)絡分析、作者共被引分析[作者同被引];機構(gòu)共現(xiàn)分為機構(gòu)合作網(wǎng)絡分析;國家共現(xiàn)又分為國家合作網(wǎng)絡分析;論文共現(xiàn)分為文獻共被引分析[文獻同被引]和文獻耦合。
參數(shù)中可以看見網(wǎng)絡的節(jié)點數(shù)、邊數(shù)和網(wǎng)絡密度。圖中所示標注的點即節(jié)點,一個節(jié)點代表一個關鍵詞。邊數(shù)是關鍵詞之間的連線數(shù),關鍵詞之間的連線是指關鍵詞在同一篇文獻中出現(xiàn)過,因此二者會有一根連線。圖中圓圈大小代表關鍵詞,頻數(shù)越大圓圈越大。線條代表關鍵詞之間的聯(lián)系,線條顏色與圖中上方的年份相對應,用于標志每年都有哪些關鍵詞。
關鍵詞是對一篇文獻的核心概況,分析關鍵詞可以對文章主題進行窺探。一篇文獻中的多個關鍵詞必然存在著某種聯(lián)系,那么這種聯(lián)系可以用共現(xiàn)的頻次來表示。一般認為,詞匯對同一篇文獻中出現(xiàn)的次數(shù)越多,則代表這兩個主題之間的聯(lián)系越緊密。頻次是關鍵詞出現(xiàn)的次數(shù),年份代表某個關鍵詞最早出現(xiàn)的年份是什么時候。其中閾值越小,顯示的數(shù)量越多;閾值越大顯示的關鍵詞越少。
綜上所述,共詞分析法,即利用文獻集中詞匯或者名詞短語共同出現(xiàn)的情況,來確定這篇文獻集所代表學科中各主題之間的關系。統(tǒng)計一組文獻的主題詞兩兩間在同一篇文獻出現(xiàn)的頻率,便可形成一個由這些詞對關聯(lián)所組成的共詞網(wǎng)絡。
2.聚類的功能
共詞分析法的原理是通過利用文獻集中詞匯對或名詞短語共同出現(xiàn)的情況,來確定該文獻集所代表學科中各主題之間的關系。掌握以上原理,是為了獲得學科之間各主題之間的關系,由于主題通過使用關鍵詞所表示,它的本質(zhì)便是關鍵詞之間的聯(lián)系。同時,聯(lián)系越緊密的關鍵詞會形成一個小團體,進而能把小團體之間的關鍵詞進行歸納總結(jié),然后總結(jié)出一個主題,再對主題進行詳細論述。以上操作步驟的本質(zhì)是做聚類分析。點擊”K”查看聚類,這一功能是當看不清或看不懂圖譜時可以利用的方法。
圖10.關鍵詞顯示
(聚類之間的間距可以在面板中調(diào)整)
需要補充的是,上圖并沒有顯示全部聚類,原因是CiteSpace默認當關鍵詞<10時,不顯示一部分聚類??梢栽?/span>”Filters”里取消”Show the Largest Connected Componet Only”這個選項,再重新聚類。也可以根據(jù)自己的需求設置確定數(shù)量的聚類,此時操作”Clusters”-”Show the Largest K Clusters”后輸入自己需要的所含關鍵詞最多的前幾個聚類數(shù);或者用序號來表示聚類。
圖11.部分聚類顯示
圖12.全部聚類顯示
三、教師駐校培養(yǎng)模式研究的計量學分析結(jié)果
(一)教師駐校培養(yǎng)模式研究文獻年度分布
文獻發(fā)表數(shù)量的變化能夠在一定程度上反映某一研究領域的發(fā)展狀況。研究對近二十年來我國教師駐校模式研究文獻的年度分布情況進行統(tǒng)計,詳見下圖。
(二)作者分布
對文獻作者情況進行計量學分析,不僅可以找出教師駐校培養(yǎng)模式研究領域的核心作者,也可以看出該領域?qū)W者之間的交流、合作情況。運行CitesSpace,設置時間跨度為“2000-2020年”,時間切片為1,節(jié)點類型中選擇“作者”,閾值為Top=50,關鍵詞引文數(shù)(C),關鍵詞被引數(shù)(CC)、關鍵詞共被引數(shù)(CCV)均設置為0、1、20,最終得到網(wǎng)絡節(jié)點為42,連線數(shù)為14,密度為0.0163的作者共現(xiàn)知識圖譜,詳見下圖。
四、教師駐校培養(yǎng)模式研究熱點分析
(一)研究熱點主題分析
關鍵詞是一篇文章核心內(nèi)容的凝練,且能反映這一領域的研究熱點。[2]本文采用CitesSpace對教師駐校培養(yǎng)模式研究文獻中出現(xiàn)的關鍵詞進行分析,以了解近二十年來我國教師駐校培養(yǎng)模式的研究熱點,繪制關鍵詞知識圖譜,詳見圖10。由圖可以看出熱點的詞匯有“教師教育”“教師培養(yǎng)”“駐校培養(yǎng)”“薄弱學?!薄俺鞘薪處燅v校模式”,且這些熱點詞匯之間的聯(lián)系也較為緊密。為進一步明確我國特殊教育教師研究熱點主題,將主題詞中介中心性及頻次導出并制作成表格,詳見表1。
表1 高頻關鍵詞頻次、中心性關鍵詞排序
序號 | 關鍵詞 | 頻次 | 序號 | 關鍵詞 | 中心性 |
1 | 教師教育 | 13 | 1 | 教師教育 | 0.51 |
2 | 美國 | 12 | 2 | 美國 | 0.38 |
3 | 城市教師駐校模式 | 5 | 3 | 培養(yǎng)模式 | 0.25 |
4 | 培養(yǎng)模式 | 4 | 4 | 城市教師駐校模式 | 0.15 |
5 | 駐校模式 | 4 | 5 | 薄弱學校 | 0.15 |
6 | 教師培養(yǎng) | 4 | 6 | 駐校教師 | 0.15 |
7 | 城市教師 | 3 | 7 | 教師培養(yǎng)模式 | 0.11 |
8 | 模式 | 3 | 8 | 教師培養(yǎng) | 0.09 |
9 | 城市校區(qū) | 3 | 9 | 教育碩士 | 0.09 |
10 | 薄弱學校 | 3 | 10 | 全日制教育碩士 | 0.08 |
中介中心性代表著以該關鍵詞為主題的研究對網(wǎng)絡圖譜中其他關鍵詞的中介效果,中介中心性越高,其影響越顯著。[3]因此,該研究將頻次與中介中心性共同作為研究熱點的判斷依據(jù)。頻次排名較高且中介性大于0.1的關鍵詞包括“教師教育”“美國”“培養(yǎng)模式”“城市教師駐校模式”“薄弱學?!薄敖處熍囵B(yǎng)模式”等。這些關鍵詞基本反應我國近二十年來教師駐校模式研究的熱點及核心主題。
(二)研究領域分析
關鍵詞聚類可將共現(xiàn)知識圖譜中復雜的連線關系進行分析,以形成當前教師駐校模式主要研究領域。在調(diào)節(jié)關鍵詞共現(xiàn)知識圖譜的基礎上,標識每個聚類,詳見圖11。第一個聚類為“城區(qū)教師駐校模式”。第二個聚類為“培養(yǎng)模式”。第三個聚類為“教師培養(yǎng)”。第四個聚類為“模式探析”。第五個聚類為“教師”。第六個聚類為“全日制教育碩士”。
五、教師駐校培養(yǎng)模式研究的演進路徑
在聚類圖的基礎上,選擇信息可視化中的時區(qū)視圖選項統(tǒng)計并繪制關鍵詞前沿時序圖譜,詳見圖13。關鍵詞突變用以顯示研究的前沿是什么,在本文中由于文獻數(shù)量太少無關鍵詞突變,可以判斷出在教師教育領域駐校模式的研究仍然較為分散,沒有成體系的研究初步嘗試期、鞏固發(fā)展期及繁榮發(fā)展期等連續(xù)性的過渡階段,因此想要通過預測該研究領域的演進路徑還較為困難。
圖13. 教師駐校培養(yǎng)模式關鍵詞前沿時序圖譜
參考文獻:
[1] 陳悅.引文空間分析原理與應用[M].科學出版社,2014.
[2] 李杰,陳超美. citespace:科技文本挖掘及可視化[M].首都經(jīng)濟貿(mào)易大學出版社,2016.
[3] 馮永剛,彭蘭香.近十五年我國德育研究熱點及前沿趨勢探微——基于文獻計量學和科學知識圖譜的可視化分析[J].山東師范大學學報(人文社會科學版),2018,63(05):70-82.
[4] Chaomei Chen. Science Mapping:A Systematic Review of the Literature[J]. Journal of Data and Information Science,2017,2(2):1-40.
[5] Chaomei Chen,Zhigang Hu,Shengbo Liu & Hung Tseng. Emerging trends in regenerative medicine:A scientometric analysis in CiteSpace [J]. Expert Opinionon Biological Therapy,2012, 12(5): 593-608.
信息計量學|CiteSpace使用教程(https://www.jianshu.com/p/49d41d0ccd7f)
聯(lián)系客服