這里介紹2個(gè)python中文處理的包,分別是jieba和snownlp,這2個(gè)包處理起來(lái)中文都挺簡(jiǎn)單的,下面我簡(jiǎn)單介紹一下這2個(gè)包的安裝和使用,實(shí)驗(yàn)環(huán)境win10+python3.6+pycharm5.0,主要內(nèi)容如下:
jieba分詞:這個(gè)中文處理包比較常用,大部分都應(yīng)該聽說(shuō)過(guò),可以實(shí)現(xiàn)分詞、標(biāo)注詞性、提取關(guān)鍵詞等大部分功能,使用起來(lái)挺簡(jiǎn)單的,下面我簡(jiǎn)單介紹一下這個(gè)包:
1.下載安裝jieba,這里直接在cmd窗口輸入命令“pip install jieba”就行,如下:
2.測(cè)試代碼如下,這里主要演示了一下分詞、提取關(guān)鍵詞、標(biāo)注詞性等:
程序運(yùn)行截圖如下:
snownlp分詞:snownlp是python的一個(gè)中文處理包,受TextBlob算法啟發(fā)而寫,所有算法都是作者本人自己實(shí)現(xiàn),而且還帶了一些訓(xùn)練好的字典,下面我簡(jiǎn)單介紹一下這個(gè)包:
1.下載安裝snownlp,這里直接在cmd窗口輸入命令“pip install snownlp”就行,如下:
2.測(cè)試代碼如下,這里簡(jiǎn)單的測(cè)試一下分詞、標(biāo)注詞性、關(guān)鍵詞等:
程序運(yùn)行截圖如下:
至此,就完成了jieba和snownlp的這2個(gè)中文處理報(bào)的簡(jiǎn)單安裝和使用。總的來(lái)說(shuō),整個(gè)過(guò)程挺簡(jiǎn)單的,網(wǎng)上也有相關(guān)教程和資料可供參考,其實(shí)還有其他中文處理的包,像thulac,corenlp,pynlpir等,這里就不詳細(xì)介紹了,感興趣的可以搜一下,希望以上分享的內(nèi)容能對(duì)你有所幫助吧。
聯(lián)系客服