Py之nltk:nltk包的簡介、安裝、使用方法、代碼實(shí)現(xiàn)之詳細(xì)攻略
? ? ? ?NLTK is a leading platform for building Python programs to work with human language data. It provides easy-to-use interfaces to?over 50 corpora and lexical resources?such as WordNet, along with a suite of text processing libraries for classification, tokenization, stemming, tagging, parsing, and semantic reasoning, wrappers for industrial-strength NLP libraries, and an active?discussion forum.
?? ? ??NLTK是構(gòu)建用于處理人類語言數(shù)據(jù)的Python程序的領(lǐng)先平臺。它為超過50個語料庫和詞匯資源(如WordNet)提供了易于使用的界面,以及一套用于分類、標(biāo)記化技術(shù)、詞干、標(biāo)記、解析和語義推理的文本處理庫、工業(yè)級NLP庫的包裝器以及一個活躍的討論論壇。
? ? ? ?用Python進(jìn)行自然語言處理為語言處理的編程提供了一個實(shí)用的介紹。它由NLTK的創(chuàng)建者編寫,指導(dǎo)讀者完成編寫python程序、使用語料庫、對文本進(jìn)行分類、分析語言結(jié)構(gòu)等的基礎(chǔ)知識。這本書的在線版本已經(jīng)為python 3和nltk 3進(jìn)行了更新。
? ? ? 自然語言工具包(NLTK)是用于自然語言處理的Python包。NLTK需要python 2.7、3.4、3.5、3.6或3.7。
? ? ? NLTK(Natural Language ToolKit),是時下非常流行的在Python解釋器環(huán)境中用于自然語言處理的工具包。對于NLTK的使用者而言,它就像是一名極其高效的語言學(xué)家,為您快速完成對自然語言文本的深層處理和分析。
Natural Language Toolkit官網(wǎng)
nltk Package API
pip install nltk
from nltk.corpus import treebank
t = treebank.parsed_sents('wsj_0001.mrg')[0]
t.draw()
import nltk
sentence = """At eight o'clock on Thursday morning
tokens = nltk.word_tokenize(sentence)
print(tokens)
tagged = nltk.pos_tag(tokens)
print(tagged )
相關(guān)文章
NLP之BoW&NLTK:自然語言處理中常用的技術(shù)——詞袋法Bow、NLTK庫
聯(lián)系客服