一、算法設(shè)計(jì)
Python 的數(shù)據(jù)結(jié)構(gòu),算法和設(shè)計(jì)模式的實(shí)現(xiàn)。另請(qǐng)參閱真棒算法。
演算法
algorithms 數(shù)據(jù)結(jié)構(gòu)和算法的最小示例。
https://github.com/keon/algorithms
python-ds 用于采訪采訪的數(shù)據(jù)結(jié)構(gòu)和算法的集合。
https://github.com/prabhupant/python-ds
sortedcontainers 排序集合的快速和純 Python 實(shí)現(xiàn)。
https://github.com/grantjenks/python-sortedcontainers
TheAlgorithms- 用 Python 實(shí)現(xiàn)的所有算法。
https://github.com/TheAlgorithms/Python
設(shè)計(jì)模式
PyPattyrn- 一個(gè)簡(jiǎn)單但有效的庫,用于實(shí)現(xiàn)常見的設(shè)計(jì)模式。
https://github.com/tylerlaberge/PyPattyrn
python-patterns -Python 中設(shè)計(jì)模式的集合。
https://github.com/faif/python-patterns
transitions - 一種輕量級(jí)的,面向?qū)ο蟮挠邢逘顟B(tài)機(jī)實(shí)現(xiàn)。
https://github.com/pytransitions/transitions
二、聲音、視頻、圖像、文字處理
用于處理音頻及其元數(shù)據(jù)的庫。
聲音的
audioread- 跨庫(GStreamer + 核心音頻 + MAD + FFmpeg)音頻解碼。
https://github.com/beetbox/audioread
dejavu- 音頻指紋識(shí)別。
https://github.com/worldveil/dejavu
kapre - Keras 音頻預(yù)處理器
https://github.com/keunwoochoi/kapre
librosa- 用于音頻和音樂分析的 Python 庫
https://github.com/librosa/librosa
matchering - 一個(gè)用于自動(dòng)參考音頻制作的庫。
https://github.com/sergree/matchering
mingus- 帶有 MIDI 文件和播放支持的高級(jí)音樂理論和樂譜包。
http://bspaans.github.io/python-mingus/
pyAudioAnalysis- 音頻特征提取,分類,分段和應(yīng)用。
https://github.com/tyiannak/pyAudioAnalysis
pydub- 使用簡(jiǎn)單易用的高級(jí)界面處理音頻。
https://github.com/jiaaro/pydub
TimeSide- 開放的 Web 音頻處理框架。
https://github.com/Parisson/TimeSide
Metadata
beets- 音樂庫管理器和 MusicBrainz 標(biāo)記器。
https://github.com/beetbox/beets
eyeD3- 一種用于處理音頻文件的工具,特別是包含 ID3 元數(shù)據(jù)的 MP3 文件。
https://github.com/nicfit/eyeD3
mutagen- 處理音頻元數(shù)據(jù)的 Python 模塊。
https://github.com/quodlibet/mutagen
tinytag- 用于讀取 MP3,OGG,F(xiàn)LAC 和 Wave 文件的音樂元數(shù)據(jù)的庫。
https://github.com/devsnd/tinytag
用于處理視頻和 GIF 的庫。
moviepy- 用于基于腳本的電影編輯的模塊,具有多種格式,包括動(dòng)畫 GIF。
https://zulko.github.io/moviepy/
scikit-video -SciPy 的視頻處理例程。
https://github.com/aizvorski/scikit-video
vidgear- 最強(qiáng)大的多線程視頻處理框架。
https://github.com/abhiTronix/vidgear
用于處理圖像的庫。
hmap- 圖像直方圖重新映射。
https://github.com/rossgoodwin/hmap
imgSeek- 使用視覺相似性搜索圖像集合的項(xiàng)目。
https://sourceforge.net/projects/imgseek/
nude.py- 裸露檢測(cè)。
https://github.com/hhatto/nude.py
pagan - 復(fù)古 identicon(阿凡達(dá))根據(jù)輸入的字符串和哈希生成。
https://github.com/daboth/pagan
pillow- 枕頭是友好的 PIL 叉。
https://github.com/python-pillow/Pillow
python- barcode - 在 Python 中創(chuàng)建條形碼,沒有任何額外的依賴關(guān)系。
https://github.com/WhyNotHugo/python-barcode
pygram- 類似 Instagram 的圖像過濾器。
https://github.com/ajkumar25/pygram
PyMatting -Alpha 遮罩的庫。
http://github.com/pymatting/pymatting
python-qrcode- 一個(gè)純 Python QR Code 生成器。
https://github.com/lincolnloop/python-qrcode
pywal- 一種從圖像生成配色方案的工具。
https://github.com/dylanaraps/pywal
pyvips- 具有低內(nèi)存需求的快速圖像處理庫。
https://github.com/libvips/pyvips
Quads - 基于四叉樹的計(jì)算機(jī)藝術(shù)。
https://github.com/fogleman/Quads
scikit-image- 用于(科學(xué))圖像處理的 Python 庫。
http://scikit-image.org/
thumbor- 智能影像服務(wù)。它可以按需裁剪,調(diào)整圖像大小和翻轉(zhuǎn)圖像。
https://github.com/thumbor/thumbor
wand - MagickWand 的 Python 綁定,ImageMagick 的 C API。
https://github.com/dahlia/wand
用于解析和處理純文本的庫。
一般的
chardet- 與 Python 2/3 兼容的字符編碼檢測(cè)器。
https://github.com/chardet/chardet
difflib-(Python 標(biāo)準(zhǔn)庫)用于計(jì)算增量的幫助程序。
https://docs.python.org/3/library/difflib.html
ftfy- 自動(dòng)使 Unicode 文本更清晰,更一致。
https://github.com/LuminosoInsight/python-ftfy
Fuzzywuzzy- 模糊字符串匹配。
https://github.com/seatgeek/fuzzywuzzy
Levenshtein- 快速計(jì)算 Levenshtein 距離和字符串相似度。
https://github.com/ztane/python-Levenshtein/
pangu.py- 偏執(zhí)的文字間距。
https://github.com/vinta/pangu.py
pyfiglet- 用 Python 編寫的 figlet 的實(shí)現(xiàn)。
https://github.com/pwaller/pyfiglet
pypinyin- 將漢字(Hanzi)轉(zhuǎn)換為拼音(Pyyin)。
https://github.com/mozillazg/python-pinyin
textdistance- 使用 30 多種算法計(jì)算序列之間的距離。
https://github.com/orsinium/textdistance
unidecode -Unicode 文本的 ASCII 音譯。
https://pypi.org/project/Unidecode/
Slugify
awesome-slugify- 一個(gè)可以保留 unicode 的 Python slugify 庫。
https://github.com/dimka665/awesome-slugify
python-slugify- 一個(gè) Python slugify 庫,它將 unicode 轉(zhuǎn)換為 ASCII。
https://github.com/un33k/python-slugify
unicode-slugify- 一種 Slugifier,它以 Django 為依賴項(xiàng)生成 unicode slug。
https://github.com/mozilla/unicode-slugify
唯一標(biāo)識(shí)符
hashids- 在 Python 中實(shí)現(xiàn) hashids。
https://github.com/davidaurelio/hashids-python
shortuuid- 簡(jiǎn)潔,明確和 URL 安全的 UUID 的生成器庫。
https://github.com/skorokithakis/shortuuid
解析器
ply - 的 lex 和 yacc 解析工具的 Python 實(shí)現(xiàn)。
https://github.com/dabeaz/ply
pygments- 通用語法熒光筆。
http://pygments.org/
pyparsing- 生成解析器的通用框架。
https://github.com/pyparsing/pyparsing
python-nameparser - 將人名解析為它們的各個(gè)組成部分。
https://github.com/derek73/python-nameparser
python-phonenumbers- 解析,格式化,存儲(chǔ)和驗(yàn)證國際電話號(hào)碼。
https://github.com/daviddrysdale/python-phonenumbers
python-user-agents- 瀏覽器用戶代理解析器。
https://github.com/selwin/python-user-agents
sqlparse- 一個(gè)非驗(yàn)證的 SQL 解析器。
https://github.com/andialbrecht/sqlparse
三、日期和時(shí)間
用于處理日期和時(shí)間的庫。
Arrow- 一個(gè) Python 庫,提供了一種明智且人性化的方法來創(chuàng)建,操作,格式化和轉(zhuǎn)換日期,時(shí)間和時(shí)間戳。
https://arrow.readthedocs.io/en/latest/
Chronyk- 一個(gè) Python 3 庫,用于解析人類編寫的時(shí)間和日期。
https://github.com/KoffeinFlummi/Chronyk
dateutil- 標(biāo)準(zhǔn) Python datetime 模塊的擴(kuò)展。
https://github.com/dateutil/dateutil
delorean- 一個(gè)庫,用于清除與日期時(shí)間有關(guān)的不便的事實(shí)。
https://github.com/myusuf3/delorean/
maya- 人類的日期時(shí)間。
https://github.com/timofurrer/maya
moment - 一個(gè) Python 庫用于處理日期 / 時(shí)間。受到 Moment.js 的啟發(fā)。
https://github.com/zachwill/moment
Pendulum-Python 日期時(shí)間變得容易。
https://github.com/sdispater/pendulum
PyTime- 一個(gè)易于使用的 Python 模塊,旨在按字符串操作日期 / 時(shí)間 / 日期時(shí)間。
https://github.com/shinux/PyTime
pytz- 世界時(shí)區(qū)定義,現(xiàn)代和歷史。將 tz 數(shù)據(jù)庫帶入 Python。
https://launchpad.net/pytz
when.py- 提供用戶友好的功能來幫助執(zhí)行常見的日期和時(shí)間操作。
https://github.com/dirn/When.py
四、爬蟲
自動(dòng)執(zhí)行 Web 抓取。
cola- 分布式抓取框架。
https://github.com/chineking/cola
feedparser- 通用供稿解析器。
https://pythonhosted.org/feedparser/
grab - 網(wǎng)站抓取框架。
https://github.com/lorien/grab
MechanicalSoup- 用于自動(dòng)與網(wǎng)站進(jìn)行交互的 Python 庫。
https://github.com/MechanicalSoup/MechanicalSoup
portia - Scrapy 的視覺抓取。
https://github.com/scrapinghub/portia
pyspider- 強(qiáng)大的蜘蛛系統(tǒng)。
https://github.com/binux/pyspider
robobrowser- 一個(gè)簡(jiǎn)單的 Pythonic 庫,無需獨(dú)立的 Web 瀏覽器即可瀏覽 Web。
https://github.com/jmcarp/robobrowser
scrapy- 快速的高級(jí)屏幕抓取和網(wǎng)絡(luò)爬網(wǎng)框架。
https://scrapy.org/
用于提取 Web 內(nèi)容的庫。
html2text- 將 HTML 轉(zhuǎn)換為 Markdown 格式的文本。
https://github.com/Alir3z4/html2text
lassie- 人類的 Web 內(nèi)容檢索。
https://github.com/michaelhelmick/lassie
micawber- 一個(gè)小型庫,用于從 URL 中提取豐富的內(nèi)容。
https://github.com/coleifer/micawber
newspaper -Python 中的新聞提取,文章提取和內(nèi)容管理。
https://github.com/codelucas/newspaper
python- readability - arc90 的可讀性工具的快速 Python 端口。
https://github.com/buriy/python-readability
requests-html –適用于人類的 Pythonic HTML 解析。
https://github.com/psf/requests-html
sumy- 自動(dòng)匯總文本文檔和 HTML 頁面的模塊。
https://github.com/miso-belica/sumy
textract- 從任何文檔,Word,PowerPoint,PDF 等中提取文本
https://github.com/deanmalmgren/textract
toapi- 每個(gè)網(wǎng)站都提供 API。
https://github.com/gaojiuli/toapi
五、HTML、XML
用于處理 HTML 和 XML 的庫。
BeautifulSoup- 提供 Pythonic 慣用法來迭代,搜索和修改 HTML 或 XML。
bleach –基于白名單 HTML 清理和文本 linkification 庫中的。
cssutils- 一個(gè) Python 的 CSS 庫。
html5lib- 一個(gè)符合標(biāo)準(zhǔn)的庫,用于解析和序列化 HTML 文檔和片段。
lxml- 一個(gè)非??焖?,易于使用的通用庫,用于處理 HTML 和 XML。
MarkupSafe- 為 Python 實(shí)現(xiàn) XML / HTML / XHTML 標(biāo)記安全字符串。
pyquery- 用于解析 HTML 的類似 jQuery 的庫。
untangle –將 XML 文檔轉(zhuǎn)換為 Python 對(duì)象,以方便訪問。
WeasyPrint- 用于 HTML 和 CSS 的可視渲染引擎,可以導(dǎo)出為 PDF。
xmldataset- 簡(jiǎn)單的 XML 解析。
xmltodict- 使用 XML 就像使用 JSON。
六、HTTP 客戶端
使用 HTTP 的庫。
grequests- 異步 HTTP 請(qǐng)求的 request + gevent。
httplib2- 全面的 HTTP 客戶端庫。
httpx- 用于 Python 的下一代 HTTP 客戶端。
requests -HTTP 對(duì)人類的請(qǐng)求。
treq -Python 請(qǐng)求,例如在 Twisted 的 HTTP 客戶端之上構(gòu)建的 API。
七、office 模塊
用于解析和處理特定文本格式的庫。
General
tablib -XLS,CSV,JSON,YAML 中的表格數(shù)據(jù)集的模塊。
Office
docxtpl- 通過 jinja2 模板編輯 docx 文檔
openpyxl- 用于讀取和寫入 Excel 2010 xlsx /xlsm/xltx /xltm 文件的庫。
pyexcel- 提供一個(gè)用于讀取,操作和寫入 csv,ods,xls,xlsx 和 xlsm 文件的 API。
python-docx- 讀取,查詢和修改 Microsoft Word 2007/2008 docx 文件。
python-pptx- 用于創(chuàng)建和更新 PowerPoint(.pptx)文件的 Python 庫。
unoconv- 在 LibreOffice / OpenOffice 支持的任何文檔格式之間轉(zhuǎn)換。
XlsxWriter- 一個(gè)用于創(chuàng)建 Excel .xlsx 文件的 Python 模塊。
xlwings -BSD 許可的庫,可以輕松地從 Excel 調(diào)用 Python,反之亦然。
xlwt / xlrd- 從 Excel 文件寫入和讀取數(shù)據(jù)以及格式化信息。
PDF 格式
PDFMiner- 一種從 PDF 文檔提取信息的工具。
PyPDF2- 一個(gè)能夠拆分,合并和轉(zhuǎn)換 PDF 頁面的庫。
ReportLab- 允許快速創(chuàng)建豐富的 PDF 文檔。
Markdown
Mistune-Markdown 最快,功能最全的純 Python 解析器。
Python-Markdown -John Gruber 的 Markdown 的 Python 實(shí)現(xiàn)。
YAML
PyYAML- 適用于 Python 的 YAML 實(shí)現(xiàn)。
CSV
csvkit- 轉(zhuǎn)換為 CSV 并使用 CSV 的實(shí)用程序。
Archive
unp- 一個(gè)命令行工具,可以輕松地解壓縮檔案。
八、序列化
用于序列化復(fù)雜數(shù)據(jù)類型的庫
marshmallow- 一個(gè)輕量級(jí)的庫,用于將復(fù)雜的對(duì)象與簡(jiǎn)單的 Python 數(shù)據(jù)類型相互轉(zhuǎn)換。
pysimdjson - 一個(gè) Python 綁定 simdjson。
python-rapidjson- 一個(gè) Python 包裝周圍 RapidJSON。
ultrajson- 使用 Python 綁定用 C 編寫的快速 JSON 解碼器和編碼器。
九、代碼分析、測(cè)試
碼質(zhì)量檢查器的工具。另請(qǐng)參閱令人敬畏的靜態(tài)分析。
代碼分析
Coala- 語言獨(dú)立且易于擴(kuò)展的代碼分析應(yīng)用程序。
code2flow- 將您的 Python 和 JavaScript 代碼轉(zhuǎn)換為 DOT 流程圖。
prospector- 分析 Python 代碼的工具。
pycallgraph- 一個(gè)可視化 Python 應(yīng)用程序流程(調(diào)用圖)的庫。
vulture- 查找和分析無效的 Python 代碼的工具。
Code Linters
flake8 - 一個(gè)包裝器 pycodestyle,pyflakes 和麥凱布。
很棒的片狀 8 擴(kuò)展
pylama- 用于 Python 和 JavaScript 的代碼審核工具。
pylint- 完全可定制的源代碼分析器。
wemake-python-styleguide- 有史以來最嚴(yán)格,最自以為是的 python linter。
代碼格式化程序
black –毫不妥協(xié)的 Python 代碼格式化程序。
isort- 用于對(duì)導(dǎo)入進(jìn)行排序的 Python 實(shí)用程序 / 庫。
yapf- 另一個(gè)來自 Google 的 Python 代碼格式化程序。
靜態(tài)類型檢查器,另請(qǐng)參見 awesome-python-typing
mypy- 在編譯期間檢查變量類型。
pyre-check- 性能類型檢查。
typeshed- 具有靜態(tài)類型的 Python 庫存根的集合。
靜態(tài)類型注釋生成器
MonkeyType- 一個(gè)用于 Python 的系統(tǒng),通過收集運(yùn)行時(shí)類型來生成靜態(tài)類型注釋。
pyannotate- 自動(dòng)生成 PEP-484 注釋。
pytype -pytype 檢查并推斷 Python 代碼的類型 - 無需類型注釋。
滲透測(cè)試的框架和工具。
fsociety- 滲透測(cè)試框架。
setoolkit- 社會(huì)工程的工具包。
sqlmap- 自動(dòng) SQL 注入和數(shù)據(jù)庫接管工具。
用于測(cè)試代碼庫和生成測(cè)試數(shù)據(jù)的庫。
測(cè)試框架
hypothesis –假設(shè)是一個(gè)高級(jí)的 Quickcheck 樣式基于屬性的測(cè)試庫。
nose2 -nose 基于 `unittest2。的后繼者。
pytest- 一個(gè)成熟的功能齊全的 Python 測(cè)試工具。
Robot Framework 通用的測(cè)試自動(dòng)化框架。
unittest-(Python 標(biāo)準(zhǔn)庫)單元測(cè)試框架。
測(cè)試選手
green - 干凈,多彩的測(cè)試運(yùn)行器。
mamba -Python 的權(quán)威測(cè)試工具。生于 BDD 的旗幟下。
tox- 自動(dòng)構(gòu)建和測(cè)試多個(gè) Python 版本的發(fā)行版
GUI / Web 測(cè)試
locust- 用 Python 編寫的可擴(kuò)展用戶負(fù)載測(cè)試工具。
PyAutoGUI -PyAutoGUI 是適用于人類的跨平臺(tái) GUI 自動(dòng)化 Python 模塊。
Schemathesis- 用于對(duì)基于 Open API / Swagger 規(guī)范構(gòu)建的 Web 應(yīng)用程序進(jìn)行基于屬性的自動(dòng)測(cè)試的工具。
Selenium - Selenium WebDriver 的 Python 綁定。
sixpack- 與語言無關(guān)的 A / B 測(cè)試框架。
splinter- 用于測(cè)試 Web 應(yīng)用程序的開源工具。
Mock
doublex- 強(qiáng)大的 Python 測(cè)試框架加倍。
Frozengun- 通過模擬 datetime 模塊來穿越時(shí)間。
httmock- 一個(gè)針對(duì) Python 2.6 + 和 3.2 + 的請(qǐng)求的模擬庫。
httpretty- 適用于 Python 的 HTTP 請(qǐng)求模擬工具。
mock-(Python 標(biāo)準(zhǔn)庫)一個(gè)模擬和修補(bǔ)庫。
mocket - 具有 gevent /asyncio/ SSL 支持的套接字模擬框架。
responses 一個(gè)實(shí)用程序庫,用于模擬請(qǐng)求 Python 庫。
VCR.py- 記錄并重放測(cè)試中的 HTTP 交互。
對(duì)象工廠
factory_boy -Python 的測(cè)試裝置替代品。
mixer- 另一種燈具更換。支持 Django,F(xiàn)lask,SQLAlchemy,Peewee 等
model_mommy- 創(chuàng)建隨機(jī)夾具以在 Django 中進(jìn)行測(cè)試。
代碼覆蓋率
coverage- 代碼覆蓋率度量。
偽數(shù)據(jù)
fake2db- 偽數(shù)據(jù)庫生成器。
faker- 一個(gè)生成偽造數(shù)據(jù)的 Python 包。
mimesis- 是一個(gè) Python 庫,可幫助您生成虛假數(shù)據(jù)。
radar - 生成隨機(jī)的日期時(shí)間 / 時(shí)間。
用于驗(yàn)證數(shù)據(jù)的庫。
Cerberus- 一個(gè)輕量級(jí)和可擴(kuò)展的數(shù)據(jù)驗(yàn)證庫。
colander- 驗(yàn)證和反序列化通過 XML,JSON 和 HTML 表單發(fā)布獲得的數(shù)據(jù)。
jsonschema - Python 的 JSON 模式的實(shí)現(xiàn)。
schema- 用于驗(yàn)證 Python 數(shù)據(jù)結(jié)構(gòu)的庫。
Schematics –數(shù)據(jù)結(jié)構(gòu)驗(yàn)證。
valideer - 輕量級(jí)可擴(kuò)展數(shù)據(jù)驗(yàn)證和適配庫。
voluptuous - 的 - 一個(gè) Python 數(shù)據(jù)驗(yàn)證庫。
十、web 框架
傳統(tǒng)的全棧 Web 框架。另請(qǐng)參閱 RESTful API。
同步
Django -Python 中最流行的 Web 框架。
很棒的 django
很棒的 django
Flask -Python 的微框架。
很棒的燒瓶
Pyramid- 一個(gè)小型,快速,扎實(shí)的開源 Python Web 框架。
真棒金字塔
Masonite- 以開發(fā)人員為中心的現(xiàn)代 Python Web 框架。
異步
Tornado- 一個(gè) Web 框架和異步網(wǎng)絡(luò)庫。
十一、搜索
用于對(duì)數(shù)據(jù)建立索引并執(zhí)行搜索查詢的庫和軟件。
django-haystack- 模塊化搜索 Django。
elasticsearch-dsl-py -Elasticsearch 的官方高級(jí) Python 客戶端。
elasticsearch-py - Elasticsearch 的官方低層 Python 客戶端。
pysolr - Apache Solr 的輕量級(jí) Python 包裝器。
whoosh- 一個(gè)快速的純 Python 搜索引擎庫。
十二、日志記錄
用于生成和使用日志的庫。
logbook - - 記錄 Python 的替換記錄。
logging-(Python 標(biāo)準(zhǔn)庫)Python 的日志記錄工具。
loguru- 旨在以 Python 帶來令人愉悅的日志記錄的庫。
sentry- python - 適用于 Python 的 Sentry SDK。
structlog- 結(jié)構(gòu)化日志變得容易。
十三、并發(fā)與并行
用于并發(fā)和并行執(zhí)行的庫。另請(qǐng)參閱 awesome-asyncio。
parallel.futures-(Python 標(biāo)準(zhǔn)庫)用于異步執(zhí)行可調(diào)用對(duì)象的高級(jí)接口。
eventlet- 具有 WSGI 支持的異步框架。
gevent- 使用 greenlet 的基于協(xié)程的 Python 網(wǎng)絡(luò)庫。
multiprocessing-(Python 標(biāo)準(zhǔn)庫)基于進(jìn)程的并行性。
scoop -Python 中的可伸縮并發(fā)操作。
uvloop - 在.NET 之上的 asyncio 事件循環(huán)的超快速實(shí)現(xiàn) libuv。
十四、任務(wù)隊(duì)列
用于處理任務(wù)隊(duì)列的庫。
celery- 基于分布式消息傳遞的異步任務(wù)隊(duì)列 / 作業(yè)隊(duì)列。
Dramatiq- 用于 Python 3 的快速可靠的后臺(tái)任務(wù)處理庫。
huey- 小多線程任務(wù)隊(duì)列。
mrq- 使用 Redis 和 gevent 的 Python 中的分布式工作者任務(wù)隊(duì)列。
rq -Python 的簡(jiǎn)單作業(yè)隊(duì)列。
十五、自然語言處理
用于使用人類語言的圖書館。
一般的
gensim- 人類主題建模。
langid.py- 獨(dú)立的語言識(shí)別系統(tǒng)。
nltk- 用于構(gòu)建 Python 程序以使用人類語言數(shù)據(jù)的領(lǐng)先平臺(tái)。
pattern- 一個(gè) Web 挖掘模塊。
polyglot- 支持?jǐn)?shù)百種語言的自然語言管道。
pytext 的 - 基于 PyTorch 自然語言建??蚣堋?/span>
PyTorch-NLP- 一種工具包,可用于研究的快速深度學(xué)習(xí) NLP 原型。
spacy - 一種用于 Python 和用 Cython 工業(yè)強(qiáng)度的自然語言處理庫。
Stanza -Stanford NLP Group 的官方 Python 庫,支持 60 多種語言。
中國人
funNLP- 中國 NLP 的工具和數(shù)據(jù)集的集合。
jieba- 最受歡迎的中文文本分割庫。
pkuseg-python- 用于各種領(lǐng)域的中文分詞的工具包。
snownlp- 用于處理中文文本的庫。
十六、深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺
神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)框架。另請(qǐng)參閱真棒深度學(xué)習(xí)。
caffe- 深度學(xué)習(xí)的快速開放框架。
keras- 一個(gè)高級(jí)神經(jīng)網(wǎng)絡(luò)庫,能夠在 TensorFlow 或 Theano 之上運(yùn)行。
mxnet- 專為效率和靈活性而設(shè)計(jì)的深度學(xué)習(xí)框架。
pytorch- 具有強(qiáng)大 GPU 加速功能的 Python 中的張量和動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)。
SerpentAI- 游戲代理框架。使用任何視頻游戲作為深度學(xué)習(xí)沙箱。
tensorflow- 由 Google 創(chuàng)建的最受歡迎的深度學(xué)習(xí)框架。
Theano- 一個(gè)用于快速數(shù)值計(jì)算的庫。
機(jī)器學(xué)習(xí)圖書館。另請(qǐng)參閱很棒的機(jī)器學(xué)習(xí)。
健身房 - 用于開發(fā)和比較強(qiáng)化學(xué)習(xí)算法的工具包。
H2O- 開源快速可擴(kuò)展機(jī)器學(xué)習(xí)平臺(tái)。
指標(biāo) - 機(jī)器學(xué)習(xí)評(píng)估指標(biāo)。
NuPIC -Numenta 智能計(jì)算平臺(tái)。
scikit-learn- 最受歡迎的機(jī)器學(xué)習(xí) Python 庫。
Spark ML - Apache Spark 的可擴(kuò)展機(jī)器學(xué)習(xí)庫。
vowpal_porpoise- 用于 Vowpal Wabbit 的輕量級(jí) Python 包裝器。
xgboost- 一個(gè)可擴(kuò)展,可移植和分布式的梯度增強(qiáng)庫。
MindsDB -MindsDB 是現(xiàn)有數(shù)據(jù)庫的開源 AI 層,可讓您使用標(biāo)準(zhǔn)查詢輕松地開發(fā),訓(xùn)練和部署最新的機(jī)器學(xué)習(xí)模型。
計(jì)算機(jī)視覺圖書館。
EasyOCR- 支持 40 多種語言的即用型 OCR。
人臉識(shí)別 - 簡(jiǎn)單的人臉識(shí)別庫。
Kornia - PyTorch 的開源可區(qū)分計(jì)算機(jī)視覺庫。
OpenCV- 開源計(jì)算機(jī)視覺庫。
pytesseract - Google Tesseract OCR 的包裝。
SimpleCV- 用于構(gòu)建計(jì)算機(jī)視覺應(yīng)用程序的開源框架。
tesserocr-tesseract-ocr 用于 OCR 的 API 的另一種簡(jiǎn)單,對(duì)枕頭友好的包裝。
十七、數(shù)據(jù)分析、可視化
用于數(shù)據(jù)分析的庫。
AWS Data Wrangler -AWS 上的 Pandas。
Blaze -NumPy 和 Pandas 連接到大數(shù)據(jù)。
Pandas 界面中的 Open Mining- 商業(yè)智能(BI)。
Optimus –敏捷數(shù)據(jù)科學(xué)的工作流程變得容易與 PySpark。
Orange –通過可視化編程或腳本進(jìn)行數(shù)據(jù)挖掘,數(shù)據(jù)可視化,分析和機(jī)器學(xué)習(xí)。
Pandas- 一個(gè)提供高性能,易于使用的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具的庫。
用于可視化數(shù)據(jù)的庫。另請(qǐng)參閱 awesome-javascript。
Altair- 用于 Python 的聲明性統(tǒng)計(jì)可視化庫。
Bokeh- 用于 Python 的交互式 Web 繪圖。
bqplot -Jupyter Notebook 的交互式繪圖庫
Cartopy- 具有 matplotlib 支持的制圖 python 庫
短跑 - 建立在燒瓶頂部,反應(yīng),Plotly 旨在分析 Web 應(yīng)用程序。
很棒的破折號(hào)
圖表 - 圖表為代碼。
Matplotlib- 一個(gè) Python 2D 繪圖庫。
plotnine- 基于 ggplot2 的 Python 圖形語法。
Pygal- 一個(gè) Python SVG 圖表創(chuàng)建器。
PyGraphviz - Graphviz 的 Python 接口。
PyQtGraph- 交互式和實(shí)時(shí) 2D / 3D / 圖像繪制以及科學(xué) / 工程小部件。
Seaborn - 使用 Matplotlib 統(tǒng)計(jì)數(shù)據(jù)可視化。
VisPy- 基于 OpenGL 的高性能科學(xué)可視化。
十八、數(shù)據(jù)庫驅(qū)動(dòng)程序
用于連接和操作數(shù)據(jù)庫的庫。
MySQL- 很棒的 MySQL
mysqlclient- 支持 Python 3 的 MySQL 連接器(mysql-python fork)。
PyMySQL- 與 mysql-python 兼容的純 Python MySQL 驅(qū)動(dòng)程序。
PostgreSQL- 很棒的 Postgres
psycopg2- 最受歡迎的 Python PostgreSQL 適配器。
查詢 -psycopg2 庫的包裝,用于與 PostgreSQL 交互。
SQlite- 很棒的 SQLite
sqlite3-(Python 標(biāo)準(zhǔn)庫)與 DB-API 2.0 兼容的 SQlite 接口
SuperSQLite- 建立在 apsw 之上的增壓 SQLite 庫。
其他關(guān)系數(shù)據(jù)庫
pymssql -Microsoft SQL Server 的簡(jiǎn)單數(shù)據(jù)庫接口。
clickhouse-driver- 具有 ClickHouse 本地接口的 Python 驅(qū)動(dòng)程序。
NoSQL 數(shù)據(jù)庫
cassandra-driver -Apache Cassandra 的 Python 驅(qū)動(dòng)程序。
happybase -Apache HBase 的開發(fā)人員友好型庫。
kafka-python -Apache Kafka 的 Python 客戶端。
py2neo- 用于 Neo4j 的客戶端庫和工具包。
pymongo -MongoDB 的官方 Python 客戶端。
redis-py -Redis 的 Python 客戶端。
異步客戶端
motor -MongoDB 的異步 Python 驅(qū)動(dòng)程序。
十九、DevOps 工具
DevOps 的軟件和庫。
配置管理
ansible- 一個(gè)非常簡(jiǎn)單的 IT 自動(dòng)化平臺(tái)。
cloudinit- 一個(gè)多分發(fā)包,用于處理云實(shí)例的早期初始化。
OpenStack- 用于構(gòu)建私有和公共云的開源軟件。
pyinfra- 通用的 CLI 工具和 python 庫,可自動(dòng)執(zhí)行基礎(chǔ)架構(gòu)。
saltstack- 基礎(chǔ)結(jié)構(gòu)自動(dòng)化和管理系統(tǒng)。
SSH 樣式的部署
cuisine - 類似于 Fabric 的廚師功能。
fabric - 一個(gè)簡(jiǎn)單的,Python 化工具,用于遠(yuǎn)程執(zhí)行和部署。
fabtools- 編寫很棒的 Fabric 文件的工具。
流程管理
honcho - Foreman 的 Python 克隆,用于管理基于 Procfile 的應(yīng)用程序。
supervisor - 用于 UNIX 監(jiān)事過程控制系統(tǒng)。
監(jiān)控方式
psutil- 跨平臺(tái)的流程和系統(tǒng)實(shí)用程序模塊。
后備
BorgBackup- 具有壓縮和加密功能的重復(fù)數(shù)據(jù)刪除存檔器。
其他
docker- compose- 使用 Docker 的快速隔離開發(fā)環(huán)境。
二十、分布式計(jì)算
分布式計(jì)算的框架和庫。
批量處理
dask- 用于分析計(jì)算的靈活并行計(jì)算庫。
luigi- 一個(gè)模塊,可幫助您構(gòu)建批處理作業(yè)的復(fù)雜管道。
mrjob- 在 Hadoop 或 Amazon Web Services 上運(yùn)行 MapReduce 作業(yè)。
PySpark - Apache Spark Python API。
Ray- 用于并行和分布式 Python 的系統(tǒng),統(tǒng)一了機(jī)器學(xué)習(xí)生態(tài)系統(tǒng)。
流處理
faust- 流處理庫,將想法從 Kafka Streams 移植到 Python。
streamparse- 通過 Apache Storm 針對(duì)實(shí)時(shí)數(shù)據(jù)流運(yùn)行 Python 代碼。
二十一、配置、打包構(gòu)建
用于存儲(chǔ)和解析配置選項(xiàng)的庫。
configobj- 帶有驗(yàn)證的 INI 文件解析器。
configparser-(Python 標(biāo)準(zhǔn)庫)INI 文件解析器。
hydra -Hydra 是用于優(yōu)雅配置復(fù)雜應(yīng)用程序的框架。
profig- 使用值轉(zhuǎn)換從多種格式進(jìn)行配置。
python-decouple- 嚴(yán)格將設(shè)置與代碼分開。
用于創(chuàng)建打包的可執(zhí)行文件以進(jìn)行發(fā)行的庫。
dh-virtualenv- 以 Debian 軟件包的形式構(gòu)建和分發(fā) virtualenv。
Nuitka - 將腳本,模塊,程序包編譯為可執(zhí)行文件或擴(kuò)展模塊。
py2app- 凍結(jié) Python 腳本(Mac OS X)。
py2exe- 凍結(jié) Python 腳本(Windows)。
pyarmor- 一種用于混淆 python 腳本,將混淆后的腳本綁定到固定計(jì)算機(jī)或使混淆后的腳本失效的工具。
PyInstaller- 將 Python 程序轉(zhuǎn)換為獨(dú)立的可執(zhí)行文件(跨平臺(tái))。
pynsist- 用于構(gòu)建 Windows 安裝程序的工具,安裝程序?qū)?Python 本身捆綁在一起。
shiv- 命令行實(shí)用程序,用于構(gòu)建完全獨(dú)立的 zipapp(PEP 441),但包括其所有依賴項(xiàng)。
二十二、虛擬環(huán)境
用于 Python 版本和虛擬環(huán)境管理的庫。
pyenv- 簡(jiǎn)單的 Python 版本管理。
virtualenv- 創(chuàng)建隔離的 Python 環(huán)境的工具。
二十三、界面開發(fā)
用于處理圖形用戶界面應(yīng)用程序的庫。
curses - - 內(nèi)置包裝器 ncurses 的用于創(chuàng)建終端 GUI 的應(yīng)用程序。
Eel- 一個(gè)用于制作簡(jiǎn)單的類似于電子的脫機(jī) HTML / JS GUI 應(yīng)用程序的庫。
enaml- 使用聲明性語法(如 QML)創(chuàng)建漂亮的用戶界面。
Flexx -Flexx 是用于創(chuàng)建 GUI 的純 Python 工具包,它使用 Web 技術(shù)進(jìn)行呈現(xiàn)。
Gooey - 使用命令行將命令行程序轉(zhuǎn)換為完整的 GUI 應(yīng)用程序。
kivy- 用于創(chuàng)建 NUI 應(yīng)用程序的庫,可在 Windows,Linux,Mac OS X,Android 和 iOS 上運(yùn)行。
pyglet -Python 的跨平臺(tái)窗口和多媒體庫。
PyGObject -GLib / GObject / GIO / GTK +(GTK + 3)的 Python 綁定。
PyQt - Qt 跨平臺(tái)應(yīng)用程序和 UI 框架的 Python 綁定。
PySimpleGUI - tkinter,Qt,WxPython 和 Remi 的包裝。
pywebview- 圍繞 webview 組件的輕量級(jí)跨平臺(tái)本機(jī)包裝器。
Tkinter -Tkinter 是 Python 的事實(shí)上的標(biāo)準(zhǔn) GUI 軟件包。
Toga -Python 本機(jī),OS 本機(jī) GUI 工具箱。
urwid- 一個(gè)用于創(chuàng)建終端 GUI 應(yīng)用程序的庫,該庫對(duì)小部件,事件,豐富的顏色等具有強(qiáng)大的支持。
wxPython -wxWidgets C ++ 類庫與 Python 的混合。
DearPyGui- 一個(gè)簡(jiǎn)單的 GPU 加速的 Python GUI 框架
二十四、游戲開發(fā)
很棒的游戲開發(fā)庫。
Arcade -Arcade 是一個(gè)現(xiàn)代 Python 框架,用于制作具有引人注目的圖形和聲音的游戲。
Cocos2d -cocos2d 是用于構(gòu)建 2D 游戲,演示和其他圖形 / 交互應(yīng)用程序的框架。
Harfang3D- 用于 3D,VR 和游戲開發(fā)的 Python 框架。
Panda3D- 迪士尼開發(fā)的 3D 游戲引擎。
Pygame -Pygame 是一組旨在編寫游戲的 Python 模塊。
PyOgre -Ogre 3D 渲染引擎的 Python 綁定,可用于游戲,模擬或任何 3D。
PyOpenGL -OpenGL 及其相關(guān) API 的 Python ctypes 綁定。
PySDL2 -SDL2 庫的基于 ctypes 的包裝器。
RenPy- 一個(gè)視覺小說引擎
二十五、任務(wù)調(diào)度器
用于計(jì)劃作業(yè)的庫。
Airflow 氣流是一個(gè)以編程方式編寫,安排和監(jiān)視工作流的平臺(tái)。
APScheduler- 輕巧但功能強(qiáng)大的進(jìn)程內(nèi)任務(wù)計(jì)劃程序,可讓您計(jì)劃功能。
django-schedule -Django 的日歷應(yīng)用程序。
doit- 一個(gè)任務(wù)運(yùn)行器和構(gòu)建工具。
gunnery - 具有基于 Web 界面的分布式系統(tǒng)的多用途任務(wù)執(zhí)行工具。
Joblib- 一套在 Python 中提供輕量級(jí)流水線的工具。
Plan - 像用吊飾一樣用 Python 編寫 crontab 文件。
Prefect- 一個(gè)現(xiàn)代的工作流程編排框架,可輕松構(gòu)建,調(diào)度和監(jiān)視強(qiáng)大的數(shù)據(jù)管道。
schedule- 針對(duì)人類的 Python 作業(yè)調(diào)度。
Spiff- 用純 Python 實(shí)現(xiàn)的功能強(qiáng)大的工作流引擎。
TaskFlow- 一個(gè) Python 庫,可幫助簡(jiǎn)化,一致且可靠的任務(wù)執(zhí)行
二十六、科學(xué)計(jì)算
用于科學(xué)計(jì)算的圖書館。另請(qǐng)參見 Python for-Scientists。
astropy- 天文學(xué)的社區(qū) Python 庫。
bcbio-nextgen- 提供最佳實(shí)踐流水線,用于全自動(dòng)高通量測(cè)序分析。
bccb- 收集與生物學(xué)分析有關(guān)的有用代碼。
Biopython -Biopython 是一套免費(fèi)的生物計(jì)算工具。
cclib- 一個(gè)用于解析和解釋計(jì)算化學(xué)程序包結(jié)果的庫。
Colour - 實(shí)施大量的顏色理論轉(zhuǎn)換和算法。
Karate Club - 用于圖形結(jié)構(gòu)化數(shù)據(jù)的無監(jiān)督機(jī)器學(xué)習(xí)工具箱。
NetworkX- 用于復(fù)雜網(wǎng)絡(luò)的高生產(chǎn)率軟件。
NIPY- 神經(jīng)影像工具箱的集合。
NumPy- 使用 Python 進(jìn)行科學(xué)計(jì)算的基本軟件包。
ObsPy- 地震學(xué)的 Python 工具箱。
Open Babel- 一種化學(xué)工具箱,旨在講多種化學(xué)數(shù)據(jù)語言。
PyDy -Python Dynamics 的縮寫,用于協(xié)助工作流進(jìn)行動(dòng)態(tài)運(yùn)動(dòng)建模。
PyMC- 馬爾可夫鏈蒙特卡洛采樣工具包。
QuTiP -Python 中的 Quantum Toolbox。
RDKit- 化學(xué)信息學(xué)和機(jī)器學(xué)習(xí)軟件。
SciPy- 用于數(shù)學(xué),科學(xué)和工程的基于 Python 的開源軟件生態(tài)系統(tǒng)。
SimPy- 一個(gè)基于過程的離散事件模擬框架。
statsmodels -Python 中的統(tǒng)計(jì)建模和計(jì)量經(jīng)濟(jì)學(xué)。
SymPy- 一個(gè)用于符號(hào)數(shù)學(xué)的 Python 庫。
Zipline- 一個(gè) Pythonic 算法交易庫。
RPC
RPC 兼容服務(wù)器。
RPyC(遠(yuǎn)程 Python 調(diào)用)- 用于 Python 的透明且對(duì)稱的 RPC 庫
zeroRPC -zerorpc 是基于 ZeroMQ 和 MessagePack 的靈活 RPC 實(shí)現(xiàn)。
聯(lián)系客服