大家普遍第一次接觸到的Python數(shù)據(jù)可視化庫基本上都是Matplotlib。Python還有很多數(shù)據(jù)可視化庫,本文盤點(diǎn)了12款常用的Python數(shù)據(jù)可視化庫,挑選適合自己業(yè)務(wù)的那一款吧!
深入學(xué)習(xí)Python商業(yè)數(shù)據(jù)可視化技術(shù),推薦閱讀《Python商業(yè)數(shù)據(jù)可視化實(shí)戰(zhàn)》。
▼
Python有很多數(shù)據(jù)可視化庫,這些數(shù)據(jù)可視化庫主要分為探索式可視化庫和交互式可視化庫。前者透過簡單直接的視覺圖形,更方便用戶看懂原數(shù)據(jù),后者主要用于與業(yè)務(wù)結(jié)合過程中展現(xiàn)總體分析結(jié)果。
探索式可視化庫
探索式分析最大的優(yōu)勢在于,可以讓業(yè)務(wù)人員在海量數(shù)據(jù)中“自由發(fā)揮”,不受數(shù)據(jù)模型的限制。通過探索式分析和可視化,業(yè)務(wù)人員可以快速發(fā)現(xiàn)業(yè)務(wù)中存在的問題。
Python探索式可視化庫主要包括如下幾個。
1Matplotlib
Matplotlib是Python數(shù)據(jù)可視化庫的元老,盡管它已有十多年的歷史,但仍然是Python社區(qū)中使用最廣泛的繪圖庫,編寫幾行代碼即可生成線圖、直方圖、功率譜密度圖、條形圖、錯誤圖、散點(diǎn)圖等。
Python的可視化庫眾多,各有各的特點(diǎn),但是Matplotlib是一個非?;A(chǔ)的Python可視化庫,如果需要學(xué)習(xí)Python數(shù)據(jù)可視化,那么Matplotlib是非學(xué)不可的,之后再學(xué)習(xí)其他庫就比較簡單了。Matplotlib的中文學(xué)習(xí)資料比較豐富,其中最好的學(xué)習(xí)資料是其官方網(wǎng)站的幫助文檔,大家可以在上面查閱自己感興趣的內(nèi)容。
2Seaborn
Seaborn利用Matplotlib的強(qiáng)大功能,只用幾行代碼就能創(chuàng)建出漂亮的圖表。它們的關(guān)鍵區(qū)別在于,Seaborn的默認(rèn)款式和調(diào)色板設(shè)計(jì)更加美觀和現(xiàn)代。由于Seaborn是在Matplotlib基礎(chǔ)上構(gòu)建的,因此用戶還需要了解Matplotlib以便調(diào)整Seaborn的默認(rèn)值。
Seaborn同Matplotlib一樣,也是Python進(jìn)行數(shù)據(jù)可視化分析的重要第三方包。
Seaborn在Matplotlib的基礎(chǔ)上進(jìn)行了更高級的API封裝,使用戶繪圖更加容易,所繪圖形更加漂亮。Seaborn是基于Matplotlib的一個模塊,專用于統(tǒng)計(jì)可視化,可以和Pandas進(jìn)行無縫連接,使可視化的初學(xué)者更容易上手。
相對于Matplotlib,Seaborn語法更簡潔,兩者的關(guān)系類似于Numpy和Pandas的關(guān)系。但是需要注意的是,應(yīng)該把Seaborn視為Matplotlib的補(bǔ)充,而不是替代物。
Seaborn庫旨在以數(shù)據(jù)可視化為中心來挖掘與理解數(shù)據(jù),它提供的面向數(shù)據(jù)集制圖函數(shù)主要是對行列索引和數(shù)組的操作,包含對整個數(shù)據(jù)集進(jìn)行內(nèi)部的語義映射與統(tǒng)計(jì)整合,以此生成信息豐富的圖表。
3Pyecharts
Pyecharts是我國開發(fā)人員開發(fā)的,相比較Matplotlib、Seaborn等可視化庫,Pyecharts十分符合國內(nèi)用戶的使用習(xí)慣。
Pyecharts的目的是實(shí)現(xiàn)Echarts與Python的對接,以便在Python中使用Echarts生成圖表。
Echarts是百度開源的一個數(shù)據(jù)可視化JavaScript庫,生成的圖的可視化效果非常好,其憑借良好的交互性,精巧的圖表設(shè)計(jì),得到了眾多開發(fā)者的認(rèn)可
4Missingno
處理缺失的數(shù)據(jù)是一件讓人痛苦的事,Missingno通過使用視覺摘要來快速評估數(shù)據(jù)集的完整性,而不是通過大篇幅的表格。它可以根據(jù)熱力圖或樹狀圖的完成度或點(diǎn)的相關(guān)度對數(shù)據(jù)進(jìn)行過濾和排序。
交互式可視化庫
數(shù)據(jù)可視化可以是靜態(tài)的也可以是交互的,交互式的數(shù)據(jù)可視化是指人們使用計(jì)算機(jī)和移動設(shè)備深入圖表和圖形的具體細(xì)節(jié),然后用交互的方式改變他們看到的數(shù)據(jù)。Python交互式可視化庫主要包括如下幾個。
1Bokeh
Bokeh基于JavaScript實(shí)現(xiàn)交互式可視化,它是原生Python語法,它可以在Web瀏覽器中實(shí)現(xiàn)美觀的視覺效果。
它的優(yōu)勢在于能夠創(chuàng)建交互式的網(wǎng)站圖,可以很容易地將數(shù)據(jù)輸出為JSON對象、HTML文檔或交互式Web應(yīng)用程序。Bokeh還支持流媒體和實(shí)時數(shù)據(jù)。
但是它也有明顯的缺點(diǎn):一是版本時常更新,最重要的是有時語法不向下兼容,這對于開發(fā)者來說是噩夢;二是語法晦澀,與Matplotlib相比,可以說是有過之而無不及。
2HoloViews
HoloViews是一個開源的Python庫,旨在使數(shù)據(jù)分析和可視化更加簡便,可以用非常少的代碼行完成數(shù)據(jù)分析和可視化。
除了默認(rèn)的Matplotlib后端,它還添加了一個Bokeh后端。結(jié)合Bokeh提供的交互式小部件,可以使用HTML5和WebGL快速生成交互式視圖,以及進(jìn)行高維數(shù)據(jù)的可視化探索。
3Plotly
Plotly是一個數(shù)據(jù)可視化的在線平臺,與Bokeh一樣,Plotly的強(qiáng)項(xiàng)在于制作交互式視圖,但它提供了一些在大多數(shù)庫中沒有的圖表,如等高線圖、樹狀圖和3D圖表??梢栽诰€繪制條形圖、散點(diǎn)圖、餅圖、直方圖等多種圖形,可以畫出很多媲美Tableau的高質(zhì)量圖。
Plotly支持在線編輯圖形,支持Python、JavaScript、MATLAB和R等多種語言的API。Plotly生成的所有圖表實(shí)際上都是由JavaScript產(chǎn)生的,無論是在瀏覽器還是在Jupyter中,所有的可視化、交互都是基于plotly.js的,它是一個高級的聲明性圖表庫,提供了20多種圖表類型,包含3D圖表、統(tǒng)計(jì)圖和SVG地圖等。
4pygal
與Bokeh和Plotly一樣,pygal提供了可以嵌入Web瀏覽器的交互式視圖。區(qū)別在于,它能夠?qū)D表輸出為SVG格式。如果用戶使用較小的數(shù)據(jù)集,則輸出位SVG格式的圖像就可以了,但是如果用戶制作的圖表包含數(shù)十萬個數(shù)據(jù)點(diǎn),那么它們就會很難被渲染并變得反應(yīng)遲鈍。
Pygal繪制線圖的方法很簡單,可以將圖表渲染為一個SVG文件,用戶使用瀏覽器打開SVG文件就可以查看生成的圖表。
5plotnine
plotnine是Python中圖形語法的一種實(shí)現(xiàn),它基于ggplot2包,語法繪圖功能強(qiáng)大,可以輕松將數(shù)據(jù)映射到構(gòu)成圖的可視對象,然后創(chuàng)建自定義的圖形。plotnine提供各種不同的可視化視圖,易于適應(yīng)定制化輸出,安裝十分簡單,用戶可以通過pip install plotnine命令直接安裝。
plotnine的優(yōu)點(diǎn)為代碼簡潔,易學(xué);繪制出的圖流暢大方;不需要很多的代碼就可以繪制出很不錯的圖。在使用plotnine繪圖之前,首先需要理解繪圖的基本概念。
6Altair
Altair是一個專為Python編寫,它可以讓數(shù)據(jù)科學(xué)家更多地關(guān)注數(shù)據(jù)本身和其內(nèi)在的聯(lián)系。
因?yàn)槭腔赩ega-Lite(交互式圖形語法)的聲明性統(tǒng)計(jì)可視化庫,Altair API具有簡單、友好、一致等特點(diǎn)。
聲明意味著用戶只需要提供數(shù)據(jù)列與編碼通道之間的鏈接,例如,x軸、y軸、顏色等,其余的繪圖細(xì)節(jié)它會自動處理。聲明使Altair變得簡單、友好和一致,用戶使用Altair可以輕松設(shè)計(jì)出有效且美觀的可視化代碼。
7ggplot
ggplot是基于R語言的ggplot2包和Python的繪圖系統(tǒng)。ggplot的運(yùn)行方式與Matplotlib不同,它允許用戶對組件進(jìn)行分層以創(chuàng)建完整的繪圖。例如,用戶可以從軸開始畫,然后添加點(diǎn),接著添加線、趨勢線等。雖然圖形語法被認(rèn)為是繪圖的“直觀”方法,但經(jīng)驗(yàn)豐富的Matplotlib用戶可能需要時間來適應(yīng)這個新的方式。
8Gleam
Gleam的靈感來自R語言的Shiny包。它允許用戶僅使用Python腳本就可將分析結(jié)果轉(zhuǎn)換為交互式Web應(yīng)用程序,因此用戶不必了解任何其他語言,如HTML、CSS或JavaScript。Gleam適用于任何Python數(shù)據(jù)可視化庫。在創(chuàng)建繪圖后,用戶可以在它的上面添加字段,以便對數(shù)據(jù)進(jìn)行篩選和排序。
圖書推薦
▊《Python商業(yè)數(shù)據(jù)可視化實(shí)戰(zhàn)(全彩)》
王國平 著
本書由淺入深、循序漸進(jìn)地介紹了基于Python的商業(yè)數(shù)據(jù)可視化技術(shù),并結(jié)合實(shí)際案例詳細(xì)介紹了Python在數(shù)據(jù)可視化方面的具體應(yīng)用。
重點(diǎn)介紹了Python的9個可視化庫,分別為Matplotlib、Seaborn、Pyecharts、Bokeh、HoloViews、Plotly、Pygal、plotnine、Altair,并介紹了商業(yè)數(shù)據(jù)可視化的思維。讀者通過學(xué)習(xí)本書,能夠輕松、快速地掌握商業(yè)數(shù)據(jù)可視化技術(shù)。
聯(lián)系客服