數(shù)據(jù)分析常用哪些Python包?這里將其總結(jié)如下,比如在數(shù)據(jù)清洗時(shí)使用到numpy和pandas包,數(shù)據(jù)可視化時(shí)使用matplotlib庫,matplotlib庫上手容易,更高級(jí)的學(xué)習(xí)seaborn庫,seaborn庫是改良matplotlib庫的圖表畫法,如果創(chuàng)建有交互性的圖表,可以使用Pyecharts庫。
Python的作用絕不僅僅只是做數(shù)據(jù)清洗和數(shù)據(jù)可視化,其作用還有很多,有許多意想不到的功能,這里僅僅舉例講講Python在數(shù)據(jù)分析中使用最多的幾個(gè)包,歡迎大家補(bǔ)充,下面一起來學(xué)習(xí)。
1、Numpy
官網(wǎng)https://www.numpy.org.cn/
NumPy是Python中科學(xué)計(jì)算的基礎(chǔ)包。它是一個(gè)Python庫,提供多維數(shù)組對(duì)象,各種派生對(duì)象,以及用于數(shù)組快速操作的各種API,有包括數(shù)學(xué)、邏輯、形狀操作、排序、選擇、輸入輸出、離散傅立葉變換、基本線性代數(shù),基本統(tǒng)計(jì)運(yùn)算和隨機(jī)模擬等等。
NumPy包的核心是 ndarray 對(duì)象。它封裝了python原生的同數(shù)據(jù)類型的 n 維數(shù)組,為了保證其性能優(yōu)良,其中有許多操作都是代碼在本地進(jìn)行編譯后執(zhí)行的。
NumPy的主要對(duì)象是同構(gòu)多維數(shù)組。它是一個(gè)元素表,所有類型都相同,由非負(fù)整數(shù)元組索引。在NumPy維度中稱為軸 。
2、Pandas
官網(wǎng)https://www.pypandas.cn/
Pandas 是 Python的核心數(shù)據(jù)分析支持庫,提供了快速、靈活、明確的數(shù)據(jù)結(jié)構(gòu),旨在簡(jiǎn)單、直觀地處理關(guān)系型、標(biāo)記型數(shù)據(jù),廣泛應(yīng)用于數(shù)據(jù)分析領(lǐng)域,Pandas 適用于處理與 Excel 表類似的表格數(shù)據(jù),以及有序和無序的時(shí)間序列數(shù)據(jù)等。
Pandas 的主要數(shù)據(jù)結(jié)構(gòu)是 Series(一維數(shù)據(jù))和 DataFrame(二維數(shù)據(jù)),這兩種數(shù)據(jù)結(jié)構(gòu)足以處理金融、統(tǒng)計(jì)、社會(huì)科學(xué)、工程等領(lǐng)域里的大多數(shù)典型用例,使用pandas進(jìn)行數(shù)據(jù)分析流程包含數(shù)據(jù)整理與清洗、數(shù)據(jù)分析與建模、數(shù)據(jù)可視化與制表等階段。
3、Matplotlib
官網(wǎng)
https://www.matplotlib.org.cn/
Matplotlib是一個(gè)Python 2D繪圖庫,它以多種硬拷貝格式和跨平臺(tái)的交互式環(huán)境生成出版物質(zhì)量的圖形。Matplotlib可用于Python腳本,Python和IPython Shell、Jupyter筆記本,Web應(yīng)用程序服務(wù)器和四個(gè)圖形用戶界面工具包。
Matplotlib 嘗試使容易的事情變得更容易,使困難的事情變得可能,只需幾行代碼就可以生成圖表、直方圖、功率譜、條形圖、誤差圖、散點(diǎn)圖等。
為了簡(jiǎn)單繪圖,該 pyplot 模塊提供了類似于MATLAB的界面,尤其是與IPython結(jié)合使用時(shí),對(duì)于高級(jí)用戶,您可以通過面向?qū)ο蟮慕缑婊騇ATLAB用戶熟悉的一組功能來完全控制線型,字體屬性,軸屬性等。
4、Seaborn
官網(wǎng)
http://seaborn.pydata.org/
Seaborn 是一個(gè)基于matplotlib的 Python 數(shù)據(jù)可視化庫,它建立在matplotlib之上,并與Pandas數(shù)據(jù)結(jié)構(gòu)緊密集成,用于繪制有吸引力和信息豐富的統(tǒng)計(jì)圖形的高級(jí)界面。
Seaborn 可用于探索數(shù)據(jù),它的繪圖功能對(duì)包含整個(gè)數(shù)據(jù)集的數(shù)據(jù)框和數(shù)組進(jìn)行操作,并在內(nèi)部執(zhí)行必要的語義映射和統(tǒng)計(jì)聚合以生成信息圖,其面向數(shù)據(jù)集的聲明式 API可以專注于繪圖的不同元素的含義,而不是如何繪制它們的細(xì)節(jié)。
Matplotlib 擁有全面而強(qiáng)大的 API,幾乎可以根據(jù)自己的喜好更改圖形的任何屬性,seaborn 的高級(jí)界面和 matplotlib 的深度可定制性相結(jié)合,使得Seaborn既可以快速探索數(shù)據(jù),又可以創(chuàng)建可定制為出版質(zhì)量最終產(chǎn)品的圖形。
5、Pyecharts
官網(wǎng)https://pyecharts.org/#/
Echarts 是一個(gè)由百度開源的數(shù)據(jù)可視化,憑借著良好的交互性,精巧的圖表設(shè)計(jì),得到了眾多開發(fā)者的認(rèn)可。而 Python 是一門富有表達(dá)力的語言,很適合用于數(shù)據(jù)處理。當(dāng)數(shù)據(jù)分析遇上數(shù)據(jù)可視化時(shí),pyecharts 誕生了。
Pyecharts具有簡(jiǎn)潔的 API 設(shè)計(jì),使用如絲滑般流暢,支持鏈?zhǔn)秸{(diào)用,囊括了 30+ 種常見圖表,應(yīng)有盡有,支持主流 Notebook 環(huán)境,Jupyter Notebook 和 JupyterLab,擁有高度靈活的配置項(xiàng),可輕松搭配出精美的圖表。
Pyecharts強(qiáng)大的數(shù)據(jù)交互功能,使數(shù)據(jù)表達(dá)信息更加生動(dòng),增加了人機(jī)互動(dòng)效果,并且數(shù)據(jù)呈現(xiàn)效果可直接導(dǎo)出為html文件,增加數(shù)據(jù)結(jié)果交互的機(jī)會(huì),使得信息溝通更加容易。
Pyecharts有著豐富的圖表素材,支持鏈?zhǔn)秸{(diào)用,如下是使用Pyecharts的地理圖表功能,空間上直觀顯示數(shù)據(jù)可視化效果。
更多實(shí)用的數(shù)據(jù)分析知識(shí),關(guān)注我,持續(xù)創(chuàng)作數(shù)據(jù)分析內(nèi)容~
聯(lián)系客服