Matplotlib是一個(gè)非常經(jīng)典的繪圖庫,甚至有人將numpy+pandas+matplotlib
稱之為數(shù)據(jù)分析三劍客,足以說明這個(gè)庫的重要性。雖然Peter鐘情于Plotly,但掌握Matplotlib繪制技巧也非常重要。
基于Matplotlib的繪圖技巧太多了,想深入學(xué)習(xí)的小伙伴建議直接官網(wǎng):https://matplotlib.org/
從本文中你將學(xué)習(xí)到以下幾點(diǎn):
一般繪圖的時(shí)候需要導(dǎo)入常見的庫;在使用matplotlib繪制的時(shí)候還需要解決中文的問題
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
# 用來正常顯示中文標(biāo)簽
plt.rcParams['font.sans-serif'] = ['SimHei']
# 解決負(fù)號(hào)“-”顯示為
plt.rcParams['axes.unicode_minus'] = False
x = [2,3,4]
y = [4,6,8]
plt.plot(x,y)
plt.show()
# 默認(rèn)參數(shù)
x1 = np.array([1,3,5])
y1 = x1 + 4
plt.plot(x1,y1)
# 第二條紅線
y2 = x1 * 2
plt.plot(x1,y2,color='red',linewidth=3,linestyle='--')
plt.show()
x = [2,3,4,5,6]
y = [4,6,8,10,12]
plt.bar(x,y)
plt.show()
x = np.random.rand(20) # 0-1之間的20個(gè)隨機(jī)數(shù)
y = np.random.rand(20)
plt.scatter(x,y)
plt.show()
# 隨機(jī)生成1000個(gè)服從正態(tài)分布的數(shù)據(jù),均值為0,標(biāo)準(zhǔn)差為1
data = np.random.randn(1000)
plt.hist(data, bins=40, edgecolor='black')
plt.show()
主要是y軸發(fā)生了變化,全部是小數(shù)表示的
data = np.random.randn(1000)
# 區(qū)別:加上參數(shù)density=1
plt.hist(data, bins=40, density=1, edgecolor='black')
plt.show()
x = [2,3,4]
y = [4,6,8]
plt.plot(x,y)
#設(shè)置大小 8代表800像素
plt.rcParams['figure.figsize'] = (8,6)
plt.show()
文字說明包含標(biāo)題、軸標(biāo)簽等
x = [2,3,4]
y = [4,6,8]
plt.plot(x,y)
# 添加標(biāo)題和軸名稱
plt.title('Title')
plt.xlabel('x axis')
plt.ylabel('y axis')
plt.show()
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
x=np.arange(1,8)
plt.plot(x,marker='>')
plt.plot(x+4,marker='+')
plt.plot(x*2,marker='o')
plt.show()
plt.rcParams['font.sans-serif']=['SimHei'] #用來正常顯示中文標(biāo)簽
plt.rcParams['axes.unicode_minus']=False
x=[1, 2, 3, 4]
y=[1, 4, 9, 16]
plt.plot(x,y)
plt.xlabel('x坐標(biāo)軸')
plt.ylabel('y坐標(biāo)軸')
plt.title('標(biāo)題')
# 添加注釋
plt.annotate('我是注釋',
xy=(2,5),
xytext=(2, 10),
arrowprops=dict(facecolor='black',
shrink=0.01),
)
plt.show()
# 第一條
x1 = np.array([1,3,5])
y1 = x1 + 4
plt.plot(x1,y1,label='y=x+4 ')
# 第二條紅線
y2 = x1 * 2
plt.plot(x1,y2,
color='red',
linewidth=3,
linestyle='--',
label='y=x*2')
# 設(shè)定位置
plt.legend(loc='upper left')
plt.show()
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
x=np.arange(1,8)
#顏色的多種寫法
plt.plot(x,color='r') # r表示red g表示green b表示blue
plt.plot(x+1,color='0.5')
plt.plot(x+2,color='#AF00FF')
plt.plot(x+3,color=(0.1,0.2,0.3))
plt.show()
# 1
x1 = np.array([1,3,5])
y1 = 50*x1 + 14
plt.plot(x1,y1,label='y=50 * x + 4 ')
plt.legend(loc='upper right') # 圖例位置
# 重要代碼:設(shè)置雙軸
plt.twinx()
# 2
y2 = -x1 * 20 + 3
plt.plot(x1,y2,color='red',
linewidth=3,
linestyle='--',
label='y=-x * 20 + 3')
plt.legend(loc='upper left')
plt.show()
當(dāng)某個(gè)軸的刻度值過長的時(shí)候,我們可以通過旋轉(zhuǎn)的方式進(jìn)行顯示
x = ['Monday','Thursday','Wednesday']
y = [4,6,8]
plt.plot(x,y)
plt.xticks(rotation=45)
plt.show()
import matplotlib.pyplot as plt
# 繪制第1張子圖:折線圖
ax1 = plt.subplot(221)
plt.plot([1, 2, 3], [2, 4, 6])
# 繪制第2張子圖:柱形圖
ax2 = plt.subplot(222)
plt.bar([1, 2, 3], [2, 4, 6])
# 繪制第3張子圖:散點(diǎn)圖
ax3 = plt.subplot(223)
plt.scatter([1, 3, 5], [7, 9, 11])
# 繪制第4張子圖:直方圖
ax4 = plt.subplot(224)
plt.hist([2, 5, 2, 8, 4])
plt.show()
subplots函數(shù)主要是兩個(gè)參數(shù):nrows表示行數(shù),ncols表示列數(shù);同時(shí)設(shè)置大小figsize。
函數(shù)返回的是畫布fig和子圖合集axes
fig, axes = plt.subplots(nrows=2, ncols=2,figsize=(10,6))
# flatten表示將子圖合集展開,得到每個(gè)子圖
ax1,ax2,ax3,ax4 = axes.flatten()
ax1.plot([1, 2, 3], [2, 4, 6])
ax2.bar([1, 2, 3], [2, 4, 6])
ax3.scatter([1, 3, 5], [7, 9, 11])
ax4.hist([2, 5, 2, 8, 4])
plt.show()
我們從Tushare官網(wǎng)來獲取股票的數(shù)據(jù),首先安裝:
pip install tushare
import tushare as ts
df = ts.get_k_data('000001',start='2020-05-08',end='2020-08-08')
df
為了方便后續(xù)的繪圖,需要將日期date字段改成索引:
# 將日期設(shè)置成索引
df1 = df.set_index('date')
我們使用收盤價(jià)close來繪制默認(rèn)的圖形
fig = df1['close'].plot()
plt.show()
# Pandas直接繪圖
fig = df['close'].plot(title='PingAn')
plt.show()
上面是使用Pandas內(nèi)置的折線圖方法來繪制,下面使用Matplobtlib來繪制:
# 使用Matplotlib繪圖
# 獲取數(shù)據(jù)
# import tushare as ts
# df = ts.get_k_data('000001',start='2018-08-08',end='2020-08-08')
# 調(diào)整時(shí)間
from datetime import datetime
df['date'] = df['date'].apply(lambda x:datetime.strptime(x,'%Y-%m-%d'))
# 繪制折線圖
import matplotlib.pyplot as plt
%matplotlib inline
plt.plot(df['date'],df['close'])
# 標(biāo)題
plt.title('PingAn')
# 旋轉(zhuǎn)
plt.xticks(rotation=-45)
plt.show()
首先,我們了解一點(diǎn)基本的股票知識(shí):股市的漲跌對(duì)K線圖的影響
為了繪制k線圖,我們需要安裝一個(gè)庫:
#安裝庫mpl_finance
pip install mpl_finance
df = ts.get_k_data('000001',start='2020-09-08',end='2021-03-08')
df.head()
定義一個(gè)將字符串形式的日期轉(zhuǎn)成數(shù)字型的函數(shù):
from matplotlib.pylab import date2num
import datetime
def date_to_number(dates):
number_time = []
for date in dates:
# 字符串轉(zhuǎn)時(shí)間戳格式
date_time = datetime.datetime.strptime(date,'%Y-%m-%d')
# 時(shí)間戳格式轉(zhuǎn)成數(shù)字格式
number_date = date2num(date_time)
number_time.append(number_date)
return number_time
下面進(jìn)行的操作是取出上面數(shù)據(jù)中的values部分并轉(zhuǎn)成numpy;同時(shí)調(diào)用上面的函數(shù):
# DataFrame轉(zhuǎn)成numpy數(shù)組格式
df1 = df.values
# 將二維數(shù)組的日期轉(zhuǎn)成數(shù)字(使用上面的函數(shù))
df1[:,0] = date_to_number(df1[:,0])
fig, ax = plt.subplots(figsize=(15,6))
mpf.candlestick_ochl(ax, # 繪圖Axes的實(shí)例,畫布中的子圖
df1, # 帶繪圖的數(shù)據(jù)
width=0.5, # K線柱形的寬度
colorup='red', # 收盤價(jià)>開盤價(jià)
colordown='green', # 收盤價(jià)<開盤價(jià)
alpha=5) # 柱子的透明度
plt.grid(True) # 顯示網(wǎng)格線
ax.xaxis_date() # 將x軸設(shè)置成常規(guī)的日期格式
下面的代碼是添加5日和20日的均線數(shù)據(jù):
fig, ax = plt.subplots(figsize=(15,6))
mpf.candlestick_ochl(ax, # 繪圖Axes的實(shí)例,畫布中的子圖
df1, # 帶繪圖的數(shù)據(jù)
width=0.5, # K線柱形的寬度
colorup='red', # 收盤價(jià)>開盤價(jià)
colordown='green', # 收盤價(jià)<開盤價(jià)
alpha=5) # 柱子的透明度
# 添加均線
plt.plot(df1[:,0],df['MA5'], c='black')
plt.plot(df1[:,0],df['MA20'])
plt.grid(True) # 顯示網(wǎng)格線
ax.xaxis_date() # 將x軸設(shè)置成常規(guī)的日期格式
# 添加標(biāo)題
plt.title('PingAn')
plt.xlabel('date')
plt.ylabel('Price')
plt.show()
我們將K線圖放在第一個(gè)子圖位置,將成交量放在第二個(gè)位置即可:
#用來正常顯示中文標(biāo)簽
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
# 畫布、子圖、共享x軸
fig, ax = plt.subplots(2,1,sharex=True,figsize=(15,6))
ax1,ax2 = ax.flatten()
# 第一個(gè)圖
mpf.candlestick_ochl(ax1, # 繪圖Axes的實(shí)例,畫布中的子圖
df1, # 帶繪圖的數(shù)據(jù)
width=0.5, # K線柱形的寬度
colorup='red', # 收盤價(jià)>開盤價(jià)
colordown='green', # 收盤價(jià)<開盤價(jià)
alpha=5) # 柱子的透明度
# 添加均線
ax1.plot(df1[:,0],df['MA5'], c='black')
ax1.plot(df1[:,0],df['MA20'])
# 顯示網(wǎng)格線
ax1.grid(True)
# 將x軸設(shè)置成常規(guī)的日期格式
ax1.xaxis_date()
# 添加標(biāo)題、軸名稱等
ax1.set_title('平安股價(jià)走勢(shì)圖')
ax1.set_xlabel('時(shí)間')
ax1.set_ylabel('價(jià)格')
# --------------------------
# 第2個(gè)子圖
ax2.bar(df1[:,0],df1[:,5])
ax2.set_xlabel('時(shí)間')
ax2.set_ylabel('成交量') # 成交量
ax2.grid(True)
ax2.xaxis_date()
plt.show()
聯(lián)系客服