在這個(gè)速查手冊(cè)中,我們使用如下縮寫(xiě):
df:任意的Pandas DataFrame對(duì)象
s:任意的Pandas Series對(duì)象
同時(shí)我們需要做如下的引入:
import pandas as pd
import numpy as np
df.to_csv(filename):導(dǎo)出數(shù)據(jù)到CSV文件
df.to_excel(filename):導(dǎo)出數(shù)據(jù)到Excel文件
df.to_sql(table_name, connection_object):導(dǎo)出數(shù)據(jù)到SQL表
df.to_json(filename):以Json格式導(dǎo)出數(shù)據(jù)到文本文件
df[df[col] > 0.5]:選擇col列的值大于0.5的行
df.sort_values(col1):按照列col1排序數(shù)據(jù),默認(rèn)升序排列
df.sort_values(col2, ascending=False):按照列col1降序排列數(shù)據(jù)
df.sort_values([col1,col2], ascending=[True,False]):先按列col1升序排列,后按col2降序排列數(shù)據(jù)
df.groupby(col):返回一個(gè)按列col進(jìn)行分組的Groupby對(duì)象
df.groupby([col1,col2]):返回一個(gè)按多列進(jìn)行分組的Groupby對(duì)象
df.groupby(col1)[col2]:返回按列col1進(jìn)行分組后,列col2的均值
df.pivot_table(index=col1, values=[col2,col3], aggfunc=max):創(chuàng)建一個(gè)按列col1進(jìn)行分組,并計(jì)算col2和col3的最大值的數(shù)據(jù)透視表
df.groupby(col1).agg(np.mean):返回按列col1分組的所有列的均值
data.apply(np.mean):對(duì)DataFrame中的每一列應(yīng)用函數(shù)np.mean
data.apply(np.max,axis=1):對(duì)DataFrame中的每一行應(yīng)用函數(shù)np.max
df.describe():查看數(shù)據(jù)值列的匯總統(tǒng)計(jì)
df.mean():返回所有列的均值
df.corr():返回列與列之間的相關(guān)系數(shù)
df.count():返回每一列中的非空值的個(gè)數(shù)
df.max():返回每一列的最大值
df.min():返回每一列的最小值
df.median():返回每一列的中位數(shù)
df.std():返回每一列的標(biāo)準(zhǔn)差
聯(lián)系客服