利用 Python 對 Excel 文件進(jìn)行操作需要使用第三方庫: openpyxl,可執(zhí)行 pip install openpyxl 進(jìn)行安裝
1. 導(dǎo)入 openpyxl 模塊
導(dǎo)入 openpyxl 模塊后,利用它的 load_workbook() 方法可以打開一個 Excel 文件,該方法使用一個文件名稱作為參數(shù),示例如下:
>>> import openpyxl
>>> wb = openpyxl.load_workbook('example.xlsx')
>>> type(wb)
<class 'openpyxl.workbook.workbook.Workbook'>
2. openpyxl 常用方法
可以使用 openpyxl 對象的 get_sheet_names() 方法得到打開的工作薄中存在的所有工作表名稱、用 get_sheet_by_name() 方法獲取工作表對象、用 active 屬性可獲取當(dāng)前活躍工作表的名稱:
>>> wb.get_sheet_names()
['Sheet1', 'Sheet2', 'Sheet3']
>>> sheet = wb.get_sheet_by_name('Sheet3')
>>> sheet
<Worksheet "Sheet3">
>>> type(sheet)
<class 'openpyxl.worksheet.worksheet.Worksheet'>
>>> sheet.title
'Sheet3'
>>> anotherSheet = wb.active
>>> anotherSheet
<Worksheet "Sheet1">
3. 獲取單元格屬性
可以直接使用單元格名稱獲取指定單元格,同時單元格具有值、行、列、坐標(biāo)屬性,舉例如下:
>>> sheet = wb.get_sheet_by_name('Sheet1')
>>> sheet['A1']
<Cell Sheet1.A1>
>>> sheet['A1'].value
datetime.datetime(2015, 4, 5, 13, 34, 2)
>>> c = sheet['B1']
>>> c.value
'Apples'
>>> 'Row ' + str(c.row) + ', Column ' + c.column + ' is ' + c.value
'Row 1, Column B is Apples'
>>> 'Cell ' + c.coordinate + ' is ' + c.value
'Cell B1 is Apples'
>>> sheet['C1'].value
73
4. 使用 cell()
同時也可以使用工作表對象的 cell() 方法來直接指定單元格,使用該方法時要注意,工作表中的行、列都是從1而不是0開始的:
>>> sheet.cell(row=1, column=2)
<Cell Sheet1.B1>
>>> sheet.cell(row=1, column=2).value
'Apples'
>>> for i in range(1, 8, 2):
print(i, sheet.cell(row=i, column=2).value)
1 Apples
3 Pears
5 Apples
7 Strawberries
5. 獲取當(dāng)前工作表中有效數(shù)據(jù)區(qū)域的行數(shù)和列數(shù)
>>> sheet.max_row
7
>>> sheet.max_column
3
6. 行、列之間的轉(zhuǎn)換
需要使用 get_column_letter、column_index_from_string 這兩個方法
>>> from openpyxl.utils import get_column_letter, column_index_from_string
>>> get_column_letter(1)
'A'
>>> get_column_letter(2)
'B'
>>> get_column_letter(27)
'AA'
>>> get_column_letter(900)
'AHP'
>>> get_column_letter(sheet.max_column)
'C'
>>> column_index_from_string('A')
1
>>> column_index_from_string('AA')
27
7. 獲取區(qū)域數(shù)據(jù)
>>> tuple(sheet['A1':'C3'])
((<Cell Sheet1.A1>, <Cell Sheet1.B1>, <Cell Sheet1.C1>), (<Cell Sheet1.A2>, <Cell Sheet1.B2>, <Cell Sheet1.C2>), (<Cell Sheet1.A3>, <Cell Sheet1.B3>, <Cell Sheet1.C3>))
8. 獲取指定一行或一列數(shù)據(jù)
>>> sheet.columns[1]
(<Cell Sheet1.B1>, <Cell Sheet1.B2>, <Cell Sheet1.B3>, <Cell Sheet1.B4>, <Cell Sheet1.B5>, <Cell Sheet1.B6>, <Cell Sheet1.B7>)
9. Excel 讀操作總結(jié)
利用 openpyxl 對 excel 文件進(jìn)行讀操作,主要步驟有以下幾點:
10. 創(chuàng)建與保存 Excel 文件
創(chuàng)建 Excel 文件需要使用 openpyxl 模塊的 Workbook() 方法,對文件進(jìn)行操作后,需要調(diào)用工作薄對象的 save() 方法進(jìn)行保存方可使操作生效。
>>> import openpyxl
>>> wb = openpyxl.Wrokbook()
>>> wb.get_sheet_names()
['Sheet']
>>> sheet = wb.active
>>> sheet.title
'Sheet'
>>> sheet.title = 'Spam Bacon Eggs Sheet'
>>> wb.get_sheet_names()
['Spam Bacon Eggs Sheet']
>>> wb.save('example_copy.xlsx')
11. 新增或刪除工作表
增加工作表,需要使用工作薄對象的 create_sheet() 方法。對應(yīng)的,刪除工作表,需要使用 remove_sheet() 方法。
>>> wb.create_sheet()
<Worksheet "Sheet1">
>>> wb.get_sheet_names()
['Sheet', 'Sheet1']
>>> wb.create_sheet(index=0, title='First Sheet')
<Worksheet "First Sheet">
>>> wb.create_sheet(index=2, title='Middle Sheet')
<Worksheet "Middle Sheet">
>>> wb.get_sheet_names()
['First Sheet', 'Sheet', 'Middle Sheet', 'Sheet1']
如上,創(chuàng)建新工作表時,默認(rèn)按序號順序創(chuàng)建,并在當(dāng)前已有工作表末尾附加。如果指定索引和標(biāo)題,則會以給定的標(biāo)題在指定索引處進(jìn)行創(chuàng)建,索引從0開始。
刪除工作表則略復(fù)雜,不能直接給 remove_sheet() 方法傳遞工作表名或索引進(jìn)行刪除,而必須傳遞一個工作表對象方可進(jìn)行刪除。
>>> wb.remove_sheet(wb.get_sheet_by_name('Middle Sheet'))
>>> wb.remove_sheet(wb.get_sheet_by_name('Sheet1'))
>>> wb.get_sheet_names()
['First Sheet', 'Sheet']
最后,記得要進(jìn)行 save() 操作,方可使增加或刪除操作生效。
12. 向單元格寫入數(shù)據(jù)
向單元格寫入數(shù)據(jù),只需要在工作表對象中,指定單元格坐標(biāo),再進(jìn)行類似于變量賦值的操作即可
>>> sheet['A1'] = 'Hello world!'
>>> sheet['A1'].value
'Hello world!'
13. 使用 cell() 方法
除了使用單元格坐標(biāo)的方式獲取單元格對象外,還可以使用工作表對象的 cell() 方法,向其傳入整型的行數(shù)、列數(shù)來進(jìn)行指定
>>> sheet.cell(row=2, column=2).value = 'Hello'
>>> sheet['B2'].value
'Hello'
14. 設(shè)置字體樣式
對 Excel 中的單元格內(nèi)的字體樣式進(jìn)行設(shè)置,需要使用 Font() 方法,向其傳入指定參數(shù)并將其賦值給指定單元格的 font 屬性即可進(jìn)行相應(yīng)設(shè)置。該方法需要從 openpyxl.styles 中導(dǎo)入
>>> italic24Font = Font(size=24, italic=True)
>>> sheet['A1'].font = italic24Font
>>> sheet['A1'] = 'Hello world!'
>>> wb.save('styled.xlsx')
一些常用的 Font() 對象屬性
name: 字符串類型。字體名稱,如 Calibri、Times New Roman
size: 整型。字號
bold: 布爾型。是否為粗體
italic: 布爾型。是否為斜體
使用示例:
>>> fontObj1 = Font(name='Times New Roman', bold=True)
>>> sheet['A1'].font = fontObj1
>>> sheet['A1'] = 'Bold Times New Roman'
>>> fontObj2 = Font(size=24, italic=True)
>>> sheet['B3'].font = fontObj2
>>> sheet['B3'] = '24 pt Italic'
>>> wb.save('styles.xlsx')
15. 使用公式
使用公式相對簡單,和向單元格寫入數(shù)據(jù)相同,把公式作為待寫數(shù)據(jù)寫入到單元格中即可
>>> sheet['B9'] = '=SUM(B1:B8)'
應(yīng)注意的是,公式總是以等號(=)開頭的
16. 調(diào)整行高與列寬
openpyxl 模塊中有專門的工作表對象變量對行高與列寬進(jìn)行調(diào)整。設(shè)置行高,可使用 row_dimensions 屬性,設(shè)置列寬,可使用 column_dimensions 屬性
>>> sheet['A1'] = 'Tall row'
>>> sheet['B2'] = 'Wide column'
>>> sheet.row_dimensions[1].height = 70
>>> sheet.column_dimensions['B'].width = 20
>>> wb.save('dimensions.xlsx')
應(yīng)當(dāng)注意的是,如果把行高或列寬設(shè)置為0,則會將該行、列隱藏
17. 合并單元格與拆分單元格
合并單元格使用 merge_cells() 方法,拆分單元格使用 unmerge_cells() 方法,這兩個方法接受一個字符串格式的參數(shù),該參數(shù)從左上角至右下角指定一整塊區(qū)域用于合并或拆分。舉例如下
>>> sheet.merge_cells('A1:D3')
>>> sheet['A1'] = 'Twelve cells merged together.'
>>> sheet.merge_cells('C5:D5')
>>> sheet['C5'] = 'Two merged cells.'
>>> wb.save('merged.xlsx')
>>> sheet.unmerge_cells('A1:D3')
>>> sheet.unmerge_cells('C5:D5')
>>> wb.save('merged.xlsx')
18. 凍結(jié)窗格
要實行凍結(jié)窗格操作,需要使用工作表對象的 freeze_panes 屬性,向該屬性指定一個單元格位置,則在該單元格左側(cè)與上側(cè)的區(qū)域?qū)⒈粌鼋Y(jié)。但該單元格本身并不在凍結(jié)范圍內(nèi)
>>> sheet.freeze_panes = 'A2'
以上代碼將把工作表中第一行給凍結(jié)
19. 創(chuàng)建圖表
創(chuàng)建圖表相對較為復(fù)雜,主要有以下5個步驟
Reference 對象使用 openpyxl.chart.Reference() 創(chuàng)建,其接收3個參數(shù):
(作者此處描述似乎有誤,準(zhǔn)確的說應(yīng)該是5個參數(shù)了,第1個是工作表對象,第2個是數(shù)據(jù)區(qū)域左上角單元格所在的行數(shù),第3個是數(shù)據(jù)區(qū)域左上角單元格所在的列數(shù),第4個是數(shù)據(jù)區(qū)域右下角單元格所在的行數(shù),第5個是數(shù)據(jù)區(qū)域右下角單元格所在的列數(shù))
創(chuàng)建圖表示例如下:
>>> refObj = openpyxl.chart.Reference(sheet, min_col=1, min_row=1, max_col=1, max_row=10)
>>> seriesObj = openpyxl.chart.Series(refObj, title='First series')
>>> chartObj = openpyxl.chart.BarChart()
>>> chartObj.title = 'My Chart'
>>> chartObj.append(seriesObj)
>>> sheet.add_chart(chartObj, 'C5')
>>> wb.save('sampleChart.xlsx')
本示例中,數(shù)據(jù)區(qū)域為 A1:A10
結(jié)果如下(圖中各個 pixels 參數(shù)可忽略):
作者在 sheet.add_chart() 函數(shù)中指定了圖表左上角位置為 C5,但在結(jié)果中顯示的卻并不是這樣。在下亦不解
聯(lián)系客服