大家不论在日常工作还是生活中,都经常用到Excel这款办公软件,它在数据处理、报表生成等方面起到了重要作用。
然而,作为一个Python工程师,你可知道Python也能成为操作Excel的得力助手吗?而且Python有很多库可以作为Excel操作的利器。
Python可操作Excel的三方库有:
- • Openpyxl
- • Pandas
- • Xlrd
- • Xlwt
- • Xlsxwriter
- • Xlwings
- • Xlutils
- • Marmir
今天给大家介绍下 Openpyxl
库的使用,其他三方库会在后续文章中会续写介绍。
01
介绍
openpyxl
是一款用于读取和写入Excel的第三方Python库,支持xlsx格式。但是也有一个缺点,就是不支持xls格式文件的读取。
如果在实际使用过程中遇到了xls格式的文件需要使用Python进行处理,小编建议使用 pandas、xlrd、xlwt
等库。
02
安装
在使用Python操作Excel之前,我们需要先安装库:openpyxl。
通过以下命令可以快速安装:
代码语言:javascript复制pip install openpyxl
03
使用
Excel操作主要就是读取和写入,其他的就是单元格、样式设置、数据处理。
创建工作簿
我们需要引入 Workbook
这个类,创建工作簿:
from openpyxl import Workbook
wb = Workbook()
一个工作簿(workbook)在创建的同时也会新建一张工作表(worksheet)。我们可以通过Workbook.active
得到正在运行的工作表:
ws = wb.active
注意:该函数调用工作表的索引(_active_sheet_index),默认是0。除非你修改了这个值,否则你使用该函数一直是在对第一张工作表进行操作。
使用Workbook.create_sheet()
新建一张sheet表:
ws1 = wb.create_sheet() #默认插在工作簿末尾
# 或者
ws2 = wb.create_sheet(0) # 插入在工作簿的第一个位置
在创建工作表的时候系统自动命名。他们按照序列依次命名 (Sheet, Sheet1, Sheet2, ...)。你可以通过调用下面的属性修改工作表的名称:
代码语言:javascript复制ws.title = "demo_title"
标签栏的背景色默认为白色,我们可以通过提供一个RGB颜色码改变标签栏的字体颜色:
代码语言:javascript复制ws.sheet_properties.tabColor = "1395FA"
获取工作簿的所有工作表:
代码语言:javascript复制print(wb.get_sheet_names())
# ['demo_title', 'Sheet1']
操作数据
通过上面的方法,我们已经学习到了如何获取工作表了,接下来基于工作表对象操作单元格中的内容。
使用单个单元格
单元格可以直接根据行列索引直接获取
代码语言:javascript复制a = ws['A1']
对单元格赋值
代码语言:javascript复制ws['A1'] = 3
当然,还可以获取单元格的值
代码语言:javascript复制a = ws.cell('A1')
或者
a = ws.cell(row=1, column=1)
注意:当一个工作表被创建时,其中不包含单元格。只有当单元格被获取时才会被创建。不会创建我们从不会使用的单元格,从而减少了内存消耗。
使用多个单元格
使用切片方式获取多个单元格
代码语言:javascript复制cells = ws['A1':'C2']
使用类方法获取多个单元格
代码语言:javascript复制print(tuple(ws.iter_rows('A1:C2')))
#((<Cell Sheet1.A1>, <Cell Sheet1.B1>, <Cell Sheet1.C1>),
# (<Cell Sheet1.A2>, <Cell Sheet1.B2>, <Cell Sheet1.C2>))
for row in ws.iter_rows('A1:C2'):
for cell in row:
print cell
#<Cell Sheet1.A1>
#<Cell Sheet1.B1>
#<Cell Sheet1.C1>
#<Cell Sheet1.A2>
#<Cell Sheet1.B2>
#<Cell Sheet1.C2>
迭代文件中所有的行或者列
代码语言:javascript复制ws.rows
#((<Cell Sheet.A1>, <Cell Sheet.B1>, <Cell Sheet.C1>),
#(<Cell Sheet.A2>, <Cell Sheet.B2>, <Cell Sheet.C2>),
#(<Cell Sheet.A3>, <Cell Sheet.B3>, <Cell Sheet.C3>))
# 或者
ws.columns
#((<Cell Sheet.A1>,
#<Cell Sheet.A2>,
#...
数据存储
为单元格赋值(前提创建了单元格对象Cell)
代码语言:javascript复制c.value = '你好'
d.value = 'OK'
保存到文件
代码语言:javascript复制wb = Workbook()
wb.save('demo.xlsx')
注意:这个操作将会在没有认识提示的情况下用现在写的内容,覆盖掉原文件中的所有内容
读取文件
读取文件就很简单了,一行代码解决,得到一个wb对象,其他的操作都一样
代码语言:javascript复制from openpyxl import load_workbook
wb = load_workbook('demo.xlsx')
print(wb.get_sheet_names())
['demo_title', 'Sheet1']
04
总结
使用openpyxl进行工作的时候,这个保存唯一需要注意的是:文件是默认替换的。也就是说我们在保存文件的时候,openpyxl将进行替换而不发出告警。如果大家想保存不同阶段的文件,则可以在保存文件的时候加一个时间戳。
Python操作Excel的这些基本步骤只是冰山一角,实际上,我们还可以进行更多更复杂的数据处理操作,如表格合并、公式计算等。Python在处理Excel方面的灵活性和扩展性让我们能够以更高效的方式完成工作。
让我们抛开繁琐的手动操作,让Python成为我们工作中的好帮手吧!相信通过本文的介绍,你已经明白了如何使用Python库进行Excel文件的读取、数据处理和导出。试着在实际工作中应用Python来解放自己吧!
写到最后
感谢您的一路陪伴,用代码构建世界,一起探索充满未知且奇妙的魔幻旅程。如果您对Python编程技巧、好玩实用的开源项目、行业新知趣事和各类技术干货等充满兴趣,那么不要错过未来我为大家奉上的精彩内容!点击关注,让您的探索学习之旅更加丰富多彩,我们一同成长,一同前行!