Python自动化 | 解锁高效办公利器,Python助您轻松驾驭Excel!

2023-11-15 19:10:42 浏览数 (2)

大家不论在日常工作还是生活中,都经常用到Excel这款办公软件,它在数据处理、报表生成等方面起到了重要作用。

然而,作为一个Python工程师,你可知道Python也能成为操作Excel的得力助手吗?而且Python有很多库可以作为Excel操作的利器。

Python可操作Excel的三方库有:

  • Openpyxl
  • Pandas
  • Xlrd
  • Xlwt
  • Xlsxwriter
  • Xlwings
  • Xlutils
  • Marmir

今天给大家介绍下 Openpyxl 库的使用,其他三方库会在后续文章中会续写介绍。

01

介绍

openpyxl 是一款用于读取和写入Excel的第三方Python库,支持xlsx格式。但是也有一个缺点,就是不支持xls格式文件的读取。

如果在实际使用过程中遇到了xls格式的文件需要使用Python进行处理,小编建议使用 pandas、xlrd、xlwt 等库。

02

安装

在使用Python操作Excel之前,我们需要先安装库:openpyxl。

通过以下命令可以快速安装:

代码语言:javascript复制
pip install openpyxl

03

使用

Excel操作主要就是读取和写入,其他的就是单元格、样式设置、数据处理。

创建工作簿

我们需要引入 Workbook 这个类,创建工作簿:

代码语言:javascript复制
from openpyxl import Workbook
wb = Workbook()

一个工作簿(workbook)在创建的同时也会新建一张工作表(worksheet)。我们可以通过Workbook.active 得到正在运行的工作表:

代码语言:javascript复制
ws = wb.active

注意:该函数调用工作表的索引(_active_sheet_index),默认是0。除非你修改了这个值,否则你使用该函数一直是在对第一张工作表进行操作。

使用Workbook.create_sheet()新建一张sheet表:

代码语言:javascript复制
ws1 = wb.create_sheet() #默认插在工作簿末尾
# 或者
ws2 = wb.create_sheet(0) # 插入在工作簿的第一个位置

在创建工作表的时候系统自动命名。他们按照序列依次命名 (Sheet, Sheet1, Sheet2, ...)。你可以通过调用下面的属性修改工作表的名称:

代码语言:javascript复制
ws.title = "demo_title"

标签栏的背景色默认为白色,我们可以通过提供一个RGB颜色码改变标签栏的字体颜色:

代码语言:javascript复制
ws.sheet_properties.tabColor = "1395FA"

获取工作簿的所有工作表:

代码语言:javascript复制
print(wb.get_sheet_names())
# ['demo_title', 'Sheet1']

操作数据

通过上面的方法,我们已经学习到了如何获取工作表了,接下来基于工作表对象操作单元格中的内容。

使用单个单元格

单元格可以直接根据行列索引直接获取

代码语言:javascript复制
a = ws['A1']

对单元格赋值

代码语言:javascript复制
ws['A1'] = 3

当然,还可以获取单元格的值

代码语言:javascript复制
a = ws.cell('A1')
或者
a = ws.cell(row=1, column=1)

注意:当一个工作表被创建时,其中不包含单元格。只有当单元格被获取时才会被创建。不会创建我们从不会使用的单元格,从而减少了内存消耗。

使用多个单元格

使用切片方式获取多个单元格

代码语言:javascript复制
cells = ws['A1':'C2']

使用类方法获取多个单元格

代码语言:javascript复制
print(tuple(ws.iter_rows('A1:C2')))
#((<Cell Sheet1.A1>, <Cell Sheet1.B1>, <Cell Sheet1.C1>),
# (<Cell Sheet1.A2>, <Cell Sheet1.B2>, <Cell Sheet1.C2>))
for row in ws.iter_rows('A1:C2'):
              for cell in row:
                    print cell
#<Cell Sheet1.A1>
#<Cell Sheet1.B1>
#<Cell Sheet1.C1>
#<Cell Sheet1.A2>
#<Cell Sheet1.B2>
#<Cell Sheet1.C2>

迭代文件中所有的行或者列

代码语言:javascript复制
ws.rows
#((<Cell Sheet.A1>, <Cell Sheet.B1>, <Cell Sheet.C1>),
#(<Cell Sheet.A2>, <Cell Sheet.B2>, <Cell Sheet.C2>),
#(<Cell Sheet.A3>, <Cell Sheet.B3>, <Cell Sheet.C3>))

# 或者

ws.columns
#((<Cell Sheet.A1>,
#<Cell Sheet.A2>,
#...

数据存储

为单元格赋值(前提创建了单元格对象Cell)

代码语言:javascript复制
c.value = '你好'
d.value = 'OK'

保存到文件

代码语言:javascript复制
wb = Workbook()
wb.save('demo.xlsx')

注意:这个操作将会在没有认识提示的情况下用现在写的内容,覆盖掉原文件中的所有内容

读取文件

读取文件就很简单了,一行代码解决,得到一个wb对象,其他的操作都一样

代码语言:javascript复制
from openpyxl import load_workbook
wb = load_workbook('demo.xlsx')
print(wb.get_sheet_names())
['demo_title', 'Sheet1']

04

总结

使用openpyxl进行工作的时候,这个保存唯一需要注意的是:文件是默认替换的。也就是说我们在保存文件的时候,openpyxl将进行替换而不发出告警。如果大家想保存不同阶段的文件,则可以在保存文件的时候加一个时间戳。

Python操作Excel的这些基本步骤只是冰山一角,实际上,我们还可以进行更多更复杂的数据处理操作,如表格合并、公式计算等。Python在处理Excel方面的灵活性和扩展性让我们能够以更高效的方式完成工作。

让我们抛开繁琐的手动操作,让Python成为我们工作中的好帮手吧!相信通过本文的介绍,你已经明白了如何使用Python库进行Excel文件的读取、数据处理和导出。试着在实际工作中应用Python来解放自己吧!

写到最后

感谢您的一路陪伴,用代码构建世界,一起探索充满未知且奇妙的魔幻旅程。如果您对Python编程技巧、好玩实用的开源项目、行业新知趣事和各类技术干货等充满兴趣,那么不要错过未来我为大家奉上的精彩内容!点击关注,让您的探索学习之旅更加丰富多彩,我们一同成长,一同前行!

0 人点赞