python-calamine库:Python读取Excel文件

2024-05-03 13:33:53 浏览数 (1)

标签:Python,python-calamine库

今天介绍一个Python操作Excel的库:python-calamine库,可用来读取Excel文件。

首先,安装python-calamine库:

代码语言:javascript复制
pip install python-calamine

读取数据:

代码语言:javascript复制
from python_calamine import CalamineWorkbook
workbook = CalamineWorkbook.from_path(r"D:完美Excelbooks.xlsx")

下面的代码输出Excel文件工作表名:

代码语言:javascript复制
workbook.sheet_names

输出为:

['Sheet', 'Sheet1']

这是示例文件books.xlsx中包含的两个工作表名称。

可以得到指定工作表Sheet中的数据:

代码语言:javascript复制
workbook.get_sheet_by_name("Sheet").to_python()

输出示例工作表中的数据为:

代码语言:javascript复制
[['bookname', 'author', 'publisher', 'pubdate', 'ISBN'],
代码语言:javascript复制
 ['excelperfect', 'fanjy', 'dgs', '2023', '123456789'],
代码语言:javascript复制
 ['VBA Programming', 'excelperfect', 'rys', '2023', '987654321'],
代码语言:javascript复制
 ['Easy Excel VBA', 'excelperfect', '2023', '97888996620', '']]

默认情况下,输出的数据不包含工作表中的空行或空列,必须指定相关的参数才能输出完整的数据:

代码语言:javascript复制
workbook = CalamineWorkbook.from_path(r"D:完美Excelbooks.xlsx").get_sheet_by_name("Sheet").to_python(skip_empty_area=False)

还有几个常用的库,可以方便地读取Excel文件数据,但据测试python-calamine库读取的速度是最快的。

在pandas中也能使用calamine,代码如下:

代码语言:javascript复制
import pandas as pd
from python_calamine import CalamineWorkbook
workbook = CalamineWorkbook.from_path(r"D:完美Excelbooks.xlsx")
workbook.sheet_names
sheet = workbook.get_sheet_by_index(0)
data = sheet.to_python()
df = pd.DataFrame(data[1:], columns=data[0])
df.head()

欢迎在下面留言,完善本文内容,让更多的人学到更完美的知识。

0 人点赞