标签:Python,python-calamine库
今天介绍一个Python操作Excel的库:python-calamine库,可用来读取Excel文件。
首先,安装python-calamine库:
代码语言:javascript复制pip install python-calamine
读取数据:
代码语言:javascript复制from python_calamine import CalamineWorkbook
workbook = CalamineWorkbook.from_path(r"D:完美Excelbooks.xlsx")
下面的代码输出Excel文件工作表名:
代码语言:javascript复制workbook.sheet_names
输出为:
['Sheet', 'Sheet1']
这是示例文件books.xlsx中包含的两个工作表名称。
可以得到指定工作表Sheet中的数据:
代码语言:javascript复制workbook.get_sheet_by_name("Sheet").to_python()
输出示例工作表中的数据为:
代码语言:javascript复制[['bookname', 'author', 'publisher', 'pubdate', 'ISBN'],
代码语言:javascript复制 ['excelperfect', 'fanjy', 'dgs', '2023', '123456789'],
代码语言:javascript复制 ['VBA Programming', 'excelperfect', 'rys', '2023', '987654321'],
代码语言:javascript复制 ['Easy Excel VBA', 'excelperfect', '2023', '97888996620', '']]
默认情况下,输出的数据不包含工作表中的空行或空列,必须指定相关的参数才能输出完整的数据:
代码语言:javascript复制workbook = CalamineWorkbook.from_path(r"D:完美Excelbooks.xlsx").get_sheet_by_name("Sheet").to_python(skip_empty_area=False)
还有几个常用的库,可以方便地读取Excel文件数据,但据测试python-calamine库读取的速度是最快的。
在pandas中也能使用calamine,代码如下:
代码语言:javascript复制import pandas as pd
from python_calamine import CalamineWorkbook
workbook = CalamineWorkbook.from_path(r"D:完美Excelbooks.xlsx")
workbook.sheet_names
sheet = workbook.get_sheet_by_index(0)
data = sheet.to_python()
df = pd.DataFrame(data[1:], columns=data[0])
df.head()
欢迎在下面留言,完善本文内容,让更多的人学到更完美的知识。