文章目录
ValueError: This sheet is too large! Your sheet size is: 1052091, 17 Max sheet size is: 1048576, 16384
pandas导出excel,由于excel限制,.xls
文件结尾,最大限制行数65535,.xlsx
文件结尾,最大限制行数1048576
解决方案1: 用to_csv,写道csv文件里, 多少数据都能写进去。目前我处理上亿行都没问题。
代码语言:javascript复制df.to_csv('xxx.csv', index=False)
解决方案2: 分割为多个sheet写入文件
代码语言:javascript复制df = pd.read_sql(sql, con=self.con)
line,column=df.shape # 返回行数和列数
writer = pd.ExcelWriter(path="./data/poi_data/%s.xlsx"%table_name, engine='xlsxwriter',
options={'strings_to_urls': False}) # 不将字符串转换为URL的选项创建ExcelWriter对象
if line>1048576: # excel最大行数1048576,最大列数16384
#df.head(1048576).to_excel(excel_writer=writer,sheet_name=table_name,index=False) # ,engine='openpyxl'
#df.tail(line-1048576).to_excel(excel_writer=writer, sheet_name=table_name '_2', index=False)
df.iloc[:1048576,:].to_excel(excel_writer=writer, sheet_name=table_name, index=False) # ,engine='openpyxl'
df.iloc[1048576:,:].to_excel(excel_writer=writer, sheet_name=table_name '_2', index=False)
else:
df.to_excel(excel_writer=writer, sheet_name=table_name, index=False)
writer.close()
分块读取pandas文件,并将每个块保存在excel文件中
代码语言:javascript复制import pandas as pd
chunksize = 10 ** 6
for chunk in pd.read_csv('basel.txt', chunksize=chunksize):
chunk.to_excel('basel_' str(chunk) '.excel')
分成几块,把每一块写在一张纸上。 np.array_split拆分为若干个块 np.split需要相等的除法
代码语言:javascript复制import numpy as np
nsheets = 10 # you may change it
for i, temp in enumerate(np.array_split(df, nsheets)):
temp.to_excel('basel.xls', sheet_name=f'sheet_{i}')
参考:https://blog.csdn.net/weixin_41712499/article/details/119949179 https://blog.csdn.net/weixin_46277779/article/details/126058357 https://www.cnpython.com/qa/1302856