Python 操作excel的坑__真实的行和列
ztj100 2025-07-28 01:29 4 浏览 0 评论
大佬给的建议__如何快速处理excel
openpyxl库操作excel的时候,单个表的数据量大一些处理速度还能接受,如果涉及多个表甚至多个excel文件的时候速度会很慢,还是建议用pandas来处理,xlwings就更不推荐了,速度更慢。
Python 操作excel的坑----真实行和列
我们用openpyxl 操作execel 文件,有时间我们的execel 文件其实已经被改动删除了不少数据.而我们在操作excle的行和列时.就会出现行和列不对的情况!如果数据量小,那影响不大,但是如果数据量非常大,几千条,上万条,实战几十万条数据,那如果不能得到准确的行数据和列数据,你在for循环操作数据时间,就会出现极大的偏差!导致你结果无法使用!
如图所示:10行2列数据
如果我其中的一列一行清空,你看一下是什么情况呢?
如果没有错,那结果应该是1列9行--可是结果却是如下
没有错,你没有看错,还是2列10行
问题出现在什么地方?
原来exce l 在你清空的时候 ,还是会默认行和列是依然存在的,除非你是这样删除
否则行和列依然是之前没有删除之前的,哪怕清空,行和列也依然是原数据的行和列
那么我们数据清空了,如何获取真实的行和列呢?
为了简化我把核心方法写出来:
Python得到excle得到真实的行
# 得到真实的行
def get_real_max_row(sheet):
i=sheet.max_row
real_max_row = 0
while i > 0:
# print('i='+str(i))
# print('sheet[i]'+str(sheet[i]))
# for y in sheet[i]:
# print(y)
# print(str(y.value))
row_dict = {i.value for i in sheet[i]}
#得到每一行的值,如果为空,那么,i.value就是None
#因为添加的数据字段所以,在每一行中,for循环找到所有的列,
#看每一列是否都是一个None如果都是,那么这一行就是空行
#最大行减1 循环下去就会得到最终的行
#print('row_dict'+str(sheet[i]))
if row_dict == {None}:
i = i-1
else:
real_max_row = i
break
return real_max_row
Python得到excle得到真实的列
# 得到真实的列,中间如果有空列也算一列
def get_real_max_colum(sheet):
y=sheet.max_column
real_max_colum = 0
while y > 0:
#循环行得到列的数据字典,如果列都为空就是{None} 否则就是空列
row_dict = {sheet.cell(i, y).value for i in range(1,sheet.max_row+1)}
#print(row_dict)
if row_dict == {None}:
y = y-1
else:
real_max_colum=y
break
return real_max_colum
Python得到excle得到真实行列的源代码
import openpyxl
import os
import sys
#得到绝对路径_也就是pyhon文件所在的路径-这样后期打包成exe执行文件
#不会找不到路径
parent = os.path.dirname(os.path.realpath(sys.argv[0]))
#拼接路径
filenames = os.listdir(parent)
# 得到真实的行
def get_real_max_row(sheet):
i=sheet.max_row
real_max_row = 0
while i > 0:
# print('i='+str(i))
# print('sheet[i]'+str(sheet[i]))
# for y in sheet[i]:
# print(y)
# print(str(y.value))
row_dict = {i.value for i in sheet[i]}
#得到每一行的值,如果为空,那么,i.value就是None
#因为添加的数据字段所以,在每一行中,for循环找到所有的列,
#看每一列是否都是一个None如果都是,那么这一行就是空行
#最大行减1 循环下去就会得到最终的行
#print('row_dict'+str(sheet[i]))
if row_dict == {None}:
i = i-1
else:
real_max_row = i
break
return real_max_row
# 得到真实的列,中间如果有空列也算一列
def get_real_max_colum(sheet):
y=sheet.max_column
real_max_colum = 0
while y > 0:
#循环行得到列的数据字典,如果列都为空就是{None} 否则就是空列
row_dict = {sheet.cell(i, y).value for i in range(1,sheet.max_row+1)}
#print(row_dict)
if row_dict == {None}:
y = y-1
else:
real_max_colum=y
break
return real_max_colum
if __name__ == '__main__':
for filename in filenames:
if filename.endswith('.xlsx'):
wookbook = openpyxl.load_workbook(parent + '\\' + filename)
active_sheet = wookbook.active
print("最大行=" + str(active_sheet.max_row))
print('最大列=' + str(active_sheet.max_column))
print('get_real_max_row=' + str(get_real_max_row(active_sheet)))
print('get_real_max_colum=' + str(get_real_max_colum(active_sheet)))
欢迎关注和转发!希望对你有帮助
- 上一篇:Python os.path模块使用指南:轻松处理文件路径
- 已经是最后一篇了
相关推荐
- Python 操作excel的坑__真实的行和列
-
大佬给的建议__如何快速处理excelopenpyxl库操作excel的时候,单个表的数据量大一些处理速度还能接受,如果涉及多个表甚至多个excel文件的时候速度会很慢,还是建议用pandas来处理,...
- Python os.path模块使用指南:轻松处理文件路径
-
前言在Python编程中,文件和目录的操作是非常重要的一部分。为了方便用户进行文件和目录的操作,Python标准库提供了os模块。其中,os.path子模块提供了一些处理文件路径的函数和方法。本文主要...
- Python常用内置模块介绍——文件与系统操作详解
-
Python提供了多个强大的内置模块用于文件和系统操作,下面我将详细介绍最常用的几个模块及其核心功能。1.os模块-操作系统交互...
- Python Flask 建站框架实操教程(flask框架网页)
-
下面我将带您从零开始构建一个完整的Flask网站,包含用户认证、数据库操作和前端模板等核心功能。##第一部分:基础项目搭建###1.创建项目环境```bash...
- 为你的python程序上锁:软件序列号生成器
-
序列号很多同学可能开发了非常多的程序了,并且进行了...
- PO设计模式全攻略,在 UI 自动化中的实践总结(以企业微信为例)
-
一、什么是PO设计模式?PO(PageObject)设计模式将某个页面的所有元素对象定位和对元素对象的操作封装成一个Page类,即一个py文件,并以页面为单位来写测试用例,实现页面对象和测试用例的...
- 这种小工具居然也能在某鱼卖钱?我用Python一天能写...
-
前两天在某鱼闲逛,本来想找个二手机械键盘,结果刷着刷着突然看到有人在卖——Word批量转PDF小工具...
- python打包成exe,程序有图标,但是任务栏和窗口都没有显示图标
-
代码中指定图标信息#设置应用ID,确保任务栏图标正确显示ifsys.platform=="win32":importctypesapp_id=...
- 使用Python构建电影推荐系统(用python做推荐系统)
-
在日常数据挖掘工作中,除了会涉及到使用Python处理分类或预测任务,有时候还会涉及推荐系统相关任务。...
- python爬取并分析淘宝商品信息(python爬取淘宝商品数据)
-
python爬取并分析淘宝商品信息背景介绍一、模拟登陆二、爬取商品信息1.定义相关参数2.分析并定义正则3.数据爬取三、简单数据分析1.导入库2.中文显示3.读取数据4.分析价格分布5.分析销售...
- OpenCV入门学习基础教程(从小白变大神)
-
Opencv是用于快速处理图像处理、计算机视觉问题的工具,支持多种语言进行开发如c++、python、java等,下面这篇文章主要给大家介绍了关于openCV入门学习基础教程的相关资料,需要的朋友可以...
- python图像处理-一行代码实现灰度图抠图
-
抠图是ps的最基本技能,利用python可以实现用一行代码实现灰度图抠图。基础算法是...
- 从头开始学python:如何用Matplotlib绘图表
-
Matplotlib是一个用于绘制图表的库。如果你有用过python处理数据,那Matplotlib可以更直观的帮你把数据展示出来。直接上代码看例子:importmatplotlib.pyplot...
- Python爬取爱奇艺腾讯视频 250,000 条数据分析为什么李诞不值得了
-
在《Python爬取爱奇艺52432条数据分析谁才是《奇葩说》的焦点人物?》这篇文章中,我们从爱奇艺爬取了5万多条评论数据,并对一些关键数据进行了分析,由此总结出了一些明面上看不到的数据,并...
- Python Matplotlib 库使用基本指南
-
简介Matplotlib是一个广泛使用的Python数据可视化库,它可以创建各种类型的图表、图形和可视化效果。无论是简单的折线图还是复杂的热力图,Matplotlib提供了丰富的功能来满足我们...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- Python 操作excel的坑__真实的行和列
- Python os.path模块使用指南:轻松处理文件路径
- Python常用内置模块介绍——文件与系统操作详解
- Python Flask 建站框架实操教程(flask框架网页)
- 为你的python程序上锁:软件序列号生成器
- PO设计模式全攻略,在 UI 自动化中的实践总结(以企业微信为例)
- 这种小工具居然也能在某鱼卖钱?我用Python一天能写...
- python打包成exe,程序有图标,但是任务栏和窗口都没有显示图标
- 使用Python构建电影推荐系统(用python做推荐系统)
- python爬取并分析淘宝商品信息(python爬取淘宝商品数据)
- 标签列表
-
- idea eval reset (50)
- vue dispatch (70)
- update canceled (42)
- order by asc (53)
- spring gateway (67)
- 简单代码编程 贪吃蛇 (40)
- transforms.resize (33)
- redisson trylock (35)
- 卸载node (35)
- np.reshape (33)
- torch.arange (34)
- npm 源 (35)
- vue3 deep (35)
- win10 ssh (35)
- vue foreach (34)
- idea设置编码为utf8 (35)
- vue 数组添加元素 (34)
- std find (34)
- tablefield注解用途 (35)
- python str转json (34)
- java websocket客户端 (34)
- tensor.view (34)
- java jackson (34)
- vmware17pro最新密钥 (34)
- mysql单表最大数据量 (35)