首页 >excel操作 > 内容

python自动数据分析_老板让我从几百个Excel中查找数据,我用python一分钟搞定!...

2023年7月28日 15:59

be55514942105e708866e0d29fd93f41.png

相信大家最近都快被python烦死了,朋友圈,公众号推文,小视频上都是关于python的广告,什么面试录取会用python的人,刚来的同事因为会用python升职加薪啦等等。但是小编觉得,python就是一款工具,最大的特点是它能帮我们解决那些重复性工作,解放我们双手。下面,小编给大家分享的这篇文章就是关于python办公自动化的,希望能对大家有所帮助。

以下文章来源:早起Python

作者:陈熹

大家好,又到了Python办公自动化系列。

今天分享一个真实的办公自动化需求,大家一定要仔细阅读需求说明,在理解需求之后即可体会Python的强大!

一、需求说明

首先我们来看下今天的需求,有一份档案记录总表的Excel工作簿, 每天会根据当天日期建立新表,每天的表格内包含所有档案信息,同时也有可能会添加新的档案名。同个年度的总表在年末可能会有两、三百个工作表,同时每个表中可能也存在千余份档案信息。表格形式如下(为了直观呈现本例以7个工作表和十余份档案的形式呈现)

38406b70dac79e041d0f73647c8ae6f2.png

需要完成的操作:为了方便审查特定档案信息,需要给出档案名后生成一份新表,该表包含指定档案在所有日期(即所有工作表)中的记录。最终结果如下(以档案x003为例):

3b17cb6241c6861ba323abd32dbbd9be.png

也就是老板说:给我把这几百个表格中所有包含档案x003的相关数据全部找到并整理个新的表格给我!

二、步骤分析

正式写代码前可以把需求分析清楚,将复杂问题简单化。

说白了,这个需求要求把所有日期工作表中的特定行都提取出来整合成一个新表。那么我们可以遍历每一张表,然后遍历第一列(名称列,也可以看作A列)每一个有数据的单元格,如果单元格中的文字为我们需要的档案名,就把这一行提取出来放到新的表格中,进一步梳理步骤为

建立一个新的EXCEL工作簿

新表的表头和档案记录Excel中的一样,也是名称、配置、提交日期等

遍历档案记录Excel的每一张工作表sheet,再遍历第一列每一个有数据的单元格,对内容进行判断

找到符合条件的单元格后获取行号,根据行号将当前表中的特定行提取出来,并将行追加新创建的表中

分析清楚就可以着手写代码了

三、Python实现

首先导入需要的库本例中涉及旧表的打开和新表的创建,因此需要从openpyxl导入load_workbook和Workbook(如果是ppt和word用到的模块就更智能了,一个方法就能搞定)

fromopenpyxlimportload_workbook,Workbook

接着导入旧表及创建新表

#从桌面上获取总表

filepath=r'C:\Users\chenx\Desktop\台账.xlsm'#根据实际情况进行修改

workbook=load_workbook(filepath)

#创建新的Excel工作簿获取到工作表

new_workbook=Workbook()

new_sheet=new_workbook.active

#给新表写入表头

new_headers=['名称','配置','提交日期','受限操作','操作时间','状态','存储位置']

new_sheet.append(new_headers)

现在是核心步骤:多次遍历,可以用workbook.sheetnames获取工作簿所有工作表名称的列表,然后遍历即可

foriinworkbook.sheetnames:

sheet=workbook[i]

#获取档案名称所在列

names=sheet['A']

按照前面的分析,需要遍历名称列,判断每一个单元格的值是不是需要的档案名。这里应注意,如果已经循环到需要的单元格,就可以停止循环了,但一定要把符合单元格的行号传递给一个变量做记录,不然一旦break出循环就没有记忆了

flag=0

forcellinnames:

ifcell.value==keyword:#这里的keyword就是档案名,可以以档案x003为例

flag=cell.row

break

获得到符合条件的行号后用sheet[flag]就可以拿到符合行了。openpyxl不支持旧表的一整行写入新表,因此应对策略就是将这一行的所有单元格具体值组装成一个列表,用sheet.append(列表)的方法写入新表,遍历部分的完整代码如下:

foriinworkbook.sheetnames:

sheet=workbook[i]

names=sheet['A']

flag=0

forcellinnames:

ifcell.value==keyword:

flag=cell.row

break

ifflag:#如果flag没有被修改则不需要顺序进行下列代码

data_lst=[]

forcellinsheet[flag]:

#这里加上一个对内容的判断,是让无内容的行直接放空,而不是写入一个none

ifcell.value:

data_lst.append(str(cell.value))

else:

data_lst.append('')

new_sheet.append(data_lst)

最后记得保存

new_workbook.save(r'C:\Users\chenx\Desktop\台账查询.xlsx')

小结

这是经过一定改编的真实案例,可见Python自动化办公确实能够帮助我们解放自己的双手,不过在写自动化脚本之前也要先拆分任务,明确思路再进行,如果对本文的代码和数据感兴趣可以在后台回复自动化获取。最后还是希望大家能够理解Python办公自动化的一个核心就是批量操作-解放双手,让复杂的工作自动化!

完 谢谢观看


参考文章:https://blog.csdn.net/weixin_29830873/article/details/113676159

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,在此表示感谢。

特别提醒:

1、请用户自行保存原始数据,为确保安全网站使用完即被永久销毁,如何人将无法再次获取。

2、如果上次文件较大或者涉及到复杂运算的数据,可能需要一定的时间,请耐心等待一会。

3、请按照用户协议文明上网,如果发现用户存在恶意行为,包括但不限于发布不合适言论妄图

     获取用户隐私信息等行为,网站将根据掌握的情况对用户进行限制部分行为、永久封号等处罚。

4、如果文件下载失败可能是弹出窗口被浏览器拦截,点击允许弹出即可,一般在网址栏位置设置

5、欢迎将网站推荐给其他人,网站持续更新更多功能敬请期待,收藏网站高效办公不迷路。

      



登录后回复

共有0条评论