Python私活300元,给Excel表格打标签
蚂蚁学Python
共 2644字,需浏览 6分钟
· 2022-06-25
今天,再次收到蚂蚁老师推送的python开放需求,主要考验的是python操作excel的知识点,单子比较紧急,中午11:30收到,下午3:30要求完成。需求为:运用python操作excel文件,按公司分类进行数据统计,并按条件进行打标签。判定的条件主要为:1.高速增长:营业利润增长率大于10% 2.ST:连续两年营业利润为负 3.受疫情影响:报告期年份在2019及以后且营业利润为负 4.扭亏为盈:上期营业利润为负但本期营业利润为下 数据表如下:通过分析表中数据发现:同一公司没有集中在一起,报告年份也没有按序排列,所以,在进行标签判定前,首先要对数据进行处理。
df=pd.read_excel("基础数据.xlsx")
info={}
company=set(df["公司名称"])
for i in company:
info[i]=df[df["公司名称"]==i]["公司名称"].count()
df["利润"]=df["营业收入(万元)"]-df["营业支出(万元)"]
df1=df.sort_values(["公司名称","报告期年份"])
以上代码,首先利用set对df公司名称去重,得到所有公司名称,将公司名称与出现次数存入字典,为后续操作提供便利。
同时增加利润列,算出每期利润值,作为之后标签判断的主要数据。
接着根据需求,运用sort_values对公司名称、报告年份进行排序重组,生成新的df1,也是后续操作的基础(之前也考虑使用groupby进行分组操作,后来改为现在思路)。
df1.reset_index(drop=True,inplace=True)
在后来操作中发现,因为排序打乱了索引,此处需要重置一下索引。接下来便是循环遍历打标签:
for i in range(len(df1.index)):
if df1.loc[i, "报告期年份"] >= 2019 and df1.loc[i, "利润"] < 0:
df1.loc[i, "受疫情影响"] = "是"
for j in info.keys():
for i in range(len(df1.index)-1):
try:
if df1.loc[i,"公司名称"]==j and df1.loc[i+1,"公司名称"]==j and df1.loc[i,"利润"]*1.1<df1.loc[i+1,"利润"] and df1.loc[i+1,"利润"]>0:
df1.loc[i+1,"高速增长"]="是"
if df1.loc[i,"公司名称"]==j and df1.loc[i,"利润"]<0 and df1.loc[i+1,"利润"]>0:
df1.loc[i+1, "扭亏为盈"] = "是"
if df1.loc[i, "公司名称"] == j and df1.loc[i, "利润"] < 0 and df1.loc[i + 1, "利润"] < 0:
df1.loc[i+1, "ST"] = "是"
except:
continue
第一个循环具有通用性,直接遍历df中所有数据即可;接下来的操作,则需要循环遍历公司名称,遍历年份数据进行数据匹配,对应打标签。最后,将打好标签的数据处用pandas的to_excel导出为新的EXCEL文件,效果如下:
谢谢蚂蚁老师不断为大家提供实战的机会,这不仅是python友们学习提升的机会,更是思维改变生活、思维创造生活、思维服务生活的最好体现,相信每一位蚂蚁群的朋友们,在帅帅老师的引领下,一定会创造属于自己的更加美好、更加充实、更具挑战的新生活。
今晚来蚂蚁老师抖音直播间,Python带副业全套餐有优惠!!!
评论
Python列表知识应知应会
点击上方“Go语言进阶学习”,进行关注回复“Go语言”即可获赠从入门到进阶共10本电子书今日鸡汤只在此山中,云深不知处。一、前言 在Python程序开发中,列表(List)经常会使用。假设一个班里有50个学生现需要统计每一个学生的总成绩情况,如果不使用列
Go语言进阶学习
0
Python 字符串应该用双引号还是单引号?
转载来源:洪尔摩斯PyCharm升级至 2023.2版本后,经常弹出来一个提示问我要不要试一下Black formatter。试了一下,这个Black formatter 很有个性,特别喜欢换行。我的一个文件用PyCharm自带的代码整理器整理完之后是500行左右,然后再用Black整理就变成600
菜鸟学Python
0
delorean,一个超级实用的 Python 库!
作者通常周更,为了不错过更新,请点击上方“Python碎片”,“星标”公众号大家好,今天为大家分享一个超级实用的 Python 库 - delorean。Github地址:https://github.com/myusuf3/delorean/时间在计算机科学和软件开发中是一个至关重要的概念。Pyt
Python 碎片
0
五一Python抢票神器来了
还在为五一回家抢不到火车票发愁吗?今天介绍一个Python抢票神器,希望对你有帮助。Py12306是一个流行的开源项目,旨在帮助用户更便捷地查询和预订中国铁路12306网站上的火车票。以下是使用Py12306的基本步骤和一些注意事项:安装与环境准备安装Python: 确保你的系统中安装了Python
Python小二
1
PyPy为什么能让Python比C还快?一文了解内在机制
我的小册:(小白零基础用Python量化股票分析小册) ,原价299,限时特价2杯咖啡,满100人涨10元。来源:机器之心「如果想让代码运行得更快,您应该使用 PyPy。」—— Python 之父 Guido van Rossum对于研究人员来说,迅速把想法代码化并查看其是否行得通至关重要。Pyth
菜鸟学Python
0
CleverCSV,一个神奇的 python 库!
我的小册:(小白零基础用Python量化股票分析小册) ,原价299,限时特价2杯咖啡,满100人涨10元。来源丨网络介绍CleverCSV 是一个基于 Python 的库,旨在提供比标准库 csv 更智能和灵活的方法来处理 CSV 文件。该库使用机器学习算法来探测 CSV 文件的正确拨号结构,从而
菜鸟学Python
0
python读取多个excel表多个sheet后映射匹配再分组计算、纵向拼接
大家好,我是飞奔的蜗牛ing。一、前言前几天在一个客户给到一单数据处理的 问题,需求是这样的:1.表“aa2020”中2020年数据需要按季度分成四个表。(1-3月、4-6月、7-9月、10-12月)2.表“2020年一季度”代表2020年一季度客户所对应的管理档位,需要把表中的档位导入附表“aa2
IT共享之家
0
给AIPC浇点“冷水”
随着4月18日联想在其Tech World上发布了他们所定义的国内市场上首个“严格意义上的AIPC产品”,加上4月11日华为发布的MateBook X
Pro、3月22日微软发布的Surface Pro 10 商用版和 Surface Laptop 6 商用版、3 月 18 日荣耀发布的MagicB
中智观察
0