numpy和pandas库实战——批量得到文件夹下多个CSV文件中的第一列数据并求其最值

Python爬虫与数据挖掘

共 1304字,需浏览 3分钟

 · 2020-09-23

点击上方“Python爬虫与数据挖掘”,进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

噫吁嚱,危乎高哉!蜀道之难,难于上青天!

/前言/

    前几天群里有个小伙伴问了一个问题,关于Python读取文件夹下多个CSV文件中的第一列数据并求其最大值和最小值,大家讨论的甚为激烈,在此总结了两个方法,希望后面有遇到该问题的小伙伴可以少走弯路。


/一、问题描述/

   如果想求CSV或者Excel中的最大值或者最小值,我们一般借助Excel中的自带函数max()和min()就可以求出来。如果只是一两个文件,处理起来肯定是小菜一碟了,当文件的个数达到上百个,如果再按照该方法进行的话,那可就费时费力了,事倍功半。

    不过白慌,针对下图中的多个CSV文件,我们可以利用Python来一次性遍历读取多个文件,然后分别对文件进行处理,事半功倍。


/二、解决方法/

1、首先来看看文件内容,这里取其中一个文件的内容,如下图所示。

    当然这只是文件内容中的一小部分,真实的数据量绝对不是21个。

2、现在我们想对第一列或者第二列等数据进行操作,以最大值和最小值的求取为例,这里以第一列为目标数据,来进行求值。

    通常我们通过Python来处理数据,用的比较多的两个库就是numpy和pandas,在本篇文章中,将分别利用两个库来进行操作。

3、其中使用pandas库来实现读取文件夹下多个CSV文件中的第一列数据并求其最大值和最小值的代码如下图所示。

4、通过pandas库求取的结果如下图所示。

    通过该方法,便可以快速的取到文件夹下所有文件的第一列的最大值和最小值。

5、下面使用numpy库来实现读取文件夹下多个CSV文件中的第一列数据并求其最大值和最小值的代码如下图所示。

6、通过numpy库求取的结果如下图所示。

通过该方法,也可以快速的取到文件夹下所有文件的第一列的最大值和最小值。


/小结/

    本文基于Python,使用numpy库和pandas库实现了读取文件夹下多个CSV文件,并求取文件中第一列数据的最大值和最小值,当然除了这两种方法之外,肯定还有其他的方法也可以做得到的,欢迎大家积极探讨。

    想学习更多关于Python的知识,可以参考学习网址:http://pdcfighting.com/,点击阅读原文,可以直达噢~

------------------- End -------------------

往期精彩文章推荐:

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群

万水千山总是情,点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

浏览 28
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报