0.052 秒打开 100GB 数据,这个Python开源库火爆了!
Python网络爬虫与数据挖掘
共 4380字,需浏览 9分钟
· 2020-11-25
编译 | AI科技大本营(ID:rgznai100)
为什么要选择vaex?
性能:处理海量表格数据,每秒处理超过十亿行 虚拟列:动态计算,不浪费内存 高效的内存在执行过滤/选择/子集时没有内存副本。 可视化:直接支持,单线通常就足够了。 用户友好的API:只需处理一个数据集对象,制表符补全和docstring可以帮助你:ds.mean ,类似于Pandas。 精益:分成多个包 Jupyter集成:vaex-jupyter将在Jupyter笔记本和Jupyter实验室中提供交互式可视化和选择。
Vaex 官方网站:https://vaex.io/ 文档:https://docs.vaex.io/ GitHub:https : //github.com/vaexio/vaex PyPi:https://pypi.python.org/pypi/vaex/
回复关键字“简明python ”,立即获取入门必备书籍《简明python教程》电子版
回复关键字“爬虫”,立即获取爬虫学习资料
推荐阅读
评论