让 Python 提速超过 30 倍的必杀技:Cython

Python知识圈

共 3319字,需浏览 7分钟

 · 2020-02-21



点击上方Python知识圈,选择设为星标

回复1024获取Python资料


473c198133c559ceb9e3d2637b0a5425.webp

转自:新智元

阅读文本大概需要 5 分钟


【导读】众所周知,作为人工智能界最流行的语言,Python功能强大,但也运行缓慢。如果你的代码是纯Python、或者必须用一个大的for循环并且不能放入矩阵因为数据必须按顺序处理的时候,有没有办法加速Python呢?本文为你解答。


人工智能最火的语言,自然是被誉为迄今为止最容易使用的代码之一的Python。Python代码素来以直观、高可读性著称。


然而,易用的背后,是Python无法逾越的障碍:慢。尤其是C程序员,这群快枪手简直无法忍受Python的慢。


所以有人就想了各种方法去解决这个问题,本文就介绍其中的一种。如果你的代码是纯Python,或者你必须用一个大的for循环却无法放入矩阵因为数据必须按顺序处理,那么就可以使用Cython来加速Python。


什么是Cython?


根据维基百科:Cython是结合了Python和C的语法的一种语言,可以简单的认为就是给Python加上了静态类型后的语法,使用者可以维持大部分的Python语法,而不需要大幅度调整主要的程式逻辑与算法。但由于会直接编译为二进制程序,所以性能较Python会有很大提升。


Cython被大量运用在CPython函式库的撰写,以取得较高的执行效能。Cython将CPython代码转译成 C 或 C++ 语法后,自动包装上函式呼叫界面生成 .pyx 后缀的执行档,即可当成普通的函式库。其性能一般逊于原生的 C/C++ 函式库,但由于 CPython 语法的易用性可以缩短开发时间。Cython 也可以用于编译以 C/C++ 为 CPython 撰写的函式库。


目前Cython可以在 Windows, macOS 与 Linux 上使用,可以编译 2.6, 2.7 与 3.3 至 3.7 版本的 CPython 语法。


我们对Python代码的唯一调整是向每个变量添加类型信息。通常,我们可以在Python中声明一个变量,如下所示:


x = 0.5


使用Cython,我们将为该变量添加一个类型:


cdef float x = 0.5


这告诉Cython我们的变量是浮点数,和C一样。使用纯Python,变量的类型是动态确定的。Cython中类型的显式声明是可以转换为C的原因,因为需要显式类型声明+。


安装Cython只需要一行pip:


pip install cython


Cython的类型


使用Cython时,有两种不同的类型,用于变量和函数。


对于变量,我们有:


cdef int a, b, c
cdef char *s
cdef float x = 0.5 (single precision)
cdef double x = 63.4 (double precision)
cdef list names
cdef dict goals_for_each_play
cdef object card_deck


请注意所有这些类型都来自C/C++! 


对于功能:


def — regular python function, calls from Python only.
cdef — Cython only functions which can’t be accessed from python-only code i.e must be called within Cython
cpdef — C and Python. Can be accessed from both C and Python


由此开始,我们要开启加速了哦!准备好…


使用Cython加速代码


我们要做的第一件事就是设置Python代码基准:用于计算数字阶乘的for循环。 


原始Python代码如下所示:


def test(x):

y
= 1

for i in range(x+1):

y *
= i

return y


Cython相同功能看起来非常相似。确保Cython代码文件使用 .pyx扩展名。代码本身的唯一变化是我们需要提前声明变量和函数的类型,示例代码如下:


cpdef int test(int x):

cdef int y
= 1

cdef int i

for i in range(x+1):

y *
= i

return y


注意函数有一个cpdef来确保我们可以从Python调用它。另外还需要为函数中的所有变量设置类型从而告知C编译器。


接下来,创建一个setup.py文件,该文件将Cython代码编译为C代码:


from distutils.core import setup
from Cython.Build import cythonize

setup(ext_modules = cythonize('run_cython.pyx'))


并执行编译:


python setup.py build_ext --inplace


搞定!我们的C代码已经编译好并且可以使用了。


在Cython代码所在的文件夹中拥有运行C代码所需的所有文件,包括run_cython.c文件,你尽可以进去仔细看个究竟。


现在,我们要测试全新超快速C代码了!准备好了吗?3、2、1、go!


import run_python
import run_cython
import time


number = 10


start = time.time()
run_python.test(number)
end = time.time()


py_time = end - start
print("Python time = {}".format(py_time))


start = time.time()
run_cython.test(number)
end = time.time()


cy_time = end - start
print("Cython time = {}".format(cy_time))


print("Speedup = {}".format(py_time / cy_time))


Cython几乎可以为任何原始Python代码提供良好的加速,不需要做太多额外的工作。记住,你用的循环越多、处理的数据越多,Cython就越有帮助。


看看下表,其中显示了Cython为不同的阶乘值提供了多少速度。我们使用Cython获得了超过36倍的加速!


875f1a62962d6a9ea711528b6570dbc7.webp


参考链接:

https://towardsdatascience.com/use-cython-to-get-more-than-30x-speedup-on-your-python-code-f6cb337919b6



c80b635a93eb15e023a3f127b2211a44.webp

-----------------------公众号:Python知识圈(ID:PythonCircle博客:www.pyzhishiquan.com知乎:Python知识圈bilibili:菜鸟程序员的日常

一个学习Python的人,喜欢分享,喜欢搞事情!长按下图二维码关注,和你一起领悟Python的魅力


留言打卡 DAY 08

今日的留言话题是:你觉得Python性能慢的缺点会对哪些方面的工作有影响?如何避免?关于留言打卡的规则参考:留言打卡第二季  (点击链接查看规则),请按照 昵称+天数(请以自己实际打卡的天数为准,如day1 or day2 or day3)+ 留言内容(不少于15字)的方式留言。

Python知识圈公众号的交流群已经建立,群里可以领取 Python 和人工智能学习资料,大家可以一起学习交流,效率更高,如果是想发推文、广告、砍价小程序的敬请绕道一定记得备注「交流学习」,我会尽快通过好友申请哦!通过好友后私聊我「学习资料」或者「进群」都可以。

扫码添加,备注:交流学习




往期推荐01

公众号所有文章汇总导航(2-10更新)

02

拒绝低效!Python教你爬虫公众号文章和链接

03

接私活必备的 10 个开源项目,不用自己亲自造轮子


分享给你的朋友

点个在看

0f2b89288323f7bf27752b869fc00701.webp

浏览 7
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报