Python实现循环的最快方式（for、while等速度对比）

289 阅读 0 评论 191 点赞

我是靠谱客的博主苹果纸飞机，这篇文章主要介绍Python实现循环的最快方式（for、while等速度对比），现在分享给大家，希望可以做个参考。

众所周知，Python不是一种执行效率较高的语言。此外在任何语言中，循环都是一种非常消耗时间的操作。假如任意一种简单的单步操作耗费的时间为1个单位，将此操作重复执行上万次，最终耗费的时间也将增长上万倍。

While和For是Python中常用的两种实现循环的关键字，它们的运行效率实际上是有差距的。比如下面的测试代码：

import timeit


def while_loop(n=100_000_000):
    i = 0
    s = 0
    while i < n:
        s += i
        i += 1
    return s


def for_loop(n=100_000_000):
    s = 0
    for i in range(n):
        s += i
    return s


def main():
    print('while looptt', timeit.timeit(while_loop, number=1))
    print('for looptt', timeit.timeit(for_loop, number=1))


if __name__ == '__main__':
    main()
# => while loop               4.718853999860585
# => for loop                 3.211570399813354

这是一个简单的求和操作，计算从1到n之间所有自然数的总和。可以看到For循环相比While要快1.5秒。

其中的差距主要在于两者的机制不同。

在每次循环中，While实际上比For多执行了两步操作：边界检查和变量i的自增。即每进行一次循环，While都会做一次边界检查 (While i < n）和自增计算（i +=1）。这两步操作都是显示的纯Python代码。

For循环不需要执行边界检查和自增操作，没有增加显示的Python代码（纯Python代码效率低于底层的 C代码）。当循环的次数足够多，就出现了明显的效率差距。

可以再增加两个函数，在For循环中加上不必要的边界检查和自增计算：

import timeit


def while_loop(n=100_000_000):
    i = 0
    s = 0
    while i < n:
        s += i
        i += 1
    return s


def for_loop(n=100_000_000):
    s = 0
    for i in range(n):
        s += i
    return s


def for_loop_with_inc(n=100_000_000):
    s = 0
    for i in range(n):
        s += i
        i += 1
    return s


def for_loop_with_test(n=100_000_000):
    s = 0
    for i in range(n):
        if i < n:
            pass
        s += i
    return s


def main():
    print('while looptt', timeit.timeit(while_loop, number=1))
    print('for looptt', timeit.timeit(for_loop, number=1))
    print('for loop with incrementtt',
          timeit.timeit(for_loop_with_inc, number=1))
    print('for loop with testtt', timeit.timeit(for_loop_with_test, number=1))


if __name__ == '__main__':
    main()
# => while loop               4.718853999860585
# => for loop                 3.211570399813354
# => for loop with increment          4.602369500091299
# => for loop with test               4.18337869993411

可以看出，增加的边界检查和自增操作确实大大影响了For循环的执行效率。

前面提到过，Python底层的解释器和内置函数是用C语言实现的。而C语言的执行效率远大于Python。

对于上面的求等差数列之和的操作，借助于Python内置的Sum函数，可以获得远大于 For或While循环的执行效率。

import timeit


def while_loop(n=100_000_000):
    i = 0
    s = 0
    while i < n:
        s += i
        i += 1
    return s


def for_loop(n=100_000_000):
    s = 0
    for i in range(n):
        s += i
    return s


def sum_range(n=100_000_000):
    return sum(range(n))


def main():
    print('while looptt', timeit.timeit(while_loop, number=1))
    print('for looptt', timeit.timeit(for_loop, number=1))
    print('sum rangett', timeit.timeit(sum_range, number=1))


if __name__ == '__main__':
    main()
# => while loop               4.718853999860585
# => for loop                 3.211570399813354
# => sum range                0.8658821999561042

可以看到，使用内置函数Sum替代循环之后，代码的执行效率实现了成倍的增长。

内置函数Sum的累加操作实际上也是一种循环，但它由C语言实现，而For循环中的求和操作是由纯Python代码s += i实现的。C > Python。

再拓展一下思维。小时候都听说过童年高斯巧妙地计算1到100之和的故事。1…100 之和等于 (1 + 100) * 50。这个计算方法同样可以应用到上面的求和操作中。

import timeit


def while_loop(n=100_000_000):
    i = 0
    s = 0
    while i < n:
        s += i
        i += 1
    return s


def for_loop(n=100_000_000):
    s = 0
    for i in range(n):
        s += i
    return s


def sum_range(n=100_000_000):
    return sum(range(n))


def math_sum(n=100_000_000):
    return (n * (n - 1)) // 2


def main():
    print('while looptt', timeit.timeit(while_loop, number=1))
    print('for looptt', timeit.timeit(for_loop, number=1))
    print('sum rangett', timeit.timeit(sum_range, number=1))
    print('math sumtt', timeit.timeit(math_sum, number=1))


if __name__ == '__main__':
    main()
# => while loop               4.718853999860585
# => for loop                 3.211570399813354
# => sum range                0.8658821999561042
# => math sum                 2.400018274784088e-06

最终Math sum的执行时间约为2.4e-6，缩短了上百万倍。这里的思路就是，既然循环的效率低，一段代码要重复执行上亿次。

索性直接不要循环，通过数学公式，把上亿次的循环操作变成只有一步操作。效率自然得到了空前的加强。最后的结论（有点谜语人）：

实现循环的最快方式—— —— ——就是不用循环

对于Python而言，则尽可能地使用内置函数，将循环中的纯Python代码降到最低。