0

0

python 基准测试(cProfile kcachegrind line_profiler memory_profiler)

雪夜

雪夜

发布时间:2025-07-14 09:52:01

|

1015人浏览过

|

来源于php中文网

原创

learn from 《python高性能(第2版)》

类似工具pycharm profile对函数调用效率进行测试

1. 例子

一个圆周运动的动画

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">from matplotlib import pyplot as pltfrom matplotlib import animationfrom random import uniformimport timeitclass Particle:    __slots__ = ('x', 'y', 'ang_speed')    # 声明成员只允许这么多,不能动态添加,当生成大量实例时,可以减少内存占用    def __init__(self, x, y, ang_speed):        self.x = x        self.y = y        self.ang_speed = ang_speedclass ParticleSimulator:    def __init__(self, particles):        self.particles = particles    def evolve(self, dt):        timestep = 0.00001        nsteps = int(dt / timestep)        for i in range(nsteps):            for p in self.particles:                norm = (p.x ** 2 + p.y ** 2) ** 0.5                v_x = (-p.y) / norm                v_y = p.x / norm                d_x = timestep * p.ang_speed * v_x                d_y = timestep * p.ang_speed * v_y                p.x += d_x                p.y += d_ydef visualize(simulator):    X = [p.x for p in simulator.particles]    Y = [p.y for p in simulator.particles]    fig = plt.figure()    ax = plt.subplot(111, aspect='equal')    line, = ax.plot(X, Y, 'ro')    # Axis limits    plt.xlim(-1, 1)    plt.ylim(-1, 1)    # It will be run when the animation starts    def init():        line.set_data([], [])        return line,    def animate(i):        # We let the particle evolve for 0.1 time units        simulator.evolve(0.01)        X = [p.x for p in simulator.particles]        Y = [p.y for p in simulator.particles]        line.set_data(X, Y)        return line,    # Call the animate function each 10 ms    anim = animation.FuncAnimation(fig,                                   animate,                                   init_func=init,                                   blit=True,                                   interval=10)    plt.show()def test_visualize():    particles = [Particle(0.3, 0.5, +1),                 Particle(0.0, -0.5, -1),                 Particle(-0.1, -0.4, +3),                 Particle(-0.2, -0.8, +3),]    simulator = ParticleSimulator(particles)    visualize(simulator)if __name__ == '__main__':    test_visualize()</code>
python 基准测试(cProfile \ kcachegrind \ line_profiler \ memory_profiler)
2. 运行耗时测试linux time 命令代码语言:javascript代码运行次数:0运行复制
<code class="javascript">def benchmark():    particles = [Particle(uniform(-1.0, 1.0),                          uniform(-1.0, 1.0),                          uniform(-1.0, 1.0))                  for i in range(100)]    simulator = ParticleSimulator(particles)    # visualize(simulator)    simulator.evolve(0.1)if __name__ == '__main__':    benchmark()</code>

生成100个实例,模拟 0.1 秒

在 linux 中进行测试耗时:

立即学习Python免费学习笔记(深入)”;

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">time python my.pyreal    0m10.435s  # 进程实际花费时间user    0m2.078s  # 计算期间 所有CPU花费总时间sys     0m1.412s  #  执行系统相关任务(内存分配)期间,所有CPU花费总时间</code>
python timeit包指定 循环次数、重复次数代码语言:javascript代码运行次数:0运行复制
<code class="javascript">def timing():    result = timeit.timeit('benchmark()',                           setup='from __main__ import benchmark',                           number=10)    # Result is the time it takes to run the whole loop    print(result)    result = timeit.repeat('benchmark()',                           setup='from __main__ import benchmark',                           number=10,                           repeat=3)    # Result is a list of times    print(result)</code>

输出:

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">6.9873279229996115[6.382431660999828, 6.248147055000118, 6.325469069000064]</code>
pytest、pytest-benchmark代码语言:javascript代码运行次数:0运行复制
<code class="javascript">pip install pytestpip install pytest-benchmark</code>
代码语言:javascript代码运行次数:0运行复制
<code class="javascript">$ pytest test_simul.py::test_evolve=================== test session starts ====================platform linux -- Python 3.8.10, pytest-7.1.2, pluggy-1.0.0benchmark: 3.4.1 (defaults: timer=time.perf_counter disable_gc=False min_rounds=5 min_time=0.000005 max_time=1.0 calibration_precision=10 warmup=False warmup_iterations=100000)rootdir: /mnt/d/gitcode/Python_learning/Python-High-Performance-Second-Edition-master/Chapter01plugins: benchmark-3.4.1collected 1 itemtest_simul.py .                                      [100%]---------------------------------------------- benchmark: 1 tests ---------------------------------------------Name (time in ms)         Min      Max     Mean  StdDev   Median     IQR  Outliers      OPS  Rounds  Iterations---------------------------------------------------------------------------------------------------------------test_evolve           15.9304  42.7975  20.1502  5.6825  18.2795  3.7249       5;5  49.6274      58           1---------------------------------------------------------------------------------------------------------------Legend:  Outliers: 1 Standard Deviation from Mean; 1.5 IQR (InterQuartile Range) from 1st Quartile and 3rd Quartile.  OPS: Operations Per Second, computed as 1 / Mean</code>

上面显示,测了58次,用时的最小、最大、均值、方差、中位数等

3. cProfile 找出瓶颈profile包是 python写的开销比较大,cProfile 是C语言编写的,开销小代码语言:javascript代码运行次数:0运行复制
<code class="javascript">python -m cProfile simul.py</code>
代码语言:javascript代码运行次数:0运行复制
<code class="javascript">$ python -m cProfile simul.py         2272804 function calls (2258641 primitive calls) in 8.209 seconds   Ordered by: standard name   ncalls  tottime  percall  cumtime  percall filename:lineno(function)       30    0.000    0.000    0.001    0.000 <__array_function__ internals>:177(any)      160    0.000    0.000    0.002    0.000 <__array_function__ internals>:177(column_stack)      161    0.000    0.000    0.004    0.000 <__array_function__ internals>:177(concatenate)       34    0.000    0.000    0.000    0.000 <__array_function__ internals>:177(copyto)       30    0.000    0.000    0.002    0.000 <__array_function__ internals>:177(linspace)       30    0.000    0.000    0.000    0.000 <__array_function__ internals>:177(ndim)       30    0.000    0.000    0.000    0.000 <__array_function__ internals>:177(result_type)        5    0.000    0.000    0.116    0.023 <frozen importlib._bootstrap>:1002(_gcd_import)   485/33    0.001    0.000    6.807    0.206 <frozen importlib._bootstrap>:1017(_handle_fromlist)   。。。</code>

输出结果非常长

tottime 排序 -s tottime,看前几个就是耗时最多的几个

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">$ python -m cProfile -s tottime simul.py         2272784 function calls (2258621 primitive calls) in 7.866 seconds   Ordered by: internal time   ncalls  tottime  percall  cumtime  percall filename:lineno(function)     1258    2.498    0.002    2.498    0.002 {built-in method posix.stat}      273    1.057    0.004    1.057    0.004 {built-in method io.open_code}       27    0.874    0.032    0.879    0.033 {built-in method _imp.create_dynamic}        1    0.691    0.691    0.691    0.691 simul.py:21(evolve)      273    0.464    0.002    0.464    0.002 {method 'read' of '_io.BufferedReader' objects}      273    0.432    0.002    1.953    0.007 <frozen importlib._bootstrap_external>:1034(get_data)    32045    0.245    0.000    0.411    0.000 inspect.py:625(cleandoc)       30    0.171    0.006    0.171    0.006 {built-in method posix.listdir}       33    0.151    0.005    0.151    0.005 {built-in method io.open}</code>

或者使用代码

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">>>> from simul import benchmark>>> import cProfile>>> cProfile.run('benchmark()')                  707 function calls in 0.733 seconds   Ordered by: standard name   ncalls  tottime  percall  cumtime  percall filename:lineno(function)        1    0.000    0.000    0.733    0.733 <string>:1(<module>)      300    0.000    0.000    0.000    0.000 random.py:415(uniform)      100    0.000    0.000    0.000    0.000 simul.py:10(__init__)        1    0.000    0.000    0.733    0.733 simul.py:117(benchmark)        1    0.000    0.000    0.000    0.000 simul.py:118(<listcomp>)        1    0.000    0.000    0.000    0.000 simul.py:18(__init__)        1    0.733    0.733    0.733    0.733 simul.py:21(evolve)        1    0.000    0.000    0.733    0.733 {built-in method builtins.exec}        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}      300    0.000    0.000    0.000    0.000 {method 'random' of '_random.Random' objects}</code>

profile 对象开启和关闭之间可以包含任意代码

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">>>> from simul import benchmark>>> import cProfile>>>>>> pr = cProfile.Profile()>>> pr.enable()>>> benchmark()>>> pr.disable()>>> pr.print_stats()         706 function calls in 0.599 seconds   Ordered by: standard name   ncalls  tottime  percall  cumtime  percall filename:lineno(function)        1    0.000    0.000    0.000    0.000 <stdin>:1(<module>)      300    0.000    0.000    0.000    0.000 random.py:415(uniform)      100    0.000    0.000    0.000    0.000 simul.py:10(__init__)        1    0.000    0.000    0.599    0.599 simul.py:117(benchmark)        1    0.000    0.000    0.000    0.000 simul.py:118(<listcomp>)        1    0.000    0.000    0.000    0.000 simul.py:18(__init__)        1    0.599    0.599    0.599    0.599 simul.py:21(evolve)        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}      300    0.000    0.000    0.000    0.000 {method 'random' of '_random.Random' objects}</code>
tottime 不含调用其他函数的时间,cumtime 执行函数(包含调用其他函数的时间)的总时间KCachegrind 图形化分析

KCachegrind - pyprof2calltree - cProfile

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">sudo apt install kcachegrindpip install pyprof2calltree</code>
代码语言:javascript代码运行次数:0运行复制
<code class="javascript">python -m cProfile -o prof.out taylor.pypyprof2calltree -i prof.out -o prof.calltree</code>
代码语言:javascript代码运行次数:0运行复制
<code class="javascript">kcachegrind prof.calltree</code>

安装 kcachegrind 失败,没有运行截图

靠岸学术
靠岸学术

一款集翻译,阅读,文献管理于一体的英文文献阅读器

下载

还有其他工具 Gprof2Dot 可以生成调用图

4. line_profiler

它是一个 py 包,安装后,对要监视的函数应用 装饰器 @profile

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">pip install line_profiler</code>

https://github.com/rkern/line_profiler

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">kernprof -l -v simul.py</code>
代码语言:javascript代码运行次数:0运行复制
<code class="javascript">$ kernprof -l -v simul.pyWrote profile results to simul.py.lprofTimer unit: 1e-06 sTotal time: 4.39747 sFile: simul.pyFunction: evolve at line 21Line #      Hits         Time  Per Hit   % Time  Line Contents==============================================================    21                                               @profile    22                                               def evolve(self, dt):    23         1          5.0      5.0      0.0          timestep = 0.00001    24         1          5.0      5.0      0.0          nsteps = int(dt/timestep)    25    26     10001       5419.0      0.5      0.1          for i in range(nsteps):    27   1010000     454924.0      0.5     10.3              for p in self.particles:    28    29   1000000     791441.0      0.8     18.0                  norm = (p.x**2 + p.y**2)**0.5    30   1000000     537019.0      0.5     12.2                  v_x = (-p.y)/norm    31   1000000     492304.0      0.5     11.2                  v_y = p.x/norm    32    33   1000000     525471.0      0.5     11.9                  d_x = timestep * p.ang_speed * v_x    34   1000000     521829.0      0.5     11.9                  d_y = timestep * p.ang_speed * v_y    35    36   1000000     537637.0      0.5     12.2                  p.x += d_x    37   1000000     531418.0      0.5     12.1                  p.y += d_y</code>
代码语言:javascript代码运行次数:0运行复制
<code class="javascript">python -m line_profiler simul.py.lprof</code>
代码语言:javascript代码运行次数:0运行复制
<code class="javascript">$ python -m line_profiler simul.py.lprofTimer unit: 1e-06 sTotal time: 5.34553 sFile: simul.pyFunction: evolve at line 21Line #      Hits         Time  Per Hit   % Time  Line Contents==============================================================    21                                               @profile    22                                               def evolve(self, dt):    23         1          3.0      3.0      0.0          timestep = 0.00001    24         1          3.0      3.0      0.0          nsteps = int(dt/timestep)    25    26     10001       6837.0      0.7      0.1          for i in range(nsteps):    27   1010000     567894.0      0.6     10.6              for p in self.particles:    28    29   1000000     953363.0      1.0     17.8                  norm = (p.x**2 + p.y**2)**0.5    30   1000000     656821.0      0.7     12.3                  v_x = (-p.y)/norm    31   1000000     601929.0      0.6     11.3                  v_y = p.x/norm    32    33   1000000     635255.0      0.6     11.9                  d_x = timestep * p.ang_speed * v_x    34   1000000     636091.0      0.6     11.9                  d_y = timestep * p.ang_speed * v_y    35    36   1000000     651873.0      0.7     12.2                  p.x += d_x    37   1000000     635462.0      0.6     11.9                  p.y += d_y</code>
5. 性能优化用更简洁的计算公式预计算不变量减少赋值语句,消除中间变量

注意:细微的优化,速度有所提高,但可能并不显著,还需要保证算法正确

6. dis 模块

该包可以了解代码是如何转换为字节码的, dis 表示 disassemble 反汇编

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">import disdis.dis(函数名)</code>
代码语言:javascript代码运行次数:0运行复制
<code class="javascript">dis.dis(ParticleSimulator.evolve) 22           0 LOAD_CONST               1 (1e-05)              2 STORE_FAST               2 (timestep) 23           4 LOAD_GLOBAL              0 (int)              6 LOAD_FAST                1 (dt)              8 LOAD_FAST                2 (timestep)             10 BINARY_TRUE_DIVIDE             12 CALL_FUNCTION            1             14 STORE_FAST               3 (nsteps) 25          16 LOAD_GLOBAL              1 (range)             18 LOAD_FAST                3 (nsteps)             20 CALL_FUNCTION            1             22 GET_ITER        >>   24 FOR_ITER               118 (to 144)             26 STORE_FAST               4 (i) 26          28 LOAD_FAST                0 (self)             30 LOAD_ATTR                2 (particles)             32 GET_ITER        >>   34 FOR_ITER               106 (to 142)             36 STORE_FAST               5 (p) 28          38 LOAD_FAST                5 (p)             40 LOAD_ATTR                3 (x)             42 LOAD_CONST               2 (2)             44 BINARY_POWER             46 LOAD_FAST                5 (p)             48 LOAD_ATTR                4 (y)             50 LOAD_CONST               2 (2)             52 BINARY_POWER             54 BINARY_ADD             56 LOAD_CONST               3 (0.5)             58 BINARY_POWER             60 STORE_FAST               6 (norm) 29          62 LOAD_FAST                5 (p)             64 LOAD_ATTR                4 (y)             66 UNARY_NEGATIVE             68 LOAD_FAST                6 (norm)             70 BINARY_TRUE_DIVIDE             72 STORE_FAST               7 (v_x) 30          74 LOAD_FAST                5 (p)             76 LOAD_ATTR                3 (x)             78 LOAD_FAST                6 (norm)             80 BINARY_TRUE_DIVIDE             82 STORE_FAST               8 (v_y) 32          84 LOAD_FAST                2 (timestep)             86 LOAD_FAST                5 (p)             88 LOAD_ATTR                5 (ang_speed)             90 BINARY_MULTIPLY             92 LOAD_FAST                7 (v_x)             94 BINARY_MULTIPLY             96 STORE_FAST               9 (d_x) 33          98 LOAD_FAST                2 (timestep)            100 LOAD_FAST                5 (p)            102 LOAD_ATTR                5 (ang_speed)            104 BINARY_MULTIPLY            106 LOAD_FAST                8 (v_y)            108 BINARY_MULTIPLY            110 STORE_FAST              10 (d_y) 35         112 LOAD_FAST                5 (p)            114 DUP_TOP            116 LOAD_ATTR                3 (x)            118 LOAD_FAST                9 (d_x)            120 INPLACE_ADD            122 ROT_TWO            124124 STORE_ATTR               3 (x) 36         126 LOAD_FAST                5 (p)            128 DUP_TOP            130 LOAD_ATTR                4 (y)            132 LOAD_FAST               10 (d_y)            134 INPLACE_ADD            136 ROT_TWO            138 STORE_ATTR               4 (y)            140 JUMP_ABSOLUTE           34        >>  142 JUMP_ABSOLUTE           24        >>  144 LOAD_CONST               0 (None)            146 RETURN_VALUE</code>

可以是用该工具了解指令的多少和代码是如何转换的

7. memory_profiler

https://pypi.org/project/memory-profiler/

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">pip install memory_profilerpip install psutil</code>

psutil说明

也需要对监视的函数 加装饰器 @profile

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">python -m memory_profiler simul.py</code>
代码语言:javascript代码运行次数:0运行复制
<code class="javascript">$ python -m memory_profiler simul.pyFilename: simul.pyLine #    Mem usage    Increment  Occurrences   Line Contents=============================================================   141   67.465 MiB   67.465 MiB           1   @profile   142                                         def benchmark_memory():   143   84.023 MiB   16.559 MiB      300004       particles = [Particle(uniform(-1.0, 1.0),   144   84.023 MiB    0.000 MiB      100000                             uniform(-1.0, 1.0),   145   84.023 MiB    0.000 MiB      100000                             uniform(-1.0, 1.0))   146   84.023 MiB    0.000 MiB      100001                     for i in range(100000)]   147   148   84.023 MiB    0.000 MiB           1       simulator = ParticleSimulator(particles)   149   84.023 MiB    0.000 MiB           1       simulator.evolve(0.001)</code>

内存使用随时间的变化

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">$ mprof run simul.pymprof: Sampling memory every 0.1srunning new processrunning as a Python program...</code>

绘制曲线

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">$ mprof plot</code>
python 基准测试(cProfile \ kcachegrind \ line_profiler \ memory_profiler)

相关文章

python速学教程(入门到精通)
python速学教程(入门到精通)

python怎么学习?python怎么入门?python在哪学?python怎么学才快?不用担心,这里为大家提供了python速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
C语言变量命名
C语言变量命名

c语言变量名规则是:1、变量名以英文字母开头;2、变量名中的字母是区分大小写的;3、变量名不能是关键字;4、变量名中不能包含空格、标点符号和类型说明符。php中文网还提供c语言变量的相关下载、相关课程等内容,供大家免费下载使用。

410

2023.06.20

c语言入门自学零基础
c语言入门自学零基础

C语言是当代人学习及生活中的必备基础知识,应用十分广泛,本专题为大家c语言入门自学零基础的相关文章,以及相关课程,感兴趣的朋友千万不要错过了。

638

2023.07.25

c语言运算符的优先级顺序
c语言运算符的优先级顺序

c语言运算符的优先级顺序是括号运算符 > 一元运算符 > 算术运算符 > 移位运算符 > 关系运算符 > 位运算符 > 逻辑运算符 > 赋值运算符 > 逗号运算符。本专题为大家提供c语言运算符相关的各种文章、以及下载和课程。

362

2023.08.02

c语言数据结构
c语言数据结构

数据结构是指将数据按照一定的方式组织和存储的方法。它是计算机科学中的重要概念,用来描述和解决实际问题中的数据组织和处理问题。数据结构可以分为线性结构和非线性结构。线性结构包括数组、链表、堆栈和队列等,而非线性结构包括树和图等。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

263

2023.08.09

c语言random函数用法
c语言random函数用法

c语言random函数用法:1、random.random,随机生成(0,1)之间的浮点数;2、random.randint,随机生成在范围之内的整数,两个参数分别表示上限和下限;3、random.randrange,在指定范围内,按指定基数递增的集合中获得一个随机数;4、random.choice,从序列中随机抽选一个数;5、random.shuffle,随机排序。

631

2023.09.05

c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

564

2023.09.20

c语言get函数的用法
c语言get函数的用法

get函数是一个用于从输入流中获取字符的函数。可以从键盘、文件或其他输入设备中读取字符,并将其存储在指定的变量中。本文介绍了get函数的用法以及一些相关的注意事项。希望这篇文章能够帮助你更好地理解和使用get函数 。

671

2023.09.20

c数组初始化的方法
c数组初始化的方法

c语言数组初始化的方法有直接赋值法、不完全初始化法、省略数组长度法和二维数组初始化法。详细介绍:1、直接赋值法,这种方法可以直接将数组的值进行初始化;2、不完全初始化法,。这种方法可以在一定程度上节省内存空间;3、省略数组长度法,这种方法可以让编译器自动计算数组的长度;4、二维数组初始化法等等。

618

2023.09.22

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.6万人学习

Git 教程
Git 教程

共21课时 | 4.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号