Skip to content

Latest commit

 

History

History
9 lines (5 loc) · 827 Bytes

56.md

File metadata and controls

9 lines (5 loc) · 827 Bytes

3.16。 CUDA 常见问题

原文: http://numba.pydata.org/numba-doc/latest/cuda/faq.html

3.16.1。 nvprof 报告“没有内核被分析”

当使用nvprof工具为 CUDA 目标分析 Numba jitted 代码时,输​​出包含No kernels were profiled,但是存在明显运行的内核,发生了什么?

这很可能是因为在程序退出时没有刷新分析数据,有关详细信息,请参阅 NVIDIA CUDA 文档。要解决这个问题,只需在程序中的退出点之前添加对numba.cuda.profile_stop()的调用(或者想要停止分析)。有关 Numba 中 CUDA 分析支持的更多信息,请参阅分析