当使用nvprof
工具为 CUDA 目标分析 Numba jitted 代码时,输出包含No kernels were profiled
,但是存在明显运行的内核,发生了什么?
这很可能是因为在程序退出时没有刷新分析数据,有关详细信息,请参阅 NVIDIA CUDA 文档。要解决这个问题,只需在程序中的退出点之前添加对numba.cuda.profile_stop()
的调用(或者想要停止分析)。有关 Numba 中 CUDA 分析支持的更多信息,请参阅分析。
当使用nvprof
工具为 CUDA 目标分析 Numba jitted 代码时,输出包含No kernels were profiled
,但是存在明显运行的内核,发生了什么?
这很可能是因为在程序退出时没有刷新分析数据,有关详细信息,请参阅 NVIDIA CUDA 文档。要解决这个问题,只需在程序中的退出点之前添加对numba.cuda.profile_stop()
的调用(或者想要停止分析)。有关 Numba 中 CUDA 分析支持的更多信息,请参阅分析。