问题:多GPU并行时,由于CUDA是异步的,因此报错的位置不是真正有问题的地方。
解决方案:设置CUDA_LAUNCH_BLOCKING=1,此时CUDA是同步的,报错的地方就是bug所在的地方。
本文标题:CUDA多GPU并行下debug
本文链接:https://www.haomeiwen.com/subject/rpgdoctx.html
网友评论