这个报错网上有很多答案了,总之就是label越界了。比如你的模型最后一层神经元个数是5但是要计算loss时你进来的一个label是6。
不过这里有一个坑,报错的行数不一定会定位到准确的位置。
比如我们的端到端总模型下有3个小模型a,b,c,样本中包含了每个小模型输出的label。
可能是a模型的结构出错了,发生了label越界,但是报错是会把行数定位在计算b模型的loss时。
我当时根据报错的行数,仔细检查模型b就是找不出问题,后来一步步debug才发现问题在a模型上。
这个报错网上有很多答案了,总之就是label越界了。比如你的模型最后一层神经元个数是5但是要计算loss时你进来的一个label是6。
不过这里有一个坑,报错的行数不一定会定位到准确的位置。
比如我们的端到端总模型下有3个小模型a,b,c,样本中包含了每个小模型输出的label。
可能是a模型的结构出错了,发生了label越界,但是报错是会把行数定位在计算b模型的loss时。
我当时根据报错的行数,仔细检查模型b就是找不出问题,后来一步步debug才发现问题在a模型上。
本文标题:Reduce failed to synchronize: de
本文链接:https://www.haomeiwen.com/subject/jfzkfhtx.html
网友评论