解决pytorch 交叉熵损失输出为负数的问题

脚本专栏 2024/11/18 佚名

3 1 2

网络训练中，loss曲线非常奇怪

交叉熵怎么会有负数。

经过排查，交叉熵不是有个负对数吗，当网络输出的概率是0-1时，正数。可当网络输出大于1的数，就有可能变成负数。

所以加上一行就行了

out1 = F.softmax(out1, dim=1)

补充知识：在pytorch框架下，训练model过程中，loss=nan问题时该怎么解决？

当我在UCF-101数据集训练alexnet时，epoch设为100，跑到三十多个epoch时，出现了loss=nan问题，当时是一脸懵逼，在查阅资料后，我通过减小学习率解决了问题，现总结一下出现这个问题的可能原因及解决方法：

1. 减小整体学习率。学习率比较大的时候，参数可能over shoot了，结果就是找不到极小值点；减小学习率可以让参数朝着极值点前进；

2. 改变网络宽度。有可能是网络后面的层参数更新异常，增加后面层的宽度试试；

3. 改变层的学习率。每个层都可以设置学习率，可以尝试减小后面层的学习率试试；

4. 数据归一化（减均值，除方差，或者加入normalization，例如BN、L2 norm等）；

5. 加入gradient clipping；

6 输入数据含有脏数据，即NaN,一般当使用实际业务的真实数据时，容易出现脏数据。

以上这篇解决pytorch 交叉熵损失输出为负数的问题就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

pytorch,交叉熵损失,负数

华山资源网 Design By www.eoogi.com

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

华山资源网 Design By www.eoogi.com

评论“解决pytorch 交叉熵损失输出为负数的问题”

暂无评论...

2024年11月18日