五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

淺談torch中的softmax與CrossEntropy

2023-08-14 02:41 作者:momonaの男友  | 我要投稿

首先是softmax函數(shù),我認(rèn)為我在之前的文章

分類模型中為何更適合使用softmax函數(shù)?

已經(jīng)較為清楚的闡述,故這里不再重復(fù)贅述。


在上文中,我較為清晰的說明了,softmax函數(shù)只是為了將我們的預(yù)測(cè)結(jié)果,表達(dá)成一種合適的結(jié)果,去擬合one-hot編碼

但是對(duì)于這種向量標(biāo)簽,我們并不能很好的去定義其損失函數(shù)(誤差函數(shù))

我們理所當(dāng)然應(yīng)該想到均方誤差函數(shù),但實(shí)際上,均方誤差函數(shù)(MSE),對(duì)于標(biāo)量標(biāo)簽確實(shí)能起到一個(gè)非常好的效果。

而對(duì)于一個(gè)向量標(biāo)簽,我們選擇了一個(gè)能實(shí)現(xiàn)與之同等效果的CrossEntropy函數(shù),也即交叉熵?fù)p失函數(shù)。

交叉熵?fù)p失函數(shù)

如上圖所示,其中?y?為正確的標(biāo)簽,而 %5Chat%7By%7D 為預(yù)測(cè)標(biāo)簽(經(jīng)過softmax處理后)。

該損失函數(shù)在計(jì)算上具有非常明顯的便利性,即僅考慮正確標(biāo)簽下對(duì)應(yīng)的損失。例如,我們不妨令?y = [0, 1, 0],%5Chat%7By%7D%20 = [0.3, 0.1, 0.6], 那么此時(shí)的?loss%20%3D%20-0log0.3-1log0.1-0log0.6%3D-log0.1?,

即僅考慮到了正確標(biāo)簽下的損失。

而其優(yōu)越性不僅表現(xiàn)在此處,其導(dǎo)函數(shù)更是有非常優(yōu)異的性質(zhì),即:

CrossEntropy函數(shù)的導(dǎo)函數(shù)

其中?o?為未經(jīng)softmax處理前得到的預(yù)測(cè)標(biāo)簽。

換言之,%CE%B4_%7Bo%7D(y%2C%20%5Chat%7By%7D%20%20)%20%20%3D%20%5Chat%7By%7D-y

如下圖所示:

驗(yàn)證如上結(jié)論

毫無疑問,y_pred.grad == softmax(y_pred) - one_hot(y),這是成立的。(不成立可能是精度誤差導(dǎo)致的,看圖中明顯成立)。

而觀察y_pred.grad,對(duì)于y[1]這個(gè)樣本,我們明顯可以看出,其梯度是正在減少前兩項(xiàng)的權(quán)值,而增大最后一項(xiàng)的權(quán)值,以努力實(shí)現(xiàn)正確歸類至第三類,這是符合我們預(yù)期的。

故,CrossEntropy函數(shù)確實(shí)是在朝著我們的目標(biāo)去實(shí)現(xiàn)。

淺談torch中的softmax與CrossEntropy的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
南阳市| 桦南县| 广安市| 荃湾区| 农安县| 义乌市| 孝义市| 通州市| 延庆县| 五原县| 天台县| 北川| 邮箱| 津南区| 平陆县| 阿城市| 平武县| 宜宾市| 巴青县| 南部县| 东莞市| 梧州市| 河池市| 临桂县| 临沂市| 泰顺县| 开阳县| 柳州市| 江西省| 华阴市| 若尔盖县| 乌兰县| 云阳县| 广元市| 万源市| 应城市| 营口市| 锦屏县| 绩溪县| 黄冈市| 新河县|