散文網(wǎng) » 生活 »日常 » 小象學(xué)院強(qiáng)化學(xué)習(xí)

小象學(xué)院強(qiáng)化學(xué)習(xí)

2023-01-13 19:53 作者:血霽玫瑰與櫻花 0人讀過 | 我要投稿

強(qiáng)化學(xué)習(xí)方法

1、Model-free 和 Model-based

如果不理解環(huán)境，環(huán)境給了什么就是什么，我們就把這種方法叫做 Model-free，這里的 Model 就是用模型來表示環(huán)境，理解環(huán)境就是學(xué)會了用一個模型來代表環(huán)境，所以這種就是 Model-based 方法。

Model-free 的方法有很多, 像 Q learning、Sarsa、Policy Gradients 都是從環(huán)境中得到反饋然后從中學(xué)習(xí)。而 Model-based RL 只是多了一道程序，為真實(shí)世界建模，也可以說他們都是 Model-free 的強(qiáng)化學(xué)習(xí), 只是 Model-based 多出了一個虛擬環(huán)境，我們可以先在虛擬環(huán)境中嘗試，如果沒問題，再拿到現(xiàn)實(shí)環(huán)境中來。最終 Model-based 還有一個殺手锏，是 Model-free 所不具備的，那就是想象力.

標(biāo)簽：

小象學(xué)院強(qiáng)化學(xué)習(xí)的評論 (共條)

愛情散文傷感散文哲理散文優(yōu)美生活隨筆親情唯美句子傷感的句子現(xiàn)代詩歌空間日志經(jīng)典語句愛情句子作文大全

五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

小象學(xué)院強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)方法

小象學(xué)院強(qiáng)化學(xué)習(xí)的評論 (共條)

你可能也喜歡這些文章

最新發(fā)布的文章

五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

小象學(xué)院 強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)方法

本文作者的其他文章

小象學(xué)院 強(qiáng)化學(xué)習(xí)的評論 (共 條)

你可能也喜歡這些文章

最新發(fā)布的文章

小象學(xué)院強(qiáng)化學(xué)習(xí)

小象學(xué)院強(qiáng)化學(xué)習(xí)的評論 (共條)