五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

小象學(xué)院 強(qiáng)化學(xué)習(xí)

2023-01-13 19:53 作者:血霽玫瑰與櫻花  | 我要投稿

強(qiáng)化學(xué)習(xí)方法

1、Model-free 和 Model-based

如果不理解環(huán)境,環(huán)境給了什么就是什么,我們就把這種方法叫做 Model-free,這里的 Model 就是用模型來表示環(huán)境,理解環(huán)境就是學(xué)會了用一個模型來代表環(huán)境,所以這種就是 Model-based 方法。

Model-free 的方法有很多, 像 Q learning、Sarsa、Policy Gradients 都是從環(huán)境中得到反饋然后從中學(xué)習(xí)。而 Model-based RL 只是多了一道程序,為真實(shí)世界建模,也可以說他們都是 Model-free 的強(qiáng)化學(xué)習(xí), 只是 Model-based 多出了一個虛擬環(huán)境,我們可以先在虛擬環(huán)境中嘗試,如果沒問題,再拿到現(xiàn)實(shí)環(huán)境中來。最終 Model-based 還有一個殺手锏,是 Model-free 所不具備的,那就是想象力.


小象學(xué)院 強(qiáng)化學(xué)習(xí)的評論 (共 條)

分享到微博請遵守國家法律
屏山县| 武山县| 连南| 镇远县| 察隅县| 保亭| 万山特区| 汕头市| 屏东县| 铁岭市| 宁都县| 永济市| 疏附县| 高要市| 芜湖县| 寿光市| 延津县| 怀仁县| 富源县| 叶城县| 武威市| 阿尔山市| 桃园县| 洪江市| 朔州市| 连平县| 阿拉善右旗| 墨江| 韶山市| 南皮县| 广东省| 永州市| 琼中| 元阳县| 阿克陶县| 大悟县| 喀喇沁旗| 盐山县| 灵山县| 陇南市| 门头沟区|