五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

深藍生成式預訓練語言模型:理論與實戰(zhàn)

2023-07-16 13:38 作者:戰(zhàn)億殤  | 我要投稿

提出基于雙向的Encoder表示。


使用兩個策略:


(1)masked-language-model(MLM),受經(jīng)典的完形填空Cloze task[4]啟發(fā)。這也是絕大多數(shù)預訓練模型所采用并且優(yōu)化的切入點。從語料里mask掉(可以隨機,也可以加入一些知識)一些字詞,試圖準確地預測task掉的內(nèi)容。


(2) next sentence prediction,判斷兩個句子是否具有上下文關系。(貌似在某個地方看到,這個任務沒有決定性的功能,不確定。)


也就是說,GPT只有單向學習;ELMo雖然是雙向學習,但是過于簡單。

BERT雙向學習,并且更加復雜。


?

深藍生成式預訓練語言模型:理論與實戰(zhàn)的評論 (共 條)

分享到微博請遵守國家法律
礼泉县| 都江堰市| 建湖县| 安塞县| 伊春市| 嘉兴市| 睢宁县| 兴国县| 二连浩特市| 古田县| 嵊泗县| 望奎县| 通榆县| 龙游县| 宝应县| 肃南| 石景山区| 修水县| 彭泽县| 岐山县| 连南| 湘西| 琼海市| 汉源县| 呼伦贝尔市| 习水县| 临颍县| 淅川县| 常德市| 昭觉县| 台东市| 弥渡县| 图木舒克市| 新余市| 郸城县| 班玛县| 龙井市| 永吉县| 蒙阴县| 沐川县| 和静县|