五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

深藍(lán)-生成式預(yù)訓(xùn)練語言模型:理論與實(shí)戰(zhàn)

2023-07-09 11:01 作者:bili_81527274639  | 我要投稿

什么是預(yù)訓(xùn)練模型(Pretrained model)?

一般情況下預(yù)訓(xùn)練模型都是大型模型,具備復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),眾多的參數(shù)量,以及在足夠大的數(shù)據(jù)集下進(jìn)行訓(xùn)練而產(chǎn)生的模型. 在NLP領(lǐng)域,預(yù)訓(xùn)練模型往往是語言模型,因?yàn)檎Z言模型的訓(xùn)練是無監(jiān)督的,可以獲得大規(guī)模語料,同時(shí)語言模型又是許多典型NLP任務(wù)的基礎(chǔ),如機(jī)器翻譯,文本生成,閱讀理解等,常見的預(yù)訓(xùn)練模型有BERT, GPT, roBERTa, transformer-XL等.


什么是微調(diào)(Fine-tuning)?

根據(jù)給定的預(yù)訓(xùn)練模型,改變它的部分參數(shù)或者為其新增部分輸出結(jié)構(gòu)后,通過在小部分?jǐn)?shù)據(jù)集上訓(xùn)練,來使整個(gè)模型更好的適應(yīng)特定任務(wù).


什么是微調(diào)腳本(Fine-tuning script)?

實(shí)現(xiàn)微調(diào)過程的代碼文件。這些腳本文件中,應(yīng)包括對(duì)預(yù)訓(xùn)練模型的調(diào)用,對(duì)微調(diào)參數(shù)的選定以及對(duì)微調(diào)結(jié)構(gòu)的更改等,同時(shí),因?yàn)槲⒄{(diào)是一個(gè)訓(xùn)練過程,它同樣需要一些超參數(shù)的設(shè)定,以及損失函數(shù)和優(yōu)化器的選取等, 因此微調(diào)腳本往往也包含了整個(gè)遷移學(xué)習(xí)的過程.


說一說常見的兩種遷移方式?

直接使用預(yù)訓(xùn)練模型,進(jìn)行相同任務(wù)的處理,不需要調(diào)整參數(shù)或模型結(jié)構(gòu),這些模型開箱即用。但是這種情況一般只適用于普適任務(wù), 如:fasttest工具包中預(yù)訓(xùn)練的詞向量模型。另外,很多預(yù)訓(xùn)練模型開發(fā)者為了達(dá)到開箱即用的效果,將模型結(jié)構(gòu)分各個(gè)部分保存為不同的預(yù)訓(xùn)練模型,提供對(duì)應(yīng)的加載方法來完成特定目標(biāo).


更加主流的遷移學(xué)習(xí)方式是發(fā)揮預(yù)訓(xùn)練模型特征抽象的能力,然后再通過微調(diào)的方式,通過訓(xùn)練更新小部分參數(shù)以此來適應(yīng)不同的任務(wù)。這種遷移方式需要提供小部分的標(biāo)注數(shù)據(jù)來進(jìn)行監(jiān)督學(xué)習(xí).


深藍(lán)-生成式預(yù)訓(xùn)練語言模型:理論與實(shí)戰(zhàn)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
电白县| 红原县| 原阳县| 乐东| 石嘴山市| 太白县| 亚东县| 江川县| 雷山县| 阳东县| 锦屏县| 田阳县| 漳州市| 马公市| 泽库县| 沙坪坝区| 米易县| 临朐县| 宁乡县| 凤阳县| 广丰县| 龙南县| 临海市| 云浮市| 大安市| 绥中县| 江津市| 康定县| 龙井市| 康保县| 大足县| 九台市| 屏山县| 井陉县| 马鞍山市| 桦甸市| 兴文县| 三亚市| 克拉玛依市| 体育| 靖宇县|