五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

大模型底層原理與應(yīng)用開發(fā)范式

2023-06-03 15:29 作者:彤蛹_Amy  | 我要投稿

?
10:08
?

參數(shù)從小到大,模型的生成就從確定/重復(fù)到隨機(jī)/新穎

top_p是前百分之p

top_k是排名前k

repetition_penalty是重復(fù)懲罰

max_length是指prompt長(zhǎng)度+生成文本長(zhǎng)度

max_new_tokens是指生成文本長(zhǎng)度

?
13:55
?

小模型:參數(shù)幾百萬或幾千萬

?
17:42
?

對(duì)話方式完成

微調(diào)、零樣本(zero-shot)、少樣本(few-shot)

?
20:13
?

省略復(fù)雜過程,給出任務(wù)適配prompt

推薦用于頭腦風(fēng)暴類的任務(wù)

?
23:41
?

為什么需要embedding輔助?

  • 長(zhǎng)度限制;
  • 相關(guān)信息不是所有信息;
  • 效率;
  • 費(fèi)用

?
29:08
?

為什么要微調(diào)?

  • 公開數(shù)據(jù)太少
  • 有些知識(shí)不對(duì)
  • 特定任務(wù)表現(xiàn)不佳
  • 不具備某些能力

不同微調(diào)對(duì)比:

API微調(diào)的基本流程:


?
36:50
?

對(duì)開發(fā)者的能力需求:

工具選擇:


?
43:38
?


大模型底層原理與應(yīng)用開發(fā)范式的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
常熟市| 两当县| 密山市| 泸州市| 广西| 客服| 涡阳县| 大连市| 怀来县| 娱乐| 宜宾县| 宁陵县| 阳江市| 赤壁市| 广饶县| 宿迁市| 略阳县| 潍坊市| 龙江县| 和龙市| 云林县| 德惠市| 固镇县| 六盘水市| 新巴尔虎右旗| 泸水县| 攀枝花市| 东光县| 杭锦旗| 铁岭县| 平舆县| 上思县| 县级市| 高雄市| 西宁市| 七台河市| 东阳市| 道孚县| 宜兴市| 依安县| 崇左市|