五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網 會員登陸 & 注冊

【花師小哲】當代煉金術(神經網絡)前沿(27)——ChatGPT很強,下一秒就是我的了

2023-03-28 19:39 作者:花師小哲-中二  | 我要投稿

該來的總會來的。

這篇文章要做的事情很簡單,實現對大語言模型的能力竊取,所瞄準的主要對象就是ChatGPT。這篇文章也比較短,就少寫一些。

1.CloseAI

天下苦OpenAI久也。由于GPT-3開始OpenAI一直不開源,導致我們使用很多GPT大模型的時候只能調用API,雖然這也能解決很多問題,但總歸沒有模型在自己手上舒服,想做做微調有時候也是做不到的。

然而自己從頭訓練大模型又是非常燒錢的一件事情,不是每個人每個實驗室都負擔得起的。到頭來還是只能乖乖交錢用API。

于是,怎么節(jié)省成本就成為大模型研究的另一條出路了。

2.模型竊取

模型竊取也不是什么新鮮事情了,模型竊取也是經典模型攻擊的方法之一。

所謂模型竊取,也很簡單,你訓練了一個模型,我想辦法借助你的模型復制出一個“贗品”。雖然這個“贗品”的能力可能稍差一些,但總歸之后就是我的了,再使用就不用付錢了。

沒錯,這次就是對ChatGPT下黑手了。

其實了解過模型蒸餾等方法的朋友應該知道,這樣做也不是什么新鮮事情。大模型有自己的缺點,即使是正向推理也是要消耗很多資源的,而小模型運行非??爝€環(huán)保,所以SimCLR V2就提出“預訓練-微調-蒸餾”三步驟。

3.本篇論文的做法

做法其實也異常簡單:

就三步:(1)查詢;(2)響應檢查;(3)模擬訓練。

需要注意的幾點:

(1)因為ChatGPT只開放API,所以整體是黑盒竊取,你只能得到輸入和輸出

(2)一般情況下最好是用和被攻擊模型同等規(guī)模的模型進行竊取,但由于大模型不可行,所以只能用中等規(guī)模模型進行竊取

(3)眾所周知,只有當模型規(guī)模大到一定程度時,某些能力才會出現(所謂的“涌現”),所以中等模型當然不能拷貝ChatGPT的全部能力,仍然只能針對某一具體領域進行能力竊取

4.結語

本篇論文的竊取仍然是非常初期的一個研究,畢竟本身難度就很大,但也說明了對大模型的能力竊取并非不可能。

【花師小哲】當代煉金術(神經網絡)前沿(27)——ChatGPT很強,下一秒就是我的了的評論 (共 條)

分享到微博請遵守國家法律
青州市| 乌恰县| 舞阳县| 中牟县| 珲春市| 太白县| 炉霍县| 封开县| 余庆县| 高州市| 玉山县| 汉川市| 齐齐哈尔市| 南城县| 远安县| 霍山县| 济阳县| 岗巴县| 临清市| 平陆县| 岐山县| 马公市| 珠海市| 鄂托克旗| 安多县| 开化县| 建宁县| 孙吴县| 文水县| 黄龙县| 永安市| 梁山县| 基隆市| 蒙城县| 宁河县| 乳山市| 淮安市| 南丹县| 台南县| 阳泉市| 龙游县|