散文網(wǎng) » 科技 »學(xué)習(xí) » 直播預(yù)告| 8月31日模型壓縮與高效神經(jīng)網(wǎng)絡(luò)

直播預(yù)告| 8月31日模型壓縮與高效神經(jīng)網(wǎng)絡(luò)

2023-08-28 11:27 作者:小牛翻譯NiuTrans 0人讀過(guò) | 我要投稿

最近，以ChatGPT為代表的大語(yǔ)言模型在多輪對(duì)話(huà)等任務(wù)上展現(xiàn)出強(qiáng)大的性能，大型語(yǔ)言模型似乎已成為通向通用人工智能的必經(jīng)之路。然而，模型量級(jí)與“智能”之間的關(guān)系仍然不得而知，普遍觀點(diǎn)認(rèn)為模型越大性能越強(qiáng)。但是隨著模型變大，模型推斷所需的顯存和時(shí)間也成倍增長(zhǎng)，計(jì)算代價(jià)十分高昂。以LLaMA-7B為例，翻譯一條100字左右的文本需要近7s，而使用相同的設(shè)備配置，不到1B的機(jī)器翻譯模型可在1s內(nèi)以相同精度翻譯長(zhǎng)達(dá)數(shù)百字的篇章。因此，在保證模型精度的前提下，探索降低計(jì)算代價(jià)的高效方法是十分必要的。那么，高效方法具體有哪些？又將如何降低模型內(nèi)存占用和計(jì)算代價(jià)？

本期報(bào)告將從傳統(tǒng)靜態(tài)模型壓縮方法和動(dòng)態(tài)模型加速方法兩個(gè)角度進(jìn)行講解，對(duì)大型語(yǔ)言模型相關(guān)的高效方法進(jìn)行總結(jié)。報(bào)告主要包括兩部分內(nèi)容，第一部分為剪枝、量化等模型壓縮方法，該類(lèi)方法以更小的靜態(tài)模型實(shí)現(xiàn)與大模型相似的推斷性能；第二部分以早退、混合專(zhuān)家等條件計(jì)算方法為主，該類(lèi)方法使用動(dòng)態(tài)激活的方式，僅激活部分大模型以降低模型的計(jì)算代價(jià)。

本期報(bào)告將于8月31日線上舉辦，屆時(shí)由來(lái)自東北大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室的單韋喬為我們帶來(lái)《模型壓縮與高效神經(jīng)網(wǎng)絡(luò)》報(bào)告，具體流程如下：

本次直播將分為兩部分進(jìn)行，第一部分為報(bào)告分享環(huán)節(jié)，第二部分為Q&A環(huán)節(jié)。在直播過(guò)程中，小伙伴可以把問(wèn)題發(fā)送到直播間中，并在Q&A環(huán)節(jié)與本期嘉賓深入探討；未被回復(fù)的問(wèn)題也可私信留言，在直播結(jié)束后我們會(huì)進(jìn)行解答。

本系列直播作為公益知識(shí)分享活動(dòng)，由東北大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室、小牛翻譯聯(lián)合推出，感謝AI科技評(píng)論、PaperWeekly、機(jī)器之心、并行科技對(duì)本次直播的大力支持，本次直播向所有聽(tīng)眾免費(fèi)開(kāi)放，無(wú)需注冊(cè)和報(bào)名繳費(fèi)。

參會(huì)觀眾可以在【視頻號(hào)（ID：小牛翻譯云平臺(tái)）、微博（ID：小牛翻譯）、嗶哩嗶哩（ID：小牛翻譯）、知乎（ID：小牛翻譯云平臺(tái)）、機(jī)器翻譯學(xué)堂（https://school.niutrans.com/live）】觀看直播，關(guān)注【機(jī)器翻譯學(xué)堂、小牛翻譯云平臺(tái)視頻號(hào)】即可觀看直播回放。

誠(chéng)邀所有關(guān)注自然語(yǔ)言處理與大模型技術(shù)發(fā)展的朋友走進(jìn)直播間，2023年8月31日（周四）18:30，我們期待與您的相遇！