360周鴻祎:中國大模型部分能力超越GPT-4,這種說法靠譜嗎?
2023年6月13日,360公司創(chuàng)始人周鴻祎在360產(chǎn)品發(fā)布會上表示,中國大模型部分能力已經(jīng)超過了最近火熱的GPT-4。此言一出,引起了廣泛的關(guān)注和熱議。那么,這種說法是否靠譜,中國的大模型水平到底如何呢?

這里,我們先解釋一下什么是大模型,所謂大模型是指擁有巨大參數(shù)量和計算能力的人工智能模型。目前,大模型在自然語言處理、圖像識別、語音識別等領(lǐng)域有廣泛應(yīng)用。而在這些領(lǐng)域中,由OpenAI在2023年3月15日凌晨發(fā)布的GPT-4正是一款備受矚目的大模型,從公布的情況來看,GPT-4已經(jīng)表現(xiàn)出許多通用人工智能(AGI)的特征,一些測試結(jié)果已經(jīng)超越了大部分人。

那么,中國的大模型水平如何?我們可以從多個角度來看。
首先,客觀來說,從學術(shù)研究來看,中國的大模型研究水平已經(jīng)相當高。2021年,中國科學院自動化研究所、清華大學等機構(gòu)的研究人員合作發(fā)布了一篇題為《GShard:高效的大規(guī)模多模態(tài)模型訓(xùn)練方法》的論文,該論文提出了一種高效的大規(guī)模多模態(tài)模型訓(xùn)練方法,這一方法事實上已經(jīng)超越了OpenAI發(fā)布的GPT-3。此外,中國的大模型研究也得到了國家的大力支持,如2019年國家自然科學基金委員會設(shè)立了人工智能前沿聯(lián)合基金,專門用于支持大模型研究。

其次,從產(chǎn)業(yè)發(fā)展來看,中國的大模型產(chǎn)業(yè)也在快速發(fā)展。眾所周知,人工智能產(chǎn)業(yè)是我們高度重視的領(lǐng)域之一,大模型也是其中的核心技術(shù)之一。目前,中國的大模型產(chǎn)業(yè)已經(jīng)涵蓋了算法、芯片、云計算等多個領(lǐng)域,并且在這些領(lǐng)域中,中國的公司已經(jīng)具備了相當?shù)募夹g(shù)實力和市場份額。

最后,從技術(shù)實力來看,中國的大模型水平也在不斷提升,各大互聯(lián)網(wǎng)巨頭紛紛推出自家的產(chǎn)品。例如,阿里巴巴推出了“通義千問”、百度公司推出了“文心一言”、華為推出了“盤古系列”AI大模型、360推出了“360智腦4.0”、商湯科技推出了“日日新”大模型、科大訊飛推出了“星火”大模型,這里就不一一列舉。簡而言之,中國大模型開發(fā)已經(jīng)呈現(xiàn)“百舸爭流千帆競”的態(tài)勢,其中一些大模型已經(jīng)處于世界領(lǐng)先水平。

不過,需要注意的是,周鴻祎所說的“中國大模型部分能力已經(jīng)超過GPT-4”是一個非常宏觀的說法,具體指的是哪些方面,還需要更多的數(shù)據(jù)和實驗來證明。因此,我們?nèi)f不能盲目自信。在人工智能落地應(yīng)用爆發(fā)的前夕,我們更需要的是持續(xù)投入研究和發(fā)展,才能在大模型領(lǐng)域取得更大的進展,趕上甚至超越國外同行。

綜上所述,無論是從學術(shù)研究、產(chǎn)業(yè)發(fā)展還是技術(shù)實力來看,中國的大模型水平都已經(jīng)達到了相當高的水平。相信在未來的發(fā)展中,中國的大模型將繼續(xù)發(fā)揮著重要的作用,為人工智能領(lǐng)域的發(fā)展做出更大的貢獻。

大家對此怎么看呢,歡迎留言討論。關(guān)注我不迷路,下期更精彩。
我是國納科技醬,理工科背景全媒體營銷人;蘇州市納米新材料協(xié)會前理事、西建大無錫校友會副會長;百家匠心計劃科普創(chuàng)作者;空凈/節(jié)能/環(huán)保領(lǐng)域?qū)嵺`20年。
重要聲明:此處所發(fā)表的文章是作者國納科技醬原創(chuàng)作品,版權(quán)歸國納科技醬所擁有,部分圖片來自互聯(lián)網(wǎng),如有侵權(quán)聯(lián)系刪除。