散文網(wǎng) » 科技 »數(shù)碼 » 360周鴻祎：中國大模型部分能力超越GPT-4，這種說法靠譜嗎？

360周鴻祎：中國大模型部分能力超越GPT-4，這種說法靠譜嗎？

2023-06-14 10:04 作者:國納科技醬 0人讀過 | 我要投稿

2023年6月13日，360公司創(chuàng)始人周鴻祎在360產(chǎn)品發(fā)布會上表示，中國大模型部分能力已經(jīng)超過了最近火熱的GPT-4。此言一出，引起了廣泛的關(guān)注和熱議。那么，這種說法是否靠譜，中國的大模型水平到底如何呢？

這里，我們先解釋一下什么是大模型，所謂大模型是指擁有巨大參數(shù)量和計算能力的人工智能模型。目前，大模型在自然語言處理、圖像識別、語音識別等領(lǐng)域有廣泛應(yīng)用。而在這些領(lǐng)域中，由OpenAI在2023年3月15日凌晨發(fā)布的GPT-4正是一款備受矚目的大模型，從公布的情況來看，GPT-4已經(jīng)表現(xiàn)出許多通用人工智能（AGI）的特征，一些測試結(jié)果已經(jīng)超越了大部分人。

那么，中國的大模型水平如何？我們可以從多個角度來看。

首先，客觀來說，從學術(shù)研究來看，中國的大模型研究水平已經(jīng)相當高。2021年，中國科學院自動化研究所、清華大學等機構(gòu)的研究人員合作發(fā)布了一篇題為《GShard：高效的大規(guī)模多模態(tài)模型訓(xùn)練方法》的論文，該論文提出了一種高效的大規(guī)模多模態(tài)模型訓(xùn)練方法，這一方法事實上已經(jīng)超越了OpenAI發(fā)布的GPT-3。此外，中國的大模型研究也得到了國家的大力支持，如2019年國家自然科學基金委員會設(shè)立了人工智能前沿聯(lián)合基金，專門用于支持大模型研究。

其次，從產(chǎn)業(yè)發(fā)展來看，中國的大模型產(chǎn)業(yè)也在快速發(fā)展。眾所周知，人工智能產(chǎn)業(yè)是我們高度重視的領(lǐng)域之一，大模型也是其中的核心技術(shù)之一。目前，中國的大模型產(chǎn)業(yè)已經(jīng)涵蓋了算法、芯片、云計算等多個領(lǐng)域，并且在這些領(lǐng)域中，中國的公司已經(jīng)具備了相當?shù)募夹g(shù)實力和市場份額。

最后，從技術(shù)實力來看，中國的大模型水平也在不斷提升，各大互聯(lián)網(wǎng)巨頭紛紛推出自家的產(chǎn)品。例如，阿里巴巴推出了“通義千問”、百度公司推出了“文心一言”、華為推出了“盤古系列”AI大模型、360推出了“360智腦4.0”、商湯科技推出了“日日新”大模型、科大訊飛推出了“星火”大模型，這里就不一一列舉。簡而言之，中國大模型開發(fā)已經(jīng)呈現(xiàn)“百舸爭流千帆競”的態(tài)勢，其中一些大模型已經(jīng)處于世界領(lǐng)先水平。

不過，需要注意的是，周鴻祎所說的“中國大模型部分能力已經(jīng)超過GPT-4”是一個非常宏觀的說法，具體指的是哪些方面，還需要更多的數(shù)據(jù)和實驗來證明。因此，我們?nèi)f不能盲目自信。在人工智能落地應(yīng)用爆發(fā)的前夕，我們更需要的是持續(xù)投入研究和發(fā)展，才能在大模型領(lǐng)域取得更大的進展，趕上甚至超越國外同行。