25萬一張的顯卡,禁止向中國供應(yīng)
ChatGPT風(fēng)靡全球后,科技巨頭們紛紛入局。
而AI的硬件心臟,則由英偉達(dá)強(qiáng)勢把持著,占據(jù)用于機(jī)器學(xué)習(xí)的圖形處理器市場的95%。
然而,現(xiàn)在英偉達(dá)的高性能GPU:A100和H100,都不允許賣給中國公司了!
A100非常適合支持ChatGPT、Stable Diffusion等工具的機(jī)器學(xué)習(xí)模型,它能夠同時(shí)執(zhí)行許多簡單的計(jì)算,這對于訓(xùn)練和使用神經(jīng)網(wǎng)絡(luò)模型非常重要。
高性能GPU缺貨,正成為限制中國AI研發(fā)的最直接因素之一。
不知道百度華為阿里騰訊,這次囤夠了顯卡沒?


A100出口管制立即生效
早在2022年8月26日,美國政府就向英偉達(dá)下達(dá)了通知,要求對A100、H100進(jìn)行新的出口管制許可,并立即生效。
美國政府表示,新的許可要求將解決所涵蓋產(chǎn)品,可能用于或轉(zhuǎn)移到中國和俄羅斯的軍事最終用途。

當(dāng)時(shí),就有業(yè)內(nèi)人士擔(dān)心,A100、H100這兩款GPU的斷供,將對國內(nèi)AI計(jì)算,帶來嚴(yán)重影響。
被美國明令禁售的A100,是英偉達(dá)于2020年推出,采用當(dāng)時(shí)領(lǐng)先全球的Ampere架構(gòu),以及臺積電為其專門定制的7 nm工藝,擁有540億個(gè)晶體管。

對于ChatGPT這種自然語言處理模型來說,A100芯片可以提供更快的計(jì)算速度和更高的并行計(jì)算能力,從而加快模型訓(xùn)練和推理的速度,提高模型的性能和效率。
而另一款被禁售的H100,售價(jià)超25萬元,可被視為A100下一代GPU芯片,于2022年3月份發(fā)布。

幸好事情出現(xiàn)了反轉(zhuǎn),在英偉達(dá)的游說下,重新獲得了美國政府的出口許可。在2023年3月1日之前,英偉達(dá)可以繼續(xù)給中國大陸提供A100產(chǎn)品。
現(xiàn)在,緩沖期限到了。中國企業(yè)已經(jīng)很難獲取英偉達(dá)A100芯片。現(xiàn)在國內(nèi)的A100芯片儲備,多是存貨,剩余使用壽命約為4年-6年。
中國不少公司將面臨沖擊。
目前,國內(nèi)的蔚來、小鵬、毫末智行等都在基于英偉達(dá)A100打造自動(dòng)駕駛訓(xùn)練中心。
另根據(jù)公開信息,英偉達(dá)在介紹關(guān)于A100時(shí),展示出的客戶商標(biāo)中,還包含了中國的互聯(lián)網(wǎng)巨頭阿里巴巴、百度、騰訊、京東、小米。

25萬一張的顯卡
決定AI智商
你制作出的AI到底是人工智能,還是人工智障,主要要看你跑通AI的算力和AI大模型。
3月1日,據(jù)研究機(jī)構(gòu)TrendForce的測算,當(dāng)紅炸子雞OpenAI推出的聊天機(jī)器人ChatGPT,本質(zhì)是1800億個(gè)參數(shù)的GPT-3.5大模型。
跑好這個(gè)模型,需要的GPU芯片數(shù)量高達(dá)2萬枚。
為此:微軟Azure上部署了數(shù)萬枚A100/H100高性能芯片。這是第一個(gè)采用英偉達(dá)高端GPU構(gòu)建的大規(guī)模AI算力集群。

在業(yè)內(nèi),這一公認(rèn)的說法是:1萬枚英偉達(dá)A100芯片,是做好AI大模型的算力門檻。
一些AI領(lǐng)域企業(yè)家,甚至將他們獲得的A100數(shù)量視為是否搶得先機(jī)的標(biāo)志。
美國人工智能初創(chuàng)公司、參與開發(fā)Stable Diffusion的Stability AI首席執(zhí)行官Emad Mostaque曾公開表示:
一年前,我們有32個(gè)A100。但我們夢想遠(yuǎn)大,繼續(xù)買GPU吧!
目前,Stability AI的估值已經(jīng)超過10億美元。根據(jù)第三方統(tǒng)計(jì),Stability AI現(xiàn)在可以使用的A100已經(jīng)超過5400個(gè)。
現(xiàn)在廣泛使用Stable Diffusion,AI生成的圖片,已經(jīng)開始威脅到職業(yè)畫師。


大力才能出奇跡。
以ChatGPT在1月的獨(dú)立訪客平均數(shù) 1300 萬計(jì)算,其對應(yīng)芯片需求為?3 萬張英偉達(dá) A100 GPU,初始投入成本約為8億美元,每日電費(fèi)在 5 萬美元左右。
而國內(nèi),擁有1萬張GPU的企業(yè),少之又少。國內(nèi)云廠商,主要用的是英偉達(dá)中低性能產(chǎn)品,例如A10。
擁有1萬張英偉達(dá)A100的公司,國內(nèi)大概只有一家,叫幻方量化,搞人工智能做投資的對沖基金。

最佳替代品
按照美國政府的要求,未來峰值性能等于或超過A100的GPU產(chǎn)品也被限制出售。
中國的AI研發(fā)公司,能夠獲得的最佳替代品,應(yīng)該就是英偉達(dá)的A800芯片。
A800被視為是A100的“閹割版”,英偉達(dá)針對中國市場推出了特供芯片。
高端芯片從立項(xiàng)到上市,一般需要2-3年的時(shí)間,但英偉達(dá)僅用了2個(gè)月,就把A800搞出來了。而這也從側(cè)面說明美國所謂的禁令并不是鐵板一塊,水潑不進(jìn),還是有一定的運(yùn)作空間。
A800計(jì)算性能與A100基本相同,但將NVLink高速互連總線的帶寬從600GB/s降低到400GB/s。英偉達(dá)還表示,這是無法通過修改軟件編程來超過的。
誠然,A800性能比不上A100,更比不上賣到25萬元一張的H100。
這直接影響AI集群的訓(xùn)練速度和效果,直接導(dǎo)致AI推理和模型訓(xùn)練的準(zhǔn)確度不足,中國企業(yè)即使做出類似的對話機(jī)器人,機(jī)器人的“智商”可能會(huì)遠(yuǎn)低于ChatGPT。
但A800在國內(nèi)市場,依然是難逢對手。
英偉達(dá)官方定價(jià)約82000一張,但市場價(jià)格常常高于10萬元一張,而且常常處于缺貨狀態(tài)。
英偉達(dá)從2012年的K20X到2020年的A100,GPU的推理性能提高到原來的317倍,英偉達(dá)稱之為“黃氏定律”,遠(yuǎn)超摩爾定律的發(fā)展速度。

高性能GPU芯片缺貨,正制約著中國AI的發(fā)展。

國產(chǎn)GPU成色幾何?
時(shí)至今日,發(fā)展自主芯片已經(jīng)不再是一個(gè)有爭議的選擇題,而是必須要去做的事情。
目前國內(nèi)AI芯片的研發(fā),處于一個(gè)怎樣的水平呢?
國內(nèi)一些上市公司,明確表示擁有類GPU芯片業(yè)務(wù)。
近幾年,天數(shù)智芯、壁仞科技、摩爾線程等公司,都獲得了連續(xù)大額融資,也都推出了自研的通用GPU產(chǎn)品。
例如,2022年8月,壁仞科技發(fā)布首款7nm制程的通用GPU芯片BR100,16位浮點(diǎn)算力達(dá)到1000T以上,稱其可與英偉達(dá)的旗艦H100一較高下,但尚未量產(chǎn)上市。
在英偉達(dá)的“霸權(quán)”之下,中國企業(yè)想在市場上打開局面,真的充滿了挑戰(zhàn)。
《電子工程專輯》,出了一份《45家國產(chǎn)AI芯片廠商調(diào)研分析報(bào)告》。
調(diào)研分析了瀚博半導(dǎo)體、燧原科技、平頭哥、華為海思、紫光展銳、寒武紀(jì)、地平線等國內(nèi)AI芯片廠商后,得出一個(gè)結(jié)論:
「盡管國產(chǎn)AI芯片公司在高性能和先進(jìn)工藝AI芯片的設(shè)計(jì)方面還面臨諸多挑戰(zhàn),而且在AI芯片價(jià)值鏈的EDA和IP環(huán)節(jié)上還有不小的差距。
但中國AI市場的體量和快速迭代發(fā)展仍然為眾多國產(chǎn)AI芯片廠商提供了豐富的試驗(yàn)基地和應(yīng)用設(shè)計(jì)機(jī)會(huì),接下來的3-5年將是國產(chǎn)AI芯片廠商加速AI應(yīng)用落地和大規(guī)模部署的快速發(fā)展時(shí)期。」
現(xiàn)在,國產(chǎn)GPU廠商,在自研路仍任重道遠(yuǎn)。
·END·