五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

認(rèn)識GPU:深入剖析概念、工作原理以及與CPU的差異!

2023-08-11 08:56 作者:絕對牛網(wǎng)絡(luò)科技  | 我要投稿

在最近幾個月里,幾乎所有行業(yè)的同仁都已經(jīng)認(rèn)識到了ChatGPT的驚人能力。你是否了解,ChatGPT之所以如此強(qiáng)大,是因為它運(yùn)用了成千上萬張NVIDIA Tesla A100顯卡進(jìn)行人工智能推理和圖形計算。

探索GPU的奇妙世界:簡明解讀,精彩不容錯過!

GPU是什么?

GPU的英文全稱Graphics Processing Unit,圖形處理單元。

說直白一點:GPU是一款專門的圖形處理芯片,做圖形渲染、數(shù)值分析、金融分析、密碼破解,以及其他數(shù)學(xué)計算與幾何運(yùn)算的。GPU可以在PC、工作站、游戲主機(jī)、手機(jī)、平板等多種智能終端設(shè)備上運(yùn)行。

GPU和顯卡的關(guān)系,就像是CPU和主板的關(guān)系。前者是顯卡的心臟,后者是主板的心臟。有些小伙伴會把GPU和顯卡當(dāng)成一個東西,其實還有些差別的,顯卡不僅包括GPU,還有一些顯存、VRM穩(wěn)壓模塊、MRAM芯片、總線、風(fēng)扇、外圍設(shè)備接口等等。

GPU和CPU誰最強(qiáng)呢?

GPU(圖形處理器)和CPU(中央處理器)是兩種不同的硬件設(shè)備,各自在不同的領(lǐng)域有著不同的優(yōu)勢。它們的性能和強(qiáng)大程度取決于具體的應(yīng)用場景和任務(wù)。

CPU是一種通用處理器,主要負(fù)責(zé)執(zhí)行各種計算和控制任務(wù)。它在單線程任務(wù)和復(fù)雜邏輯計算方面表現(xiàn)出色,具有更高的時鐘頻率和更大的緩存容量,使其在串行處理任務(wù)上表現(xiàn)很好。

因此,對于一些對單線程性能要求高、需要進(jìn)行復(fù)雜邏輯計算或控制流程的任務(wù),CPU是更適合的選擇。

如果拿不準(zhǔn)買什么樣子的型號可以參考一下這張圖,相關(guān)功能和都有,可以按需配置~

GPU是一種專用處理器,旨在進(jìn)行圖形渲染和并行計算。它具有大量的處理核心(CUDA核心),能夠同時處理多個任務(wù),并行地執(zhí)行大規(guī)模的浮點運(yùn)算。這使得GPU在高性能計算、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等需要大規(guī)模并行計算的任務(wù)上表現(xiàn)出色。對于這些需要大規(guī)模并行計算的任務(wù),GPU通常比CPU更強(qiáng)大。

接下來,我們做個簡單的對比

·?結(jié)構(gòu)組成不同

CPU和GPU都是運(yùn)算的處理器,在架構(gòu)組成上都包括3個部分:運(yùn)算單元ALU、控制單元Control和緩存單元Cache。

但是,三者的組成比例卻相差很大。

在CPU中緩存單元大概占50%,控制單元25%,運(yùn)算單元25%;

在GPU中緩存單元大概占5%,控制單元5%,運(yùn)算單元90%。

?

結(jié)構(gòu)組成上的巨大差異說明:CPU的運(yùn)算能力更加均衡,但是不適合做大量的運(yùn)算;GPU更適合做大量運(yùn)算。

這倒不是說GPU更牛X,實際上GPU更像是一大群工廠流水線上的工人,適合做大量的簡單運(yùn)算,很復(fù)雜的搞不了。但是簡單的事情做得非???,比CPU要快得多。

相比GPU,CPU更像是技術(shù)專家,可以做復(fù)雜的運(yùn)算,比如邏輯運(yùn)算、響應(yīng)用戶請求、連網(wǎng)通信等。但是因為ALU占比較少、內(nèi)核少,所以適合做相對少量的復(fù)雜運(yùn)算。

?

·?緩存不同

·?在CPU里面,大概50%是緩存單元,并且是四級緩存結(jié)構(gòu);而在GPU中,緩存是一級或者二級的。

·?浮點運(yùn)算方式不同

·?CPU性能更加注重線程的性能,在控制部分做的事情較多,這樣做就是為了確??刂浦噶畈荒苤袛啵诟↑c計算上功耗少。相較于CPU,GPU的結(jié)構(gòu)更為簡單,基本上它也只做單精度或雙精度浮點運(yùn)算。GPU的運(yùn)算速度更快,吞吐量也更高。

·?響應(yīng)方式不同

·?CPU基本上是實時響應(yīng),采用多級緩存來保障多個任務(wù)的響應(yīng)速度。GPU往往采用的是批處理的機(jī)制,即:任務(wù)先排好隊,挨個處理。
GPU對于圖形處理我們假設(shè)在實時渲染中,一幀1080*720P的圖片,那么這張圖就有大概777600個像素點。如果按照最基本的24幀/秒的幀率計算。1秒鐘就要求計算機(jī)處理18662400個,即:1866.24萬個像素點。這還是高清的情況下,如果是1090*1080、2K、4K甚至8K的視頻渲染,可想而知,這個計算量是何其巨大。尤其是在像游戲這樣的實時渲染場景下,顯然僅僅依靠CPU渲染是會超時的。實際上,在屏幕中顯示的三維物體都要經(jīng)過多重的坐標(biāo)變換,并且物體的表面會受到環(huán)境中各種光線的影響,呈現(xiàn)不同的顏色和陰影。這就包括了光線的漫射、折射、透射、散射等。
接下來,我們以英偉達(dá)NVIDIA RTX3090 為例,看下GPU是如何進(jìn)行渲染的。RTX3090的流式多處理器有10496個,每個內(nèi)核都有具備整數(shù)運(yùn)算和浮點運(yùn)算的部分,還有用于在操作數(shù)中排隊和收集結(jié)果的部分。所謂流式多處理器可以認(rèn)為是一個獨立的任務(wù)處理單元,也可以認(rèn)為一顆GPU包含了10496個CPU同時處理各個圖片處理任務(wù)。

·?


我們就可以通過算法和程序,對1秒鐘18662400個像素點的整體任務(wù)進(jìn)行切割分片,讓10496顆處理器并行計算。這樣的話,每個處理器負(fù)責(zé)大概每秒處理18662400/10496,即1778個像素點的渲染任務(wù)就行了。如下圖所示,在GPU中會劃分為多個流式處理區(qū),每個處理區(qū)包含數(shù)百個內(nèi)核,每個內(nèi)核相當(dāng)于一顆簡化版的CPU,具備整數(shù)運(yùn)算和浮點運(yùn)算的功能,以及排隊和結(jié)果收集功能。
注意,除了流處理器CUDA以外,影響GPU性能的還有

·?核心頻率:頻率越高,性能越強(qiáng)、功耗也越高。

·?顯示位寬:單位是bit,位寬決定了顯卡同時可以處理的數(shù)據(jù)量,越大越好。

·?顯存容量:顯存容量越大,代表能緩存的數(shù)據(jù)就越多。

·?顯存頻率:單位是MHz或bps,顯存頻率越高,圖形數(shù)據(jù)傳輸速度就越快。

·?總結(jié)一言以蔽之,GPU不管是處理圖形渲染、數(shù)值分析,還是處理AI推理。底層邏輯都是將極為繁重的數(shù)學(xué)進(jìn)行任務(wù)拆解,化繁為簡。然后,利用GPU多流處理器的機(jī)制,將大量的運(yùn)算拆解為一個個小的、簡單的運(yùn)算,并行處理。我們也可以認(rèn)為一個GPU就是一個集群,里面每個流處理器都是一顆CPU,這樣就容易理解了。
以上是關(guān)于GPU概念、工作原理的簡要介紹。說是簡單,其實在圖形處理方面,還有很多深層次的處理邏輯沒有展開,比如像素位置變換、三角原理等等。

·?這個行業(yè)中,要屬NVIDIA厲害了。如果是GPU相關(guān)問題,或者要購買都可以找找他們~也有很多顯卡用了他們家的GPU,購買的時候可以問問~

?

#AI#GPU#人工智能#Niusousou

認(rèn)識GPU:深入剖析概念、工作原理以及與CPU的差異!的評論 (共 條)

分享到微博請遵守國家法律
汕尾市| 东阿县| 苍溪县| 建德市| 额济纳旗| 青冈县| 特克斯县| 宽城| 南溪县| 固安县| 澎湖县| 玉林市| 仙桃市| 满洲里市| 鹿邑县| 惠水县| 金乡县| 陕西省| 家居| 清河县| 新闻| 合水县| 平安县| 萨迦县| 石泉县| 台江县| 开阳县| 内乡县| 宣城市| 杂多县| 临夏市| 宁波市| 独山县| 衡东县| 安达市| 锡林浩特市| 思茅市| 广昌县| 重庆市| 南昌县| 雷州市|