五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

NVIDIA Ada Lovelace 架構(gòu) 淺入閑談(中)- 著色器執(zhí)行重排序

2023-03-05 13:07 作者:B1ueMicr0  | 我要投稿

上篇文章簡單聊了下?NVIDIA RTX 架構(gòu),這回接著更新。重點主要放在?Shader Execution Reordering 這項新技術(shù)上來。

這里首先就要回到 GPU 的本質(zhì)上了。GPU 是一種并行度極其高的硬件,并發(fā)處理相似任務(wù)的效率非常高。

這里不得不提到一個概念,內(nèi)存的局部性原理:

時間局部性內(nèi)存位置被引用了一次在未來可能再次被引用。

空間局部性內(nèi)存位置被引用了一次,那么程序很可能在未來會引用其附近的一個內(nèi)存位置。

對 GPU 這樣的硬件來說,相鄰光線之間內(nèi)存局部性越好,執(zhí)行效率越高。這一點 NVIDIA 早在十多年前就做出了行動,F(xiàn)ermi 架構(gòu)正是通過對內(nèi)存子系統(tǒng)的 L1 進(jìn)行改進(jìn),提高了內(nèi)存局部性,從而提高了光追效率。

以路徑跟蹤 (Path-tracing) 為例(目前使用廣泛的一種光線追蹤形式),存在著一個叫“著色器分歧 (shader divergence) ”的限制,尤其是光線多次反彈以及用了很多種著色器的場景下體現(xiàn)得尤為明顯。

擊中物體并反彈以后,衍生光線擊中的其它表面可能使用了多種和原先截然不同的著色器。著色器分歧導(dǎo)致數(shù)據(jù)的相關(guān)性,局部性差。在這里著色器分歧主要體現(xiàn)在線程的任務(wù)執(zhí)行分歧,光線反彈以后,擊中使用不同著色器的表面,不同線程之間執(zhí)行著完全不同的著色器代碼,代碼路徑亂,相關(guān)性差,對 GPU 來說難以合并地高效執(zhí)行。

怎么辦呢?

在業(yè)內(nèi)最常見的做法就是直接在場景里使用簡化的著色器,這個是從根源上把問題給優(yōu)化了(不是解決?。阅茈m得到優(yōu)化,但從另一方面來講,簡化后的著色器肯定不如原來的。

而這次 NVIDIA 在 Ada 架構(gòu)上引入了一種叫 著色器執(zhí)行重排序 (Shader Execution Reordering, SER)?的技術(shù),不解決前面的著色器本身復(fù)雜度的問題,而是直接把后面相似度非常差的任務(wù)們進(jìn)行?相關(guān)性排序 (coherency sort),從而提升并行計算的效率。這里回到之前的局部性概念,SER 正是通過優(yōu)化數(shù)據(jù)的局部性,最大化利用了 GPU 的特性。

對著色器任務(wù)進(jìn)行相關(guān)性排序之后,對 GPU 來說達(dá)成了一個非常理想的任務(wù)狀態(tài),效率大幅提高。

該技術(shù)讓高分歧場景 (路徑跟蹤就是其中一類) 下 光追著色器 的執(zhí)行效率提升了高達(dá) 100% 以上,?即便體現(xiàn)在一些混合光追游戲里,也有大幅度提升。NV 描述的 2077 的 RT: Overdrive 模式的 路徑跟蹤全局光照,因?SER 得到了游戲總體?44% 的幀率提升。


今天就先到這里吧 = ̄ω ̄=


NVIDIA Ada Lovelace 架構(gòu) 淺入閑談(中)- 著色器執(zhí)行重排序的評論 (共 條)

分享到微博請遵守國家法律
珲春市| 格尔木市| 梨树县| 府谷县| 金寨县| 铁岭市| 商都县| 秦皇岛市| 苗栗县| 波密县| 琼中| 万山特区| 南澳县| 浑源县| 唐海县| 湟源县| 渝北区| 阳东县| 新巴尔虎右旗| 乌鲁木齐县| 昭苏县| 乐业县| 林甸县| 丹东市| 澄迈县| 七台河市| 乌兰察布市| 浦北县| 潞城市| 洪雅县| 绥滨县| 邯郸县| 瑞金市| 准格尔旗| 云安县| 尼勒克县| 定南县| 杭锦后旗| 定安县| 贺州市| 南投县|