五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊

Swin Transformer從零詳細(xì)解讀

2022-10-18 17:40 作者:不敗阿豪  | 我要投稿

?
1.SwinTRM整體架構(gòu)解讀 P1 - 00:49
?

整個(gè)視頻四部分


?
1.SwinTRM整體架構(gòu)解讀 P1 - 01:41
?

回顧TRM模型

TRM的encoder并不改變輸入和輸出的形狀,無論vit還是swin都一樣

?
1.SwinTRM整體架構(gòu)解讀 P1 - 02:56
?

左邊是encoder細(xì)節(jié)結(jié)構(gòu),抽象為右邊灰色的框框


?
1.SwinTRM整體架構(gòu)解讀 P1 - 03:46
?

回顧vit模型


?
1.SwinTRM整體架構(gòu)解讀 P1 - 05:28
?

swin相對(duì)于vit的創(chuàng)新


?
1.SwinTRM整體架構(gòu)解讀 P1 - 06:52
?

如何把圖像變成一個(gè)個(gè)token

問題:復(fù)雜度太大

vit問題


?
1.SwinTRM整體架構(gòu)解讀 P1 - 08:53
?

swin vs vit

vit:把一張圖片分為若干patch(共9個(gè)),每個(gè)patch作為一個(gè)token輸入encoder

swin:把一張大圖片分為一個(gè)個(gè)window(共9個(gè)),window里每一個(gè)像素點(diǎn)作為一個(gè)token輸入encoder


?
1.SwinTRM整體架構(gòu)解讀 P1 - 10:34
?

swintrm整體架構(gòu)圖

看一篇論文最好方法:搞清楚每一個(gè)零部件輸入和輸出的數(shù)據(jù)的形狀和變化

?
1.SwinTRM整體架構(gòu)解讀 P1 - 14:19
?

整體形狀變化


?
1.SwinTRM整體架構(gòu)解讀 P1 - 16:04
?

源代碼實(shí)現(xiàn)的時(shí)候和原架構(gòu)圖不同


?
2.相對(duì)位置編碼解析 P2 - 00:37
?

patch partition



?
2.相對(duì)位置編碼解析 P2 - 02:08
?

第二個(gè)紅色框里的重點(diǎn)內(nèi)容:

1、相對(duì)位置編碼如何實(shí)現(xiàn)?

2、移動(dòng)窗口注意力機(jī)制如何實(shí)現(xiàn)?

3、patch融合如何實(shí)現(xiàn)?

?
2.相對(duì)位置編碼解析 P2 - 02:37
?

相對(duì)位置編碼的實(shí)現(xiàn)

1、TRM中的位置編碼:在輸入部分+位置編碼(正余弦函數(shù),不可以學(xué)習(xí))

2、vit模型中劃分為一個(gè)個(gè)patch后沒有使用正余弦函數(shù),而是初始化一個(gè)個(gè)索引,根據(jù)索引得到參數(shù)

3、swinTRM


?
2.相對(duì)位置編碼解析 P2 - 05:06
?

swinTRM相對(duì)位置信息加在哪里

B的形狀是什么

?
2.相對(duì)位置編碼解析 P2 - 06:43
?

一個(gè)例子




?
2.相對(duì)位置編碼解析 P2 - 10:06
?

什么是絕對(duì)位置信息

什么是相對(duì)位置信息


?
2.相對(duì)位置編碼解析 P2 - 11:40
?

網(wǎng)格的絕對(duì)位置和相對(duì)位置

1種絕對(duì)位置信息

4種相對(duì)位置信息


?
2.相對(duì)位置編碼解析 P2 - 12:53
?

怎么把4種相對(duì)位置信息加入attention矩陣


?
2.相對(duì)位置編碼解析 P2 - 18:04
?



?
2.相對(duì)位置編碼解析 P2 - 19:42
?

position embedding

?
3.窗口移動(dòng)注意力機(jī)制 P3 - 00:14
?

原始的窗口注意力機(jī)制

存在問題

移動(dòng)窗口注意力


?
3.窗口移動(dòng)注意力機(jī)制 P3 - 03:09
?

移動(dòng)前

移動(dòng)后


當(dāng)窗口滑動(dòng)到最右端出現(xiàn)同一窗口不相鄰的情況,右下端出現(xiàn)4、5、7、8不相鄰

?
3.窗口移動(dòng)注意力機(jī)制 P3 - 07:40
?

mask符號(hào)

矩陣的信息:0元素代表同一窗口,非0元素代表本不相鄰被框到一起

把非0元素置位-100或負(fù)無窮,得到mask矩陣


?
4.復(fù)雜度解析 P4 - 00:19
?


?
4.復(fù)雜度解析 P4 - 05:12
?

單頭

多頭


?
4.復(fù)雜度解析 P4 - 06:15
?

窗口注意力機(jī)制



?
4.復(fù)雜度解析 P4 - 06:44
?

patch merging降采樣










Swin Transformer從零詳細(xì)解讀的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
阳朔县| 普兰县| 汤原县| 赣州市| 广水市| 汤原县| 高雄县| 康马县| 德化县| 财经| 西贡区| 五常市| 澄江县| 阜宁县| 仲巴县| 龙游县| 高雄县| 略阳县| 通渭县| 北海市| 沐川县| 万安县| 洮南市| 衢州市| 镶黄旗| 甘泉县| 孙吴县| 郸城县| 陆河县| 永川市| 汝城县| 鄯善县| 马公市| 田东县| 安义县| 南丰县| 五莲县| 赤水市| 疏勒县| 长沙市| 巨鹿县|