五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

機(jī)器學(xué)習(xí)譜聚類詳解

2022-11-24 00:20 作者:021usc  | 我要投稿

完整文檔和代碼

https://gitee.com/youryouth/mc/tree/master/spectral_clustering

完整文檔和代碼
文檔截圖

一、概述

對(duì)于下圖所示的數(shù)據(jù)進(jìn)行聚類,可以采用GMM或者K-Means的方法:

數(shù)據(jù)

然而對(duì)于下圖所示的數(shù)據(jù),單純的GMM和K-Means就無(wú)效了,可以通過(guò)核方法對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換,然后再進(jìn)行聚類:


數(shù)據(jù)

如果直接對(duì)上圖所示的數(shù)據(jù)進(jìn)行聚類的話可以考慮采用譜聚類(spectral clustering)的方法。

總結(jié)來(lái)說(shuō),聚類算法可以分為兩種思路:

①Compactness,這類有 K-means,GMM 等,但是這類算法只能處理凸集,為了處理非凸的樣本集,必須引?核技巧。
②Connectivity,這類以譜聚類為代表。

關(guān)于凸集和非凸,如下圖左非凸,圖右凸

非凸和凸集

二、基礎(chǔ)知識(shí)

無(wú)向權(quán)重圖

譜聚類的方法基于帶權(quán)重的無(wú)向圖,圖的每個(gè)節(jié)點(diǎn)是一個(gè)樣本點(diǎn),圖的邊有權(quán)重,權(quán)重代表兩個(gè)樣本點(diǎn)的相似度。

假設(shè)總共N個(gè)樣本點(diǎn),這些樣本點(diǎn)構(gòu)成的圖可以用G%3D(V%2CE)表示,其中V%3D%5C%7Bv_1%2C%20v_2%2C...v_N%5C%7D,圖中的每個(gè)點(diǎn)v_i也就代表了一個(gè)樣本x_iE是邊,用鄰接矩陣(相似度矩陣)W_%7BN%C3%97X%7D來(lái)表示,W%3D%5Bw_%7Bij%7D%5D%2Ci%E2%89%A51%2CN%E2%89%A5j,由于是無(wú)向圖,因此W_%7Bij%7D%20%3D%20W_%7Bji%7D。

另外還有度的概念,這里可以類比有向圖中的出度和入度的概念,不過(guò)圖中的點(diǎn)v_i的度d_i

并不是和該點(diǎn)相連的點(diǎn)的數(shù)量,而是和其相連的邊的權(quán)重之和,也就是鄰接矩陣的每一行的值加起來(lái),即:

d_%7Bi%7D%3D%5Csum_%7Bj%3D1%7D%5E%7BN%7D%20w_%7Bi%20j%7D

而圖的度矩陣(對(duì)角矩陣)D_%7BN%C3%97N%7D可以表示如下:

D%3D%5Cleft%5B%5Cbegin%7Barray%7D%7Bllll%7D%0Ad_%7B1%7D%20%26%20%26%20%5C%5C%0A%26%20d_%7B2%7D%20%26%20%5C%5C%0A%26%20%26%20%5C%5C%0A%26%20%26%20d_%7BN%7D%0A%5Cend%7Barray%7D%5Cright%5D

另外我們定義,對(duì)于點(diǎn)集V的一個(gè)子集A%E2%88%88V,我們定義%7CA%7C等于子集A中點(diǎn)的個(gè)數(shù)

%5Coperatorname%7Bvol%7D(A)%3A%3D%5Csum_%7Bi%20%5Cin%20A%7D%20d_%7Bi%7D

構(gòu)建鄰接矩陣

%5Cepsilon%20-近鄰法

首先需要設(shè)置一個(gè)閾值%5Cepsilon%20,比較任意兩點(diǎn)x_ix_j之間的距離s_%7Bij%7D%3D%7C%7Cx_i-x_j%7C%7C%5E2_%7B2%7D%5Cepsilon%20的大小,定義鄰接矩陣如下:

w_%7Bi%20j%7D%3D%5Cleft%5C%7B%5Cbegin%7Barray%7D%7Bl%7D%0A0%2C%20s_%7Bi%20j%7D%3E%5Cepsilon%20%5C%5C%0A%5Cepsilon%2C%20s_%7Bi%20j%7D%20%5Cleq%20%5Cepsilon%0A%5Cend%7Barray%7D%5Cright.

這種方法表示如果兩個(gè)樣本點(diǎn)之間的歐氏距離的平方小于閾值%5Cepsilon%20,則它們之間是有邊的。

因?yàn)椴恢С謒arkdown語(yǔ)法,關(guān)于其他構(gòu)建鄰接矩陣方法可以參考鏈接,下面只貼出代碼的運(yùn)行結(jié)果。


運(yùn)行結(jié)果

運(yùn)行結(jié)果對(duì)比


機(jī)器學(xué)習(xí)譜聚類詳解的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
衡阳县| 仪陇县| 嘉荫县| 墨竹工卡县| 双辽市| 仙游县| 偏关县| 桑植县| 秦安县| 甘南县| 仙桃市| 永福县| 九龙县| 石阡县| 镇坪县| 禄劝| 高雄县| 尚义县| 崇明县| 宣汉县| 和龙市| 咸宁市| 东山县| 杂多县| 渑池县| 济南市| 老河口市| 亳州市| 河津市| 山阴县| 集贤县| 通江县| 合肥市| 凌海市| 利川市| 东港市| 延吉市| 通榆县| 贵港市| 柘城县| 都兰县|