五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

7.R語言分析數(shù)據(jù):隨機森林分類+影響因子重要性可視化

2023-04-07 17:15 作者:植保小萌新  | 我要投稿


R語言實戰(zhàn)第17章

(1)數(shù)據(jù)準備

class是因變量,其余列為自變量,ID及其前面一列的編號不做為變量。

訓練集和驗證集可以不區(qū)分


1 library (randomForest)

2 df.train<-read.csv("df.train.csv")


3 set.seed(1234)

#該命令的作用是設(shè)定生成隨機數(shù)的種子,種子是為了讓結(jié)果具有重復性。

4 fit.forest <- randomForest(class~. , data=df.train,na.action=na.roughfix,importance=TRUE)

#class~.;class表示該目錄下為因變量(響應(yīng)變量),~.表示省略號 表示包含所有的自變量。na.action=na.roughfix,將NA單元格進行按列求均值或眾數(shù),importance=TRUE將錯誤值進行計算。



type=2


隨機森林的可視化:


模型誤差圖:(對數(shù)據(jù)量的界定圖中200以后區(qū)域平穩(wěn),視頻中選擇了500個左右,因此數(shù)據(jù)選這比較合理)


varImpPlot(fit.forest,main = "variable importance")#fit.forest隨機森林的結(jié)果,

main標題


5

na.action=na.roughfix,

6

importance=TRUE)

7#設(shè)置proximity=TRUE,則指定計算臨近矩陣

8fit.forest

9importance(fit.forest, type=2)10#驗證(可無)

11 forest.pred <- predict(fit.forest,df.validate)

12forest.perf <- table(df.validate$class,forest.pred,13

dnn=c("Actual", "Predicted" ))

14 forest.perf

mhJ.nZ1


7.R語言分析數(shù)據(jù):隨機森林分類+影響因子重要性可視化的評論 (共 條)

分享到微博請遵守國家法律
嘉黎县| 大足县| 苗栗县| 陆川县| 枣强县| 宁津县| 界首市| 宣武区| 友谊县| 宜阳县| 夏津县| 麦盖提县| 大同县| 阿拉尔市| 玉溪市| 临澧县| 辽阳县| 德令哈市| 长沙县| 穆棱市| 海丰县| 农安县| 永靖县| 隆回县| 汤阴县| 星座| 安宁市| 新沂市| 饶阳县| 年辖:市辖区| 容城县| 元谋县| 当涂县| 东阳市| 涞水县| 上思县| 金昌市| 衡水市| 巩留县| 额济纳旗| 泰和县|