R語言使用蒙特卡洛模擬進(jìn)行正態(tài)性檢驗(yàn)及可視化
原文鏈接:http://tecdat.cn/?p=14601?
如何使用蒙特卡洛模擬來推導(dǎo)隨機(jī)變量可能的分布,我們回到統(tǒng)計(jì)數(shù)據(jù)(無協(xié)變量)進(jìn)行說明。我們假設(shè)觀察值是基礎(chǔ)隨機(jī)變量,具有未知分布的隨機(jī)變量。
這里有兩種策略。在經(jīng)典統(tǒng)計(jì)中,我們使用概率定理來推導(dǎo)隨機(jī)變量的屬性在可能的情況下的分布。另一種方法是進(jìn)行計(jì)算統(tǒng)計(jì)。
對于評估擬合度,測試正態(tài)性不是很有用。在本文中,我想說明這一點(diǎn)。我們使用男生的身高數(shù)據(jù),
X=Davis$height[Davis$sex=="M"]
我們可以可視化其分布(密度和累積分布)
u=seq(155,205,by=.5)
par(mfrow=c(1,2))
hist(X,col=rgb(0,0,1,.3))
lines(density(X),col="blue",lwd=2)
lines(u,dnorm(u,178,6.5),col="black")
Xs=sort(X)
n=length(X)
p=(1:n)/(n+1)
plot(Xs,p,type="s",col="blue")
lines(u,pnorm(u,178,6.5),col="black")
?

?
它看起來像正態(tài)分布,因此我們可以在左側(cè)添加密度高斯分布,在右側(cè)添加cdf。我不想測試它是否是高斯分布。為了查看此分布是否相關(guān),可以使用蒙特卡洛模擬法
?
?

我們可以在左側(cè)看到很難通過密度(直方圖以及核密度密度估計(jì)器)評估正態(tài)性? 。人們很難想到兩個(gè)密度之間的有效距離。但是,如果我們看一下右邊的圖,我們可以比較經(jīng)驗(yàn)分布累積分布。如上所述,我們可以按照Cramer-von Mises??檢驗(yàn)或??Kolmogorov-Smirnov??距離的建議計(jì)算黃色區(qū)域? 。
?

?
如果我們抽取10,000個(gè)反事實(shí)樣本,則可以使用測試統(tǒng)計(jì)量等的方法來可視化距離的分布(此處為密度),并將其與樣本的觀察值進(jìn)行比較。測試統(tǒng)計(jì)量超過觀察值的樣本比例
mean(dks)
[1] 0.78248
計(jì)算版本的值
ks.test(X,"pnorm",178,6.5)
One-sample Kolmogorov-Smirnov test
data: ?X
D = 0.068182, p-value = 0.8079
alternative hypothesis: two-sided
在統(tǒng)計(jì)數(shù)據(jù)中,要么操作抽象對象(如隨機(jī)變量),要么實(shí)際上使用一些代碼生成假樣本以量化不確定性。后者很有趣,因?yàn)樗兄诳梢暬瘡?fù)雜的量化。
?

參考文獻(xiàn)
1.R語言泊松Poisson回歸模型分析案例
2.R語言進(jìn)行數(shù)值模擬:模擬泊松回歸模型
3.r語言泊松回歸分析
4.R語言對布豐投針(蒲豐投針)實(shí)驗(yàn)進(jìn)行模擬和動(dòng)態(tài)可視化
5.用R語言模擬混合制排隊(duì)隨機(jī)服務(wù)排隊(duì)系統(tǒng)
6.GARCH(1,1),MA以及歷史模擬法的VaR比較
7.R語言做復(fù)雜金融產(chǎn)品的幾何布朗運(yùn)動(dòng)的模擬
8.R語言進(jìn)行數(shù)值模擬:模擬泊松回歸模型
9.R語言對巨災(zāi)風(fēng)險(xiǎn)下的再保險(xiǎn)合同定價(jià)研究案例:廣義線性模型和帕累托分布Pareto distributions