Matlab-概率統(tǒng)計(jì)篇(二)

Matlab提供的各種密度分布/累積密度函數(shù)可以看出其有內(nèi)置各種分布律函數(shù),可以根據(jù)分布律產(chǎn)生隨機(jī)數(shù)。當(dāng)然,也可以根據(jù)自己的分布律產(chǎn)生隨機(jī)數(shù),關(guān)于這部分內(nèi)容很大部分涉及Monte Carlo(蒙特卡羅)模擬的具體過程。
另一方面,實(shí)際情況往往有一定的樣本量,通過樣本觀測數(shù)據(jù)去結(jié)合分布來探查各種分布的參數(shù)估計(jì)。綜合來說,有以下一些常用的分布參數(shù)估計(jì)的函數(shù)及其對(duì)應(yīng)說明:

函數(shù)名????????????????????????????????????? ?說明
betafit????????????????????????????????????????β分布的參數(shù)估計(jì)
binofit????????????????????????????????????????二項(xiàng)分布的參數(shù)估計(jì)
dfittool????????????????????????????????????? ? 分布擬合工具
evfit????????????????????????????????????????????極值分布的參數(shù)估計(jì)
expfit????????????????????????????????????????? 指數(shù)分布的參數(shù)估計(jì)
fitdist????????????????????????????????????????? ?分布的擬合
gamfit????????????????????????????????????????? 伽馬分布的參數(shù)估計(jì)
gevfit????????????????????????????????????????????廣義極值分布的參數(shù)估計(jì)
gmdistribution????????????????????????????? 服從二變量高斯混合分布的參數(shù)估計(jì)
gpfit????????????????????????????????????????????? 廣義Pareto分布的參數(shù)估計(jì)
lognfit????????????????????????????????????????????對(duì)數(shù)正態(tài)分布的參數(shù)估計(jì)
mle????????????????????????????????????????????????最大似然估計(jì)
mlecov????????????????????????????????????????? 最大似然估計(jì)的漸近協(xié)方差矩陣
nbinfit????????????????????????????????????????????逆二項(xiàng)分布的參數(shù)估計(jì)
normfit????????????????????????????????????????? ?正態(tài)分布的參數(shù)估計(jì)
poissfit????????????????????????????????????????? ?泊松分布的參數(shù)估計(jì)
raylfit????????????????????????????????????????????? 瑞利分布的參數(shù)估計(jì)
unifit????????????????????????????????????????????? ?均勻分布的參數(shù)估計(jì)
wblfit????????????????????????????????????????????? 韋布爾分布的參數(shù)估計(jì)

而跟概率統(tǒng)計(jì)篇(一)中類似的,mle也相當(dāng)于是所有的參數(shù)估計(jì)所可以綜合歸納的函數(shù),其只要在使用過程中指定對(duì)應(yīng)分布的函數(shù)名即可,這個(gè)分布的函數(shù)名與(一)的基本一致,有個(gè)別不同的差別需要在使用的過程中多加注意。
另外的實(shí)際情況中,由于樣本有限,往往很難給出參量總體分布形態(tài)的假設(shè),甚至也不知道其中具體的科學(xué)過程究竟是如何,因此“非參數(shù)”檢驗(yàn)顯得尤為重要。與之對(duì)應(yīng)的就是“參數(shù)”檢驗(yàn),這是基于總體分布形式已知的情況下,對(duì)總體分布的參數(shù):均值、方差等進(jìn)行推斷,還能實(shí)現(xiàn)兩個(gè)或多個(gè)總體參數(shù)的比較。這兩種檢驗(yàn)統(tǒng)一稱為:假設(shè)檢驗(yàn)。
需要知道的是,假設(shè)檢驗(yàn)的決策過程使用了類似“反證法”的思想。一般步驟如下:
提出待檢驗(yàn)的原假設(shè)
和備擇假設(shè)
;
選擇一個(gè)檢驗(yàn)統(tǒng)計(jì)量
,其概率密度
已知;
確定顯著水平
和
的拒絕域
,使得
的概率很?。?/p>
根據(jù)
的抽樣結(jié)果計(jì)算
。如果
,則樣本與原假設(shè)沒有顯著的矛盾,即在顯著水平
下,接受
;反之拒絕
,接受
。
Matlab也提供了相當(dāng)多的假設(shè)檢驗(yàn)函數(shù),主要有以下五種。
正態(tài)分布的假設(shè)檢驗(yàn)
(i) 標(biāo)準(zhǔn)差已知情況下的均值檢驗(yàn):選擇ztest(z檢驗(yàn))
(ii) 總體標(biāo)準(zhǔn)差未知時(shí)的單個(gè)正態(tài)總體的均值檢驗(yàn):選擇ttest(t檢驗(yàn))
(iii) 總體標(biāo)準(zhǔn)差未知時(shí)的兩個(gè)正態(tài)總體均值的比較檢驗(yàn):選擇ttest2(比較t檢驗(yàn))
(iv) 總體均值未知時(shí)的單個(gè)正態(tài)總體的方差檢驗(yàn):選擇vartest(卡方檢驗(yàn))
(v) 總體均值未知時(shí)的兩個(gè)正態(tài)總體方差的比較檢驗(yàn):選擇vartest2(比較F檢驗(yàn))
游程數(shù)檢驗(yàn):runtest
擬合優(yōu)度檢驗(yàn)
(i) 卡方擬合優(yōu)度檢驗(yàn):選擇chi2gof
(ii) 科爾莫戈羅夫檢驗(yàn):選擇kstest
(iii) 斯米爾諾夫檢驗(yàn):選擇kstest2
符號(hào)檢驗(yàn):signtest
列聯(lián)表的獨(dú)立性檢驗(yàn):crosstab
在研究實(shí)際數(shù)據(jù)的過程中,往往結(jié)合數(shù)據(jù)本身的分布特點(diǎn)、數(shù)據(jù)間的分布特點(diǎn),來判別觀測的基本型和特殊型,從數(shù)學(xué)的角度剖析數(shù)據(jù),再結(jié)合各個(gè)學(xué)科對(duì)觀測對(duì)象一定的原理,說明這些基本特征和特殊現(xiàn)象出現(xiàn)的原因,這便是一個(gè)很好的“數(shù)據(jù)解釋”過程。