Matlab-概率統(tǒng)計篇(一)

數(shù)據(jù)經(jīng)過預處理后,對于單個數(shù)據(jù)本身應該有一定的“內(nèi)在”認知,包括其基本統(tǒng)計量(最值、中位數(shù)、樣本方差等)、變化特征(長期趨勢、周期、隨機噪聲等)等。查閱研究變量的相關文章,可以對這些觀測量有進一步的緣由認知。
但是,有時候又需要借助與其他同族樣本量(“同集合元素”),或者異族樣本量(“不同集合元素”)的關聯(lián)性等統(tǒng)計分析,得到新的理解或詮釋。另外,基于觀測結(jié)果得到目標問題、提出解決問題的方案、各種方案的評估、方案的最終實施和效果檢驗。以上都是基于概率統(tǒng)計的內(nèi)容,因此,只要涉及“科學”,就離不開概率統(tǒng)計,也可以說概率統(tǒng)計滲透在生活的方方面面,包括你不經(jīng)意之間思考的問題、做出的決定、產(chǎn)生的影響等各種環(huán)節(jié),而這種“慣性”或“習慣”就存在于個人的“大腦算法的決策路徑”中。
Matlab為概率統(tǒng)計提供了各種分布密度、參數(shù)估計、假設檢驗方法、回歸分析及多元分析方法的相關函數(shù)等。由于篇幅和內(nèi)容的限制,不對具體概率統(tǒng)計的數(shù)學知識進行詳細贅述,同時可以參考《天文學中的概率統(tǒng)計》-陳黎(科學出版社)一書,本篇具體相關函數(shù)也主要摘錄自此書,由于Matlab版本的不同,有些函數(shù)會有對應的名稱變化,使用時應當再注意命令行的指示或者“help 函數(shù)名”的格式進行再深入學習。
本篇主要介紹各種密度函數(shù)(...pdf)和累積分布密度函數(shù)(...cdf)及其中的分布函數(shù)名。

函數(shù)名????????????????????說明(概率密度函數(shù))? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?基本調(diào)用格式
betapdf? ? ? ? ? ? ? ? ? β分布('Beta')????????????????????????? ? ? ? ? ? ? ? ? ?Y=batapdf(X,A,B)
binopdf? ? ? ? ? ? ? ? ? 二項分布('Binomial')? ???????????????? ? ? ? ? ? ? ?Y=binopdf(X,N,P)
chi2pdf? ? ? ? ? ? ? ? ? ?分布('chisquare')? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?Y=chi2pdf(X,V)
exppdf? ? ? ? ? ? ? ? ? ?指數(shù)分布('Exponential')????????????????????????????Y=exppdf(X,Mu)
fpdf? ? ? ? ? ? ? ? ? ? ? ? F分布('F')????????????????????????????????????????????????? Y=fpdf(X,V1,V2)
gampdf? ? ? ? ? ? ? ? ? 伽馬分布('Gamma')????????????????????????????????? Y=gampdf(X,A,B)
geopdf? ? ? ? ? ? ? ? ? 幾何分布('Geometric')????????????????????????????? Y=geopdf(X,P)
hygepdf? ? ? ? ? ? ? ? 超幾何分布('Hypergeometric')????????????????? Y=hypepdf(X,M,K,N)
normpdf? ? ? ? ? ? ? ? 正態(tài)分布('Normal')????????????????????????????????????Y=normpdf(X,Mu,sigma)
lognpdf? ? ? ? ? ? ? ? ? 對數(shù)正態(tài)分布('Lognormal')???????????????????????Y=lognpdf(X,Mu,sigma)
nbinpdf? ? ? ? ? ? ? ? ? 逆二項分布('Negative Binomial')????????????? ?Y=nbinpdf(X,R,P)
ncfpdf? ? ? ? ? ? ? ? ? ? 非中心F分布('Noncentral F')???????????????????? Y=ncfpdf(X,Nu1,Nu2,delta)
nctpdf? ? ? ? ? ? ? ? ? ? 非中心t分布('Noncentral t')????????????????????????Y=nctpdf(X,V,delta)
ncx2pdf? ? ? ? ? ? ? ? ?非中心分布('Noncentral Chi-square')????Y=ncx2pdf(X,V,delta)
poisspdf? ? ? ? ? ? ? ? 泊松分布('Poisson')????????????????????????????????????Y=poisspdf(X,Lambda)
raylpdf? ? ? ? ? ? ? ? ? ?瑞利分布('Rayleigh')????????????????????????????????? ?Y=raylpdf(X,B)
tpdf? ? ? ? ? ? ? ? ? ? ? ? t分布('T')???????????????????????????????????????????????????? Y=tpdf(X,V)
unidpdf? ? ? ? ? ? ? ? ? 離散均勻分布('Discrete Uniform')???????????????Y=unipdf(X,N)
unifpdf? ? ? ? ? ? ? ? ? ?連續(xù)均勻分布('Uniform')?????????????????????????????Y=unifpdf(X,A,B)
wblpdf? ? ? ? ? ? ? ? ? ?韋布爾分布('Weibull')????????????????????????????????? Y=wblpdf(X,A,B)

當然,也可以直接用pdf(指定分布)函數(shù)調(diào)用對應的分布函數(shù)名,具體對應的函數(shù)名如上,還有一些分布函數(shù)沒有列出,如:疲勞壽命分布('BirnbaumSaunders')、邏輯斯諦分布('Logistic')、對數(shù)邏輯斯諦分布('LogLogistic')、廣義極值分布('Generalized Extrme Value')、廣義帕累托分布('Generalized Pareto')、逆高斯分布('InverseGaussian')等。而關于累計分布函數(shù),就是把上面pdf對應的都改成cdf即可。
那在實際的研究過程中,通常需要建立觀測量和一個自變量或多個自變量之間的關系,即表明彼此之間有一定的相關性,就可以用“回歸方程”來表示,那就有一元回歸和多元回歸分析的內(nèi)容,而回歸也有線性和非線性函數(shù),那Matlab又是如何實現(xiàn)的呢?(注意:數(shù)據(jù)標準化處理:zscore)
線性回歸函數(shù):regress
擬合交互式工具:cftool;多項式擬合交互式工具:polytool
非線性回歸函數(shù)
(i) 用nlinfit求基本參數(shù)
(ii) 用nlparci求參數(shù)估計的置信區(qū)間
(iii) 用nlpredci預測值的置信區(qū)間
逐步回歸:stepwise
系統(tǒng)聚類法
(i) 調(diào)用距離函數(shù):如pdist(歐氏距離)
(ii) 聚類函數(shù):linkage
(iii) 分類樹形圖函數(shù):dendrogram
(iv) 聚類標記函數(shù):cluster
動態(tài)聚類法(快速聚類法):kmeans
主成分分析:pca
當然,以上只是列舉了常見的一些方法,而有關于具體函數(shù)的使用,需要結(jié)合自己的數(shù)據(jù)和函數(shù)的具體實踐使用做對應調(diào)整。