110 likes | 239 Views
Z. Mathematical Model. ‡. '. 数据分析与统计. 常 用 数 据 分 析 函 数. corrcoef(x)--- 求相关函数; cov(x)--- 协方差矩阵; cross(x,y)--- 向量的向量积; diff(x)--- 计算元素之间差; dot(x,y)--- 向量的点积; gradient(z,dx,dy)--- 近似梯度; histogram(x)--- 直方图和棒图; max(x), max(x,y)--- 最大分量; mean(x)--- 均值或列的平均值;
E N D
Z Mathematical Model ‡ ' 数据分析与统计
常 用 数 据 分 析 函 数 corrcoef(x)---求相关函数; cov(x)---协方差矩阵; cross(x,y)---向量的向量积; diff(x)---计算元素之间差; dot(x,y)---向量的点积; gradient(z,dx,dy)---近似梯度; histogram(x)---直方图和棒图; max(x), max(x,y)---最大分量; mean(x)---均值或列的平均值; min(x), min(x,y)---最小分量; prod(x)---列元素的积; rand(x)---均匀分布随机数; rands(x)---正态分布随机数; sort(x)---按升序排列; std(x)---列的标准偏差; sum(x)---各列的元素和; subspace(A,B)---两个子空间之间的夹角。
常 用 统 计 函 数 一、参数估计 (1)[N,X]=hist(data,k) 将区间[min(data),max(data)]分为k个区间(缺省为10),返回数据data落在每一个区间的频度数N和每一个区间的中点X。 (2)h=normplot(x)显示数据矩阵x的正态概率图,如果数据来自于正态分布,则图形显示出直线性形态,而其他概率分布分布函数显示出曲线形态。 (3)h=weibplot(x) 显示数据矩阵x的weibull概率图,如果数据来自于weibull分布,则图形显示出直线性形态,而其他概率分布分布函数显示出曲线形态。
(4)[muhat,sigmahat,muci,sigamaci]=normfit(x) [muhat,sigmahat,muci,sigamaci]=normfit(x,alpha) 对于正态分布,命令[muhat,sigmahat,muci,sigamaci]=normfit(x,alpha)在置信度(1-alpha)下估计数据x的参数,[muhat,sigmahat,muci,sigamaci]=normfit(x)在置信度0.95下估计数据x的参数,返回值muhat是x的均值,sigmahat是方差,muci是均值的置信区间,sigmaci是方差的置信区间。 (5)[muhat,muci]=expfit(x,alpha)估计指数分布的均值及其(1-alpha)置信区间。
(6)[lambdahat,lambdaci]=poissfit(x,alpha)估计泊松分布的lambda及其(1-alpha)置信区间。(6)[lambdahat,lambdaci]=poissfit(x,alpha)估计泊松分布的lambda及其(1-alpha)置信区间。 (7)[phat,pci]=weibfit(data,alpha)估计weibull分布参数。
二、假设检验 (1)[h,sig,ci]=ztest(x,m,sigma,alpha,tail) [h,sig,ci]=ztest(x,m,sigma,alpha) [h,sig,ci]=ztest(x,m,sigma) 已知数据x的方差的情况下,命令[h,sig,ci]=ztest(x,m,sigma,alpha,tail)使用z-检验检验数据x的关于均值的某一假设是否成立,sigma为方差,1-alpha为置信度,检验的假设取决于tail的取值。tail=0,检验假设“x的均值等于m”;tail=1,检验假设“x的均值大于m”;tail= -1,检验假设“x的均值小于m”。缺省的tail为0,alpha为0.05。返回h=1,表示拒绝假设,h=0表示不可以拒绝假设,sig为假设成立的概率,ci为均值的1-alpha置信区间。
(2)[h,sig,ci]=ttest(x,m, alpha,tail) [h,sig,ci]=ttest(x,m,alpha) [h,sig,ci]=ttest(x,m) 在不知数据x的方差的情况下,命令[h,sig,ci]=ztest(x,m,alpha,tail)使用t-检验检验数据x的关于均值的某一假设是否成立,1-alpha为置信度,检验的假设取决于tail的取值。tail=0,检验假设“x的均值等于m”;tail=1,检验假设“x的均值大于m”;tail= -1,检验假设“x的均值小于m”。缺省的tail为0,alpha为0.05。返回h=1,表示拒绝假设,h=0表示不可以拒绝假设,sig为假设成立的概率,ci为均值的1-alpha置信区间。
(3)[h,sig,ci]=ttest2(x,y, alpha,tail) [h,sig,ci]=ttest2(x,y, alpha) [h,sig,ci]=ttest2(x,y) 命令[h,sig,ci]=ttest2(x,y, alpha,tail)使用t-检验检验数据x,y的关于均值的某一假设是否成立,1-alpha为置信度,检验的假设取决于tail的取值。tail=0,检验假设“x的均值等于y的均值”;tail=1,检验假设“x的均值大于y的均值”;tail= -1,检验假设“x的均值小于y的均值”。缺省的tail为0,alpha为0.05。返回h=1,表示拒绝假设,h=0表示不可以拒绝假设,sig为假设成立的概率,ci为均值的1-alpha置信区间。
三、方差分析 (1)p=anova1(x) 用单因素方差分析法判断矩阵x的各列所代表的随机变量是否具有相同的均值。返回值p是x的各列所代表的随机变量具有相同均值的概率。 (2)p=anova2(x,group) 矩阵x的各列代表不同的样本,将x每group行分成一组,命令p=anova2(x,group)用双因素方差分析法对矩阵x的每一列判断其各组数据是否具有相同的均值。返回值p是一个与数据矩阵x列数相同的行矩阵,其第i列为x的第i列各组数据均值相同的概率。
四、概率和临界值计算及随机数的产生 (1)p=function(x,mu,sigma),计算相应的随机变量的分布函数在x处的函数值,其中function指normcdf, betacdf, binocdf, expcdf, gamcdf, poisscdf, unicdf, weibcdf。 (2)x=function(p,mu,sigma),计算相应的随机变量的概率p处的临界值,其中function指norminv, betainv, binoinv, expinv, gaminv, poissinv, uniinv, weibinv。 (3)x=function(mu,sigma,m,n),产生相应的随机数矩阵,其中function指normrnd, binornd, exprnd, gamrnd, poissrnd, unirnd, weibrnd。 以上函数的详细使用方法请参见统计工具箱中相应函数的说明。
五、回归分析 (1)[b,bint,r,rint,stats]=regress(y,x),其中b是回归方程中的参数估计值,bint是b的置信区间,r和rint分别表示残差及残差对应的置信区间。stats包含三个数字,分别是相关系数,F统计量及对应的概率p值。 (2)recplot(r,rint)作残差分析图 (3)rstool(x,y)一种交互式方式的句柄命令。