过冷水诚挚邀请你加入Matlab仿真秀官方交流群进行Matlab学习、问题咨询、 Matlab相关资料下载,qq:927550334
参数估计是最常用的统计推断问题之一,即如何根据样本观测值推断此样本所属总体中未知参数的取值。当随机变量所服从的概率分布类型已知时,还需确定分布函数中的参数,这样随机变量的分布才能完全确定。
对参数θ进行估计有两种方式,即点估计和区间估计。点估计可以用样本数据计算得到总体参数的最好估值,但不能给出包括在估计过程中的误差大小的概念。区间估计则是设想一个随机区间包含未知参数,并计算这个区间包含它的概率。
点估计
点估计要求构造统计量 作为参数的近似值。当然,原则上任意统计量都可以作为未知参数的估计量,所以点估计不唯一。但是不同估计量却有着好坏之分。通常采用三个标准来衡量。
(1)无偏差性:若估计值的数学期望等于总体的未知参数θ,则称为θ的无偏估计值。无偏的意义就是估计θ时,没有系统偏差。样本均值和方差是总体数学期望和方差的无偏估计值。
(2)有效性:如果与θ为无偏估计,若存在D(θ1)≤D(θ2),则称θ1较θ2,有效。有效性的概念表示了精度的高低。
(3)一致性:对任意给定的正数ε,总有 ,则称θ与估计值是一致的。例如,当样本容量增加时,样本均值X接近总体的平均值μ ,因此可以说X是μ 的一致估计值。
按照构造统计量的方法不同,点估计又可以分为矩法、最大似然估计法、最小二乘法等,这里只介绍最大似然估计法。,
当某组观测值.x1,x2,…,xn 是从依赖于一些参数的某一特定概率分布f(x,θ)得到时,则出现这组观测值的概率(或概率密度)为
称为似然(Likehood)函数。似然函数值达到最大的参数值来估计参数真值的方法称为最大似然法。称为θ的最大似然估计。
由于ln L与L在同一点上达到最大,所以利用最大似然估计法只要解方程组
区间估计
点估计可以给出一个总体参数的估计值,但这个估计值是受样本数据影响的,因此还希望知道这一估计值的偏差程度,这就是区间估计的问题,即假定为一个估计值,确定下式中l和u的值:
1-α 称为置信度,0<α<l。在容量为θ的样本中找出包含θ真值的区间的概率为1-α ,该区间l≤θ≤u称为置信度为100(1-α)%的θ的双限置信区间。l和u分别称作置信上限和下限。与之类似,置信度为100(1-α)%的下限置信区间为:l≤θ;置信度为100(1 -α)%的上限置信区间为θ≤u。
对于正态总体分布而言,通过大量的实践总结出了正态总体抽样统计量的分布如表
待估参数 | 条件 | 统计量及其分布 |
μ | 已知σ2 | |
μ | 未知σ2 | |
σ2 | - | |
μ1-μ2 | 已知σ12,σ22 | |
μ1-μ2 | 未知σ12,σ22 | |
当统计量的概率分布已知时,进行区间估计就很容易了。例如对于上表第一种情况,估计μ的区间。采用U统计量,它服从标准正态分布,假定置信度为1-α,u区间估计变为求以下不等式:
即
再例如,对于表中最后一种情况样本方差比σ12/σ22。选择用F统计量,假定置信度为1-α
因此置信区间为
Matlab 参数估计方法
最大似然法估计函数
MATLAB的函数mle和* fit是采用最大似然法进行参数估计的函数。函数mle的调用格式
[phat,pci]=mle('dist',data) [phat,pci]=mle( 'dist',data,alpha)
输入变量中,data为原始数据,dist 指定特定的分布类型,其可能的取值见表。返回值中, phat为参数的最大似然估计值,pci为参数95%的置信区间(即参数落在该区间内的概率是95%)。如果置信水平不是95%,可以同alpha输入变量中定义。
中文函数名 | 调用名称 | 输入参数A | 输入参数B | 输入参数C | 输入参数D |
Beta分布 | Beta | a第一个形状参数 | b第二个形状参数 | —— | —— |
二项分布 | Binomial | n实验次数 | p 每次成功实验的概率 | —— | —— |
卡法分布 | Chisquare | v自由度 | —— | —— | —— |
指数分布 | Exponetial | u均值 | —— | —— | —— |
F分布 | F | v1分子自由度 | v2分母自由度 | —— | —— |
Gamma分布 | Gamma | a形状参数 | b尺度参数 | —— | —— |
几何分布 | Geometric | ρ概率参数 | —— | —— | —— |
超几何分布 | Hypergeometric | m总体的大小 | k总体所需特征项数 | n抽取样本数 | —— |
对数分布 | Lognormal | u对数值均值 | σ对数值的标准差 | —— | —— |
负二项分布 | Negative Binomial | r成功次数 | p单个实验成功概率 | —— | —— |
非中心F分布 | Noncentral F | v1分子自由度 | v2分母自由度 | δ非中心参数 | —— |
非中心t分布 | Noncentral t | v自由度 | δ非中心参数 | —— | —— |
非中心卡方 | Noncentral Chi-square | v自由度 | δ非中心参数 | —— | —— |
正态分布 | Normal | u均值 | σ标准差 | —— | —— |
泊松分布 | Poisson | λ均值 | —— | —— | —— |
瑞利分布 | Rayleigh | b尺度参数 | —— | —— | —— |
T分布 | T | v自由度 | —— | —— | —— |
均匀分布 | Uniform | a下部端点 | b上部端点 | —— | —— |
离散均匀分布 | Discrete Uniform | n最大可观测值 | —— | —— | —— |
Weibull分布 | Weibull | a尺度参数 | b形状参数 | —— | —— |
函数* fit这里的*表示随机变量概率分布函数的种类的字符,即表中的字符。* fit的功能与mle函数相同,可以计算各种分布时参数的最大似然估计及置信区间的函数。例如,命令
[phat,pci]= betafit(x,alpha)
给出了数据x的贝塔分布参数a,b的最大似然估计值phat和置信水平为alpha的置信区间pci。
从某材料中随机抽取的19个样品,在一定条件下进行寿命实验,得到其寿命为0.19,0.78,0.96,1.3l,2.78,3.16,4.15,4.67,4.85,6.50,7.35,8.01,8.27,12.00,13.95,16.00,21.21,27.00,34.95分钟。已知材料寿命服从威布尔分布,求这种材料的平均寿命与分布参数的最大似然估计及参数的95%的置信区间。
程序如下
x=[0.19 0.78 0.96 1.31 2.78 3.16 4.15 4.67 4.85 6.50 7.35 8.01 8.27 12.00 13.95 16.00 21.21 27.00 34.95]; m1 = mean(x) [phat,pci]= wblfit(x) m1 = 9.3732 phat = 9.2442 0.9688 pci = 5.6690 0.6796 15.0742 1.3812
正态总体参数的区间估计
在MATLAB的统计工具箱中没有专门的区间估计函数。但是,根据正态总体参数估计常用的统计量和求解思路,可以方便地使用MATLAB概率分布分位点函数,即* inv,求解区间估计问题。
已知某零件的直径服从正态分布,从该批产品中随机抽取10件,测得平均直径为202.5 mm,已知总体标准差σ=2.5 mm,试建立该种零件平均直径的置信区间,给定置信度为0.95。
程序如下
n=10; mean=202.5; sigma=2.5; interval=[mean-norminv(0.025)*sigma/sqrt(n),mean norminv(0.025)*sigma/sqrt(n),] interval = 204.0495 200.9505
629K测定HI 解离度x,得到下列数值:0.1914,0.1953,0.1956,0.1973,0.1968,0.1938,0.1949,0.1948,0.1954,0.1947。已知解离度与平衡常数K的关系如下。
求629 K时平衡常数及其95%置信区间。
由测得的解离度数据.,通过式(8.37)可以计算平衡常数K。因此,这是一个总体方差未知,求总体均值的区间估计问题,即表8.7的第2种情况。求解程序如下。
clear x=[0.1914 0.1953 0.1956 0.1973 0.1968 0.1938 0.1949 0.1948 0.1954 0.1947]; n= length(x); K=(x./(2*(1-x))).^2; Kmean =mean(K); S=std(K); Interval=[Kmean-tinv(0.025,n-1)*S/sqrt(n),Kmean tinv(0.025,n-1)*S/sqrt(n)] Interval = 0.0149 0.0145
解离常数的置信区间为[0.0149,0.0145]
采用两种方法测定溶液中铁离子浓度。求方差比的95%的双限置信区间。
铁离子浓度 | ||||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | |
分光广度法 | 46 | 46.3 | 54.2 | 54.6 | 50.8 | 47.3 | 48.5 | 36.2 |
原子吸收法 | 51.8 | 50 | 53.2 | 49.3 | 52.8 | 66.2 | 52.3 | 50.5 |
x1=[46.0 46.3 54.2 54.6 50.8 47.3 48.5 36.2]; x2=[51.8 50.0 53.2 49.3 52.8 66.2 52.3 50.5]; n1= length(x1);n2 =length(x2); S1=var(x1);S2=var(x2); r=S1/S2;alpha =0.05; Interval=[r/finv(1-alpha/2,n1-1,n2- 1),r/finv(alpha/2,n1-1,n2-1)] Interval = 0.2316 5.7777
本期过冷水要和大家分享的关于参数估计在化工中的实际应用
过冷水发表于 仿真秀 平台原创文章,未经授权禁止私自转载,如需转载请需要和作者沟通表明授权声明,未授权文章皆视为侵权行为,必将追责。如果您希望加入Matlab仿真秀官方交流群进行Matlab学习、问题咨询、 Matlab相关资料下载均可加群:927550334。
精品回顾
过冷水和你分享 matlab读取存储各种文件的方法 文末有独家金曲分享