首页/文章/ 详情

概率统计在化工中应用 三

3年前浏览2271

   image.png

 过冷水诚挚邀请你加入Matlab仿真秀官方交流群进行Matlab学习、问题咨询、 Matlab相关资料下载,qq:927550334 

QQ图片20210424105303.png

         参数估计是最常用的统计推断问题之一,即如何根据样本观测值推断此样本所属总体中未知参数的取值。当随机变量所服从的概率分布类型已知时,还需确定分布函数中的参数,这样随机变量的分布才能完全确定。

    对参数θ进行估计有两种方式,即点估计和区间估计。点估计可以用样本数据计算得到总体参数的最好估值,但不能给出包括在估计过程中的误差大小的概念。区间估计则是设想一个随机区间包含未知参数,并计算这个区间包含它的概率。

点估计

点估计要求构造统计量 image.png作为参数的近似值。当然,原则上任意统计量都可以作为未知参数的估计量,所以点估计不唯一。但是不同估计量却有着好坏之分。通常采用三个标准来衡量。

(1)无偏差性:若估计值image.png的数学期望image.png等于总体的未知参数θ,则称image.pngθ的无偏估计值。无偏的意义就是image.png估计θ时,没有系统偏差。样本均值和方差是总体数学期望和方差的无偏估计值。

(2)有效性:如果image.pngθ为无偏估计,若存在D(θ1)≤D(θ2),则称θ1θ2,有效。有效性的概念表示了精度的高低。

(3)一致性:对任意给定的正数ε,总有 image.png,则称θ与估计值image.png是一致的。例如,当样本容量增加时,样本均值X接近总体的平均值μ ,因此可以说X是μ 的一致估计值。

按照构造统计量的方法不同,点估计又可以分为矩法、最大似然估计法、最小二乘法等,这里只介绍最大似然估计法。,

当某组观测值.x1,x2,,xn 是从依赖于一些参数的某一特定概率分布f(x,θ)得到时,则出现这组观测值的概率(或概率密度)为

image.png

称为似然(Likehood)函数。似然函数值达到最大的参数值image.png来估计参数真值的方法称为最大似然法。image.png称为θ的最大似然估计。

由于ln L与L在同一点上达到最大,所以利用最大似然估计法只要解方程组

image.png

区间估计

点估计可以给出一个总体参数的估计值,但这个估计值是受样本数据影响的,因此还希望知道这一估计值的偏差程度,这就是区间估计的问题,即假定为一个估计值,确定下式中lu的值:

image.png

1-α 称为置信度,0<α<l。在容量为θ的样本中找出包含θ真值的区间的概率为1 ,该区间lθu称为置信度为100(1-α)%的θ的双限置信区间。lu分别称作置信上限和下限。与之类似,置信度为100(1-α)%的下限置信区间为:lθ;置信度为100(1 -α)%的上限置信区间为θu

对于正态总体分布而言,通过大量的实践总结出了正态总体抽样统计量的分布如表

 

待估参数

条件

统计量及其分布

μ

已知σ2

image.png

μ

未知σ2

image.png

σ2

-

image.png

μ1-μ2

已知σ12σ22

image.png

μ1-μ2

未知σ12σ22

image.png

image.png


image.png

     当统计量的概率分布已知时,进行区间估计就很容易了。例如对于上表第一种情况,估计μ的区间。采用U统计量,它服从标准正态分布,假定置信度为1-αu区间估计变为求以下不等式:

image.png

image.png

再例如,对于表中最后一种情况样本方差比σ12/σ22。选择用F统计量,假定置信度为1-α

image.png

因此置信区间为

image.png 

Matlab 参数估计方法

最大似然法估计函数

MATLAB的函数mle和* fit是采用最大似然法进行参数估计的函数。函数mle的调用格式

[phat,pci]=mle('dist',data)
[phat,pci]=mle( 'dist',data,alpha)

        输入变量中,data为原始数据,dist 指定特定的分布类型,其可能的取值见表返回值中, phat为参数的最大似然估计值,pci为参数95%的置信区间(即参数落在该区间内的概率是95%)。如果置信水平不是95%,可以同alpha输入变量中定义。

中文函数名

调用名称

输入参数A

输入参数B

输入参数C

输入参数D

Beta分布

Beta

a第一个形状参数

b第二个形状参数

——

——

二项分布

Binomial

n实验次数

p 每次成功实验的概率

——

——

卡法分布

Chisquare

v自由度

——

——

——

指数分布

Exponetial

u均值

——

——

——

F分布

F

v1分子自由度

v2分母自由度

——

——

Gamma分布

Gamma

a形状参数

b尺度参数

——

——

几何分布

Geometric

ρ概率参数

——

——

——

超几何分布

Hypergeometric

m总体的大小

k总体所需特征项数

n抽取样本数

——

对数分布

Lognormal

u对数值均值

σ对数值的标准差

——

——

负二项分布

Negative Binomial

r成功次数

p单个实验成功概率

——

——

非中心F分布

Noncentral F

v1分子自由度

v2分母自由度

δ非中心参数

——

非中心t分布

Noncentral t

v自由度

δ非中心参数

——

——

非中心卡方

Noncentral Chi-square

v自由度

δ非中心参数

——

——

正态分布

Normal

u均值

σ标准差

——

——

泊松分布

Poisson

λ均值

——

——

——

瑞利分布

Rayleigh

b尺度参数

——

——

——

T分布

T

v自由度

——

——

——

均匀分布

Uniform

a下部端点

b上部端点

——

——

离散均匀分布

Discrete Uniform

n最大可观测值

——

——

——

Weibull分布

Weibull

a尺度参数

b形状参数

——

——

     函数* fit这里的*表示随机变量概率分布函数的种类的字符,即表中的字符。* fit的功能与mle函数相同,可以计算各种分布时参数的最大似然估计及置信区间的函数。例如,命令

[phat,pci]= betafit(x,alpha)

    给出了数据x的贝塔分布参数a,b的最大似然估计值phat和置信水平为alpha的置信区间pci。

       从某材料中随机抽取的19个样品,在一定条件下进行寿命实验,得到其寿命为0.19,0.78,0.96,1.3l,2.78,3.16,4.15,4.67,4.85,6.50,7.35,8.01,8.27,12.00,13.95,16.00,21.21,27.00,34.95分钟。已知材料寿命服从威布尔分布,求这种材料的平均寿命与分布参数的最大似然估计及参数的95%的置信区间。

程序如下

 

x=[0.19 0.78 0.96 1.31 2.78 3.16 4.15 4.67 4.85 6.50 7.35 8.01 8.27 12.00 13.95 16.00 21.21 27.00 34.95];
m1 = mean(x)
[phat,pci]= wblfit(x)
m1 =
    9.3732
phat =
    9.2442    0.9688
pci =
    5.6690    0.6796
   15.0742    1.3812

正态总体参数的区间估计

        在MATLAB的统计工具箱中没有专门的区间估计函数。但是,根据正态总体参数估计常用的统计量和求解思路,可以方便地使用MATLAB概率分布分位点函数,即* inv,求解区间估计问题。

        已知某零件的直径服从正态分布,从该批产品中随机抽取10件,测得平均直径为202.5 mm,已知总体标准差σ=2.5 mm,试建立该种零件平均直径的置信区间,给定置信度为0.95。

程序如下

 n=10;
mean=202.5;
sigma=2.5;
interval=[mean-norminv(0.025)*sigma/sqrt(n),mean norminv(0.025)*sigma/sqrt(n),]
interval =
  204.0495  200.9505

629K测定HI 解离度x,得到下列数值:0.1914,0.1953,0.1956,0.1973,0.1968,0.1938,0.1949,0.1948,0.1954,0.1947。已知解离度与平衡常数K的关系如下。

image.png

求629 K时平衡常数及其95%置信区间。

由测得的解离度数据.,通过式(8.37)可以计算平衡常数K。因此,这是一个总体方差未知,求总体均值的区间估计问题,即表8.7的第2种情况。求解程序如下。

clear
x=[0.1914 0.1953 0.1956 0.1973 0.1968 0.1938 0.1949 0.1948 0.1954 0.1947];
n= length(x);
K=(x./(2*(1-x))).^2;
Kmean =mean(K);
S=std(K);
Interval=[Kmean-tinv(0.025,n-1)*S/sqrt(n),Kmean tinv(0.025,n-1)*S/sqrt(n)]
Interval =
    0.0149    0.0145

解离常数的置信区间为[0.0149,0.0145]

采用两种方法测定溶液中铁离子浓度。求方差比的95%的双限置信区间。

铁离子浓度


1

2

3

4

5

6

7

8

分光广度法

46

46.3

54.2

54.6

50.8

47.3

48.5

36.2

原子吸收法

51.8

50

53.2

49.3

52.8

66.2

52.3

50.5

 x1=[46.0 46.3 54.2 54.6 50.8 47.3 48.5 36.2];
x2=[51.8 50.0 53.2 49.3 52.8 66.2 52.3 50.5];
n1= length(x1);n2 =length(x2);
S1=var(x1);S2=var(x2);
r=S1/S2;alpha =0.05;
Interval=[r/finv(1-alpha/2,n1-1,n2- 1),r/finv(alpha/2,n1-1,n2-1)]
Interval =
0.2316    5.7777

本期过冷水要和大家分享的关于参数估计在化工中的实际应用

图片

        过冷水发表于 仿真秀 平台原创文章,未经授权禁止私自转载,如需转载请需要和作者沟通表明授权声明,未授权文章皆视为侵权行为,必将追责。如果您希望加入Matlab仿真秀官方交流群进行Matlab学习、问题咨询、 Matlab相关资料下载均可加群:927550334。

精品回顾

 matlab绘制农夫过河动态图

分子动力学的原子空间运动轨迹演示编程

过冷水带你用matlab制作演示动画

python批量移动文件&重命名代码分享

过冷水和你分享 matlab读取存储各种文件的方法 文末有独家金曲分享

image.png

MATLAB
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2021-10-08
最近编辑:3年前
过冷水
博士 | 讲师 讨论号:927550334
获赞 361粉丝 184文章 107课程 11
点赞
收藏
作者推荐
未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈