过冷水诚挚邀请你加入Matlab仿真秀官方交流群进行Matlab学习、问题咨询、 Matlab相关资料下载,qq:927550334
过冷水所从事的学习研究属于化工应用中的动力学和热力学研究,自然免不了和各种实验数据打交道,根据实验数据构建各种模型,统计分析规律。化工模型根据模型物理背景的不同可以分为机理模型和经验(统计回归)模型两类。前者的建立基于基本的物理原理,如守恒定律,传递现象﹑热力学定律等,模型方程由严格的数学推导获得。后者的建立则类似黑箱过程,通过实验获得各种变最与输入的关系,通过回归建立模型。以下流动压降计算的例子,可以清楚地说明各种模型方法的优缺点。
假定密度为ρ,黏度为μ的流体稳定地以层流流过一圆管,圆管长度为L,半径为R,现需建立单位管长压降与平均流量的关系。对于层流流动而言,其压降的来源是流体之间的相互摩擦,据此可以根据动量守恒方程建立模型
当密度为ρ,黏度为μ的流体稳定地流过装有沙子的圆管,沙子的填充长度为L,圆管的内径为R,试建立单位床层压降与平均流量的关系。对于这种情况,压降来自流体之间的摩擦、流体与多孔介质的摩擦、流体的合并与分散等。此时描述过程的流动方程和边界条件复杂,因此很难使用类似层流圆管压降模型的建立方法,需要采用另外的方法。多孔介质中流动压降模型的建立,最早由Darcy完成。他测量了装填有不同填料床层中水的流动压降,得到了著名的 Darcy方程,
关系式与流动机理并没有直接联系,但它可以描述压降的主要影响因素流体的黏度μ,流速v及与填料性质相关的渗透系数k之间的关系,因此是一个经验模型。采用经验模型可以方便.快速地建立模型输出与各种变量之间的关系。由于模型的数学形式可以自由选择,其求解也更加简便。它比较适用于过程的影响因素复杂,或者机理模型难以求解等情况。本期过冷水就和大家一起学习一下统计理论在化工模型构建中的应用。
统计分布相关概念
在一定条件下对随机现象进行的一次观察称为随机试验,观察得到的每一种可能结果称为随机事件。在大量的重复观察中,一个随机事件A出现的可能性有大有小,这种可能性大小就是该事件的发牛框率,记作P(A).
随件变量及其分布
如果把一个随机事件以数量的形式描述,则称它为随机变量。对于随机变量最重要的是要知道它在给定值或给定区间的概率。定义随机变量的分布函数为
可见分布函数给出了随机变量X小于或等于x的概率。通过概率分布函数可以计算随机变量的各种性质。
不同随机变量X服从不同的概率分布,可以用不同的分布函数来表示。Р只能取某些离散值的称为离散随机变量,对于这种变量采用概率分布律(分布列);
来表示它们在指定点上的取值,则其概率分布函数为:
当随机变量的概率可以取有限区间所有值时称为连续随机变量。连续随机变量则采用概率密度函数:
表示指定小区间的取值概率,则概率分布函数为
由分布函数的定义可以知,随机变量在指定区间[a,b]之间取值概率为
正态分布
正态分布是应用最广泛的 ,最重要的一种概率分布。自然界太量的随机现象都服从正态分布,而且可以证明,如果一个随机变量受到诸多因素的影响,但其中任何一个因素都不起决定性作用,则该随机变量一定服从或近似服从正态分布。我们关心的实验观察值也服从这一分布。
若随机变量X的概率密度为:
其中σ2,u为常数,,则称X服从参数为σ2,u的正态分布。
正态分布函数为
特别地,当u=0,σ=1时,称X为标准正态分布,此时其概率密度为
随机变量的数字特征
随机变量的分布函数可以完整地描述随机变量的取值规律,但在很多实际问题中,我们仅需知道随机变量的某些特征就够,这就是随机变量的数字特征。例如,为了比较两个催化剂的活性差异,通常我们会各取几个样品进行实验,然后计算每种催化剂上的平均收率,平均收率高的被认为活性高。这里的平均值就是收率的一种数字特征。
数学期望(均值) 数学期望是算式平均值概念的推广,即概率意义下的平均。设离散型随机变量X的分布列为P(X = xk)= pk,(k = 1,2,3,...),期望E(X)表示为
方差
数学期望是描述随机变量取值的集中位置的一个数字特征,在实际问题中,有时只知道数学期望是不够的。例如一批催化剂,其平均寿命周期是E(X)=3000 h,仅由这一指标还不能确定其质量的好坏。例如有可能大部分催化剂的寿命都在2900~3100 h之间,也有可能其中一半是高质量的,寿命约为4500 h,另一半质量很差,寿命约为1500 h。为了评定这批催化剂的好坏,还需进一步考察催化剂寿命X与其均值E(X)的偏离程度。若偏离程度小,表示质量比较稳定,从这一意义上说其质量较好。
设X是随机变量,若E(X一E(X))°存在,定义E(X一E(X))3为X的方差,记为DX或D(X)。称√DX为随机变量的均方差或标准差。方差表达了随机变量X的取值与均值E(X)的偏离程度,X的取值越集中,则D(X)越小,反之则D(X)较大。因此,方差D(X)是描述X取值分散程度的量。
Matlab中概率密度分布函数
概率分布函数的种类很多,MATLAB中大约可以进行30种禳率分布的计算。在命令窗口键入disttool则打开分布函数图形界面。
常见概率分布密度函数如下表
中文函数名 | 调用名称 | 输入参数A | 输入参数B | 输入参数C | 输入参数D |
Beta分布 | Beta | a第一个形状参数 | b第二个形状参数 | —— | —— |
二项分布 | Binomial | n实验次数 | p 每次成功实验的概率 | —— | —— |
卡法分布 | Chisquare | v自由度 | —— | —— | —— |
指数分布 | Exponetial | u均值 | —— | —— | —— |
F分布 | F | v1分子自由度 | v2分母自由度 | —— | —— |
Gamma分布 | Gamma | a形状参数 | b尺度参数 | —— | —— |
几何分布 | Geometric | ρ概率参数 | —— | —— | —— |
超几何分布 | Hypergeometric | m总体的大小 | k总体所需特征项数 | n抽取样本数 | —— |
对数分布 | Lognormal | u对数值均值 | σ对数值的标准差 | —— | —— |
负二项分布 | Negative Binomial | r成功次数 | p单个实验成功概率 | —— | —— |
非中心F分布 | Noncentral F | v1分子自由度 | v2分母自由度 | δ非中心参数 | —— |
非中心t分布 | Noncentral t | v自由度 | δ非中心参数 | —— | —— |
非中心卡方 | Noncentral Chi-square | v自由度 | δ非中心参数 | —— | —— |
正态分布 | Normal | u均值 | σ标准差 | —— | —— |
泊松分布 | Poisson | λ均值 | —— | —— | —— |
瑞利分布 | Rayleigh | b尺度参数 | —— | —— | —— |
T分布 | T | v自由度 | —— | —— | —— |
均匀分布 | Uniform | a下部端点 | b上部端点 | —— | —— |
离散均匀分布 | Discrete Uniform | n最大可观测值 | —— | —— | —— |
Weibull分布 | Weibull | a尺度参数 | b形状参数 | —— | —— |
离散均匀分布案例:
设一个随机变量ζ服从离散均匀分布,如果其概率为
则其分布函数为:
n=20;x=1:n; y = pdf('Discrete Uniform',x,n); %绘制分布图像 figure1 = figure; axes1 = axes('Parent',figure1); hold(axes1,'on'); plot(x,y,'MarkerFaceColor',[0 0.447058826684952 0.74117648601532],'MarkerEdgeColor',[0 0 1],'Marker','o','LineWidth',2,'Color',[1 0 0]); ylabel('概率分布');xlabel('随机变量'); title('离散均匀分布'); xlim(axes1,[0 21]);ylim(axes1,[-0.2 0.4]); box(axes1,'on'); hold(axes1,'off'); set(axes1,'FontSize',14,'LineWidth',2,'YTick',[-0.2 -0.14 -0.08 -0.02 0.04 0.1 0.16 0.22 0.28 0.34 0.4 0.4]); %储存图像 % pwd是获取当前运行目录 filename=[pwd,'\','离散均匀分布']; print(filename,figure1,'-r600','-dtiffn');
二项分布:
若将实验可能结果分为两个:A发生、A不发生,则称此随机实验为二项分布:
那么ζ服从一个简单离散分布P(ζ=1)=p,P(ζ=0)=1-p,称为二项分布。将二项分布实验独立重复进行n次,称为n重二项分布,n重二项分布实验中A发生的次数分布为:
称为参数为n、p的二项分布:ζ~B(n,p)。
均匀分布
连续型概率分布的表达式与离散型有很大不同,因为连续型随机变量取值是无法列举的,况且在单个点取值的概率总是0。连续型概率分布是用密度函数来表示。相应随机变量取值的概率可通过对密度函数积分得到。
均匀分布密度函数:
正态分布
正态分布是应用最广泛的一类概率分布,其概率密度为:
记为N(u,σ2),其中u是随机变量取值的平均,而σ表征了随机变量取值的差异。特别地,N(0,1)称为标准正态分布。
x=-8:0.1:8; mu=0;sigma=1; pd = makedist('Normal',mu,sigma); y = pdf(pd,x); %正态分布的累计概率分布 syms x x1=-8:0.1:8; mu=0;sigma=1; f=@(x)((1./sqrt(2*pi*sigma)).*(exp((-(x-mu).^2)./(2*sigma.^2))));%定义原始积分项函数; y1=arrayfun(@(x)(quad(f,-8,x)),x1); %绘制分布图像 figure1 = figure; axes1 = axes('Parent',figure1); hold(axes1,'on'); plot(x,y,'MarkerFaceColor',[1 0 0],'MarkerEdgeColor',[1 0 0],'Marker','o','LineWidth',2); ylabel('随机变量概率密度'); xlabel('随机变量'); title('正态分布'); xlim(axes1,[-9 9]); ylim(axes1,[-0.04 0.5]); hold(axes1,'off'); set(axes1,'FontName','楷体','FontSize',14,'FontWeight','bold','LineWidth',2,'XTick',[-8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8],'YTick',[-0.04 0.01 0.06 0.11 0.16 0.21 0.26 0.31 0.36 0.41 0.46 0.5]); %累计概率分布图像 figure2 = figure; axes1 = axes('Parent',figure2); hold(axes1,'on'); plot(x1,y1,'DisplayName','$F(X)=\int_{-8}^{t}f(t)dt$','LineWidth',2); text('Parent',axes1,'FontWeight','bold','FontSize',14,'Interpreter','latex','String','$N(\mu={0},\sigma^{2} ={1})$','Position',[-7.26031294452347 1.03435582822086 0]); ylabel('累计概率'); xlabel('随机变量'); title('正态累计分布'); box(axes1,'on'); hold(axes1,'off'); set(axes1,'FontName','楷体','FontSize',14); legend1 = legend(axes1,'show'); set(legend1,'Position',[0.134682450787465 0.850159728422969 0.220896033581171 0.049125053411969],'Interpreter','latex','FontSize',14); %储存图像 % pwd是获取当前运行目录 filename1=[pwd,'\','正态分布']; filename2=[pwd,'\','正态累计分布']; print(filename1,figure1,'-r600','-dtiffn'); print(filename2,figure2,'-r600','-dtiffn');
在统计概率中,常用分布和功能函数,都已经讲解完毕,就可以进行以应用为主化工模型应用。数理统计的基础内容比较多,本期就讲这么多,有需要再补充的内容和后续完善,有需要咨询内容可以留言讨论。本期过冷水和大家分享的内容就这么多。
过冷水发表于 仿真秀 平台原创文章,未经授权禁止私自转载,如需转载请需要和作者沟通表明授权声明,未授权文章皆视为侵权行为,必将追责。如果您希望加入Matlab仿真秀官方交流群进行Matlab学习、问题咨询、 Matlab相关资料下载均可加群:927550334。
精品回顾
过冷水和你分享 matlab读取存储各种文件的方法 文末有独家金曲分享