2.6.4 随机误差的区间概率
1.随机误差的区间概率
正态分布曲线和横轴所夹的面积表示全部数据出现概率的总和,显然应当是100%,即为1。记为

测定值x出现在某一区间的概率,如出现在区间[a,b]的概率P(a≤x≤b)就等于直线x=a、x=b与正态分布曲线、坐标横轴所包围的面积,即

这个积分计算同μ与σ有关,计算起来不方便。通常将横坐标的x改用u表示,u定义为

这就使均值为μ、标准差为σ的正态分布变成了均值为0、标准差为1的标准正态分布。相应地,其分布密度函数变为

对式(2-20)积分则方便得多。人们已经计算出不同u值的f(u)曲线所包围的面积的值,即对式(2-20)进行积分的积分值,并制成了不同形式的正态分布表供直接查阅。本书附录B-1列出了标准正态分布表,表中给出的积分值为

式中kα表示标准正态分布的“上α分位数”,见附表B-1。利用标准正态分布表,可求取随机误差落在某一区间的概率。
【例2-2】某测定值的误差服从正态分布,已知测定标准差σ=2.5,求测定值的误差位于区间(-3,3)的概率。
解:由题意,xa-μ=-3,xb-μ=3。按式(2-19)进行变换

于是原题化为求u处于区间(-1.2,1.2)的概率。
由正态分布的对称性,有

并且有
P(u≥-kα)=1-p(u≥kα) (2-23)
如果ua与ub的绝对值相等而符号相反,即ua=-ka,ub=ka,由式(2-22),并结合式(2-23)可以推导出

式中,P(u≥kα)的值可由附录B-1直接查到。本例的ua=-1.2,ub=1.2,所以ka=1.2。查附录B-1,当ka=1.2时,P(u≥1.2)=α=0.1151。所以,按式(2-24)
P(-1.2≤u≤1.2)=1-2×0.1151=0.7698
即测定值的误差位于区间(-3,3)的概率为76.98%。
【例2-3】求测定值的误差位于区间(-σ,σ)的概率。
解:
P(u≤1)=1-2P(u≥1)=1-2×0.1587=0.6828
用同样的方法可以计算出测定值的误差落在区间(-2σ,2σ)和(-3σ,3σ)的概率,分别为
P(u≤2)=1-2P(u≥2)=1-2×0.0228=0.9544
P(u≤3)=1-2P(u≥3)=1-2×0.00135=0.9973
从上面的计算可以看出,测定值的误差落在区间(-3σ,3σ)的概率是很大的,接近于1。而落在这个区间以外的概率则为
1-0.9973=0.0027
即在1000次测定中,出现误差的绝对值大于3倍标准差的机会不超过3次。因此,人们常把误差的绝对值等于3倍标准差称为最大误差。
误差落在(-2σ,2σ)以外的概率为
1-0.9544=0.0456
即在大约20次测定中,出现误差的绝对值大于2倍标准差的机会不超过一次。
2.计算随机误差的区间概率的Excel方法
计算随机误差的区间概率的Excel方法可用标准正态分布的累积函数NORMSDIST()。
功能:返回标准正态分布的累积函数,该分布的平均值为0,标准偏差为1。可以使用该函数代替标准正态分布表(见附录B-1)。返回值为P(u≤z)。
语法:
NORMSDIST(z)
其中,z为需要计算其分布的数值。
说明:如果z为非数值型,函数NORMSDIST()返回错误值“#VALUE!”。
示例:
①NORMSDIST(1.333333)等于0.908789。
②计算P(│u│≤ka),ka分别为1.2和3。计算公式及结果分别为:
=2*NORMSDIST(1.2)-1;显示结果0.769860537;
=2*NORMSDIST(3)-1;显示结果0.997300066。