基础测量测量结果包含概率的表达
本帖最后由 史锦顺 于 2018-1-7 10:51 编辑-
基础测量测量结果包含概率的表达
-
史锦顺
-
思考题
在基础测量(常量测量)中,要取σ平,怎样说明“包含区间”与“包含概率”的问题呢?
-
测量有两类:基础测量与统计测量。经典测量是基础测量,现代测量仍然以基础测量为主。随着科技的发展和仪器精密度与准确度的提高,统计测量越来越多。两类测量的性质不同,处理方式不同,因而探讨测量理论问题必须区分两类测量。
-
在基础测量中有两种区间:测得值区间与真值区间。
测得值区间体现在测量仪器的研制场合与计量场合。研制场合,确定了测得值区间,计量场合公证了测得值区间。
测量场合,测量者根据测量目的,选用够格的测量仪器进行测量。测量者已知测量仪器的误差范围指标值R仪(默认已经计量合格),就可用R仪当作测得值的误差范围值。设测得值是M平,测量结果为
L真 = M平±R仪 (1)
M平是测量值Mi的平均值,称为测得值。观察几次,如果测量值不变,或尾数仅有一个字的变化,可认定是基础测量,不必进行重复测量。如果有两个字以上的变化,要进行重复测量(取20次或30次,频率短稳要求测100次),按贝塞尔公式计算σ。将计算得到的σ与仪器指标比较,按两类测量的判别条件,认定测量的类别,再分别处理。
-
1 统计测量
若
R仪 ≤ σ (2)
R仪可略,认定是统计测量。按统计测量的规则处理。
1)有异常数据要查找原因,不能轻易剔除;
2)不能除以根号N。即用3σ表达被测量的偏差范围;
3)以测量值的平均值表征被测量的量值;
4)被测统计变量的测量结果是
L = M平±3σ
5)被测统计变量的量值区间是
平-3σ,M平,M平+3σ]
6)包含概率
随机变量测量20次以上,即采样次数N≥20,可认定是正态分布。从高斯正态密度分布图可见,取值大于3σ的偏差值很小。(具体计算见前文《偏差区间的包含概率的计算》)
以上是统计测量理论与操作。
注:当对被测量的关注点是稳定度时(如多普勒测速雷达对信源的要求),可放松条件(1),变为
σ仪 ≤ σ/3 (2.1)
β仪 不严格要求 (2.2)
σ仪、β仪是测量仪器的随机误差和系统误差,σ、β是随机变量的随机变化与系统变化。β按工程要求计算;而β仪可用R仪代替。以高稳晶振为标准测量铯原子频标的0.1秒以下采样时间的短稳,标准的准确度可能低4个量级,而只要短稳高3倍,满足条件(2.1)即可。
-
2 基础测量
2.1 基础测量的条件
若
σ ≤ R仪/3 (3)
则可认为在现有仪器水平的条件下,测量是基础测量。
注:如果出现如下情况
R仪/3 < σ < R仪 (4)
这是混沌测量,不能判断指标表征量的归属。在实际测量中,要选用指标高一些即R仪小一些的测量仪器,使满足条件(2)或在稳定度测量中满足条件(2.1),使成为统计测量。
-
2.2 基础测量的特性
基础测量的被测量(相对仪器而言)是常量或视在常量(N次测量为一场测量,在一场测量中被测量不变)。测得值指标表征量的着眼点是仪器的误差。
测量仪器的原理是一种物理机制,由物理量的真值决定测得值。仪器作用的数学表达是仪器的测得值函数。测得值函数是仪器的测得值对真值的关系。
测得值区间是仪器的测得值函数的简化表达。
M = Z±R (5)
M是测得值,Z是被测量的真值,R是仪器的误差范围。
-
误差范围是误差元(测得值与真值之差)的绝对值的一定概率(99%)意义上最大可能值。
仪器的误差,有随机误差与系统误差。系统误差包括恒值的误差,以及长期稳定度,环境影响。
-
2.3 随机误差的分布
仪器的随机误差,是随机变量,要用统计的方法处理。
高斯正态分布图,是随机变量概率密度分布图。因此,有关分布、概率计算都是随机误差范畴内的事。(测量计量是时域统计,系统误差为恒值,不是正态分布。)
单值的随机误差,是正态分布,平均值的随机误差也是正态分布。
单值的σ,表示测量值单值对测量值期望值的偏离程度,测量值平均值的σ平就是测量值平均值M平对测量值期望值的偏离程度。
在概率密度分布图上,横坐标取测量值的单值M,图形的意义是随机变量单值的取值的概率密度。因为随机变量的平均值M平也是随机变量,因此横坐标取平均值M平,图形的意义就是平均值M平的取值的概率密度。就是说,高斯正态分布,对对单值M、对平均值M平都成立。只是把横坐标换成M平,σ换成σ平,于是就成为以平均值为自变量的高斯概率密度分布图。标准正态分布的中心点是测量值的期望值(可用平均值的平均值来代表,为方便,直称期望值)。
实验的方法,对σ进行统计,要测量M组,每组N个数。每组得到一个σ,这样就有M个平均值M平i,以及相应的M个σi 。M个σi取方和根。就得到σ平。
在贝塞尔公式的推导中,需利用N×M的模式,顺便可以证明:σ平=σ/√N。有了这个理论结果,就方便多了。实际测量,无论是计量还是测量,就没必要进行N×M的复杂测量,而只要重复测量N次就可以了。既知道了σ,也就知道了σ平。
-
2.4 单值随机误差
2.4.1 测量值函数
测量的随机误差元是
εi = Mi- (Z+β)
= Mi - EM (6)
σ = √[(Mi – EM)2/N] (7)
与(7)等价的实验公式是贝塞尔公式
σ = √[(Mi – M平)2/(N-1)] (8)
随机误差的范围是
R随 = 3σ
测量值函数是
M=EM±3σ (9)
测量值区间是
(10)
2.4.2 由单值求期望值
有随机误差的情况下,求测量结果的第一步就是由测量值找期望值。
由测得值函数(9)解得期望值是
EM=M±3σ (11)
期望值的区间是
(12)
以上是单值情况。测量一次,得到一个M。期望值EM=M±3σ的意义是:被测量的期望值的表征量是测量值M。被测量期望值可能小些,但不会小于M-3σ;被测量期望值可能大些,但不会大于M+3σ。
-
2.5 多次测量,取平均值的情况
2.5.1 测得值函数
测量N次,得到N个M,求得测量值的平均值M平,称为测得值。按贝塞尔公式求出σ后,即知:
σ平= σ/√N (13)
在以M平为横坐标的测得值概率密度图上,分散性特征值是σ平。
随机误差的范围是
R随 = 3σ平
测得值函数是
M平=EM±3σ平 (14)
测得值区间是
平,EM,EM+3σ平] (15)
-
2.5.2 由平均值求期望值
测量是由测得值找期望值。
由测得值函数(14)解得测量结果是
EM=M平±3σ平 (16)
期望值的区间是
平-3σ平,M平,M平+3σ平] (17)
以上是测量N次的期望值。
-
期望值与被测量真值间差一个常数。这个常数就是系统误差。以上讨论,可以假设系统误差为零,于是期望值变成真值,更符合通常的理解与习惯。总之,通常书上所称的“取平均值用平均值的σ平”、“取单值用单值的σ”,对基础测量来说是正确的。但在统计测量中不行。统计测量中,被测的统计变量的每个值都是真值,都是客观存在,不能丢。这样,统计测量中,量值的表征量要用M平,而分散性的表征量是σ而不是σ平。只有M平±3σ才能包含全部(99.73%)随机变量。
-
区分两类测量,才能正确表达。不区分,混沌是难免的。
-
2.6 测量结果
在基础测量中,只知道期望值是不行的,还必须知道系统误差,才能求得真值,而测量的任务是得知真值。即得到真值的最佳表征量与误差范围。
单值测量,误差范围是系统误差β与随机误差范围3σ的合成:
R测1 = √ [β2+(3σ)2 ] (18)
多次测量,误差范围是系统误差β与随机误差范围3σ平的合成:
R测N = √ [β2+(3σ平)2 ] (19)
在研制与计量场合,有计量标准,可以测知仪器的测量误差β,可按(18)式计算R测,给出仪器的测量结果为
Z = M平±R测 (20)
研制与计量场合,R测取R测1,在测量场合如果知道仪器系统误差β,可取R测N。通常,测量时只知道仪器的指标值R指标(MPEV),其中包括σ的作用,因此测量者给出的测量结果为
LZ =M平±R指标 (21)
-
3 测量结果的包含概率与包含因子
( 对思考题的回答。要点是:真值函数是测得值函数的反函数;测得值与真值的距离决定包含概率。基础测量的测量结果区间的包含概率,是对真值的包含概率,包含对象是真值一个值;而统计测量的测量结果区间包含的对象是统计变量的全部值。)
系统误差,是恒值,“包含了”,包含概率就是100%. 因此,基础测量的包含概率问题,是随机误差的事。包含因子只能乘在随机误差σ上,而系统误差β是恒值,不可乘以或除以任何因子(仪器指标可整体留余量,那是另一回事)。
由于总误差对系统误差的包含概率是1,随机误差对期望值的包含概率,就是总误差的包含概率。
A 在研制与计量场合,测量值中心是期望值,包含区间是以期望值为中心的对称区间。单测量值以99.73%的包含概率,处于区间中。
B 在测量场合,一次测量的包含区间是以Mi为中心的以3σ为半宽的区间,这就是测量结果。因为Mi与期望值的距离不大于3σ,则该区间以99.73%的概率包含期望值。测量的任务是找到期望值。测量结果区间中已包含。
同样, N次测量的包含区间是以M平i为中心的以3σ平为半宽的区间,这就是测量结果。因为M平i 与期望值的距离不大于3σ平,则该区间以99.73%的概率包含期望值。这就够用了,达到了测量的目的。
-
图1是由测得的Mi而确定包含期望值的区间示意图(原理说明)。
图2是由测得的M平i而确定包含期望值的区间示意图(原理说明)。
图3 是由测得的M平和已知的仪器误差范围而确定包含真值的区间示意图(原理说明)。如果图3中的R是仪器的误差范围指标值R仪(准确度、MPEV),则图3就是直接测量的测量结果的示意图。其中
R=√ [β2+(3σ)2 ]
L真= M平±R
-
-
-- -
-
-
1、谢谢史老师!
2、想问问,这些图,是用什么软件画的? 本帖最后由 史锦顺 于 2018-1-12 09:52 编辑
f8c8 发表于 2018-1-11 19:30
1、谢谢史老师!
2、想问问,这些图,是用什么软件画的?
我退休已20.8年。计算机只能算能用,而软件应用水平很低。我文中所有的图都是利用计算机中的“画图”版,手工画出的。
计算机“画图”功能版中,可以标出X轴像素1000的坐标。(x/y=100%)
按“高斯误差概率密度分布函数”(数学手册上有,网上也可查得),找七个特征点:x=0(最大点);X=1 (取100小格)即1σ点,是图形中直线的中点,即凸凹曲线的转折点;2σ点;3σ点;查表知道与0、1、2、3对应的纵坐标概率密度的值。由于图形对称,同样知道-1、-2、-3各点的纵坐标之值。在各点间,间隔0.1取x点,对应查出Y值(概率密度值),逐点画出。这时,钟形图已大体呈现,再圆滑一下,即可得基本准确的高斯概率密度分布图。这是标准正态分布图(σ=1,EX=0).
-
利用“画图”版的变换功能,取x与Y的比例关系(选σ的不同值),可得高斯无偏正态分布图;再简单平移,即得高斯有偏正态分布图。
-
附言:搞测量计量工作,熟知并理解高斯概率密度分布图,十分重要。
贝塞尔公式与高斯正态分布,是测量计量的两项基本理论。是精确而又完美的。但必须明确,这两大理论的前提是随机变量与随机误差。随机误差是随机变量的一种特定形式。
系统误差是另一回事。贝塞尔公式中,因取差值,系统误差不起作用;而在高斯分布理论中,系统误差是曲线对中心线的偏离。系统误差是常量,不能按“统计方式”处理。基于这个基本点,衍生出《史法测量计量学》的新的误差合成方法。
-
近几十年来,几个美国人,提出的“不确定度体系”,哲学上是基于不可知论,逻辑上混淆对象与手段的关系。在测量计量的具体学术上,最基本的错误是混淆系统误差与随机误差。系统误差与随机误差,是客观事实,是否定不了的。不同性质的事物,要用不同的方法处理。把处理随机误差的方法,用在系统误差上,不确定度体系便处处出错。其中重要的一条是统计方式的问题。系统误差与随机误差的作用机理、测量计量的实际应用,都是时域统计(统计量随时刻而变化);而不确定度体系下所谓的分布,都是“台域统计”(统计量依各台仪器而不同)。台域统计仅适用于用多台仪器同时测量一个量的情况,而测量计量的实际情况是用一台仪器重复测量一个量。因此,不确定度体系的分析计算,都不符合测量计量的实际情况,因而都是错误的。
我最近在想,不确定度体系这种世界性错误的发生,与炮制者、应用者对高斯概率分布、贝塞尔公式这两项基本理论的前提与内容的错误理解,关系极大。因此,我自己写了一系列有关的文章,从各个角度来理解和说明这两项基本理论。也希望网友们加深对这两大基本理论的理解。这是测量计量的根本。也是识破不确定度体系错误的有力武器。
-
史锦顺 发表于 2018-1-12 09:46
我退休已20.8年。计算机只能算能用,而软件应用水平很低。我文中所有的图都是利用计算机中的“画 ...
太感谢了! ..........................非常感谢!
页:
[1]