本帖最后由 史锦顺 于 2019-12-24 12:14 编辑
-
论误差与偏差
-
史锦顺
-
误差与偏差,是测量计量领域常见的两个术语。误差适用于基础测量(被测量为常量),是手段问题;偏差适用于统计测量(被测量是统计变量)是对象问题。
(一)误差
经典测量计量学中,讲的是误差。误差一词基本词义是“认识之差”,可以称为“识差”。“误差”是历史上的翻译名称,与中文意思不太贴切,误差既不是差错也不是错误,是测量中必然存在的认识与客观的差异,主要是认识主体的问题。其中最重要的是人认识量值的工具的性能,是仪器(包括量具,下同)的因素。误差属于手段问题。
“误差”一词,在测量计量界的实际应用中有几种用法。有时是泛指的,有时是专用的。
【甲】说“误差定义为测得值减真值”,这个“误差”是基本的、专用的,是可正可负的、非正即负的。
【乙】说“铷频标的误差比铯频标的误差大”,这里的“误差”,是指“误差范围”(MPEV/准确度/极限误差),是恒正的数。
【丙】“误差理论”一词中的“误差”,是泛指概念,即包括【甲】所指的误差,也包括【乙】所指的误差。
不确定度体系诞生前,上述三种误差概念是清楚的,在不同的场合、不同的语义环境下,区分也并不难。
不确定度体系一出世,首先攻击【甲】误差,说真值不可知,误差不可求。“误差不可求”,没有了“误差”,也就否定了误差理论。
又说,应用的是【乙】所指的误差,不符合【甲】定义。这就是一些人所说的误差理论中的“概念麻烦”。其实这是不确定度体系炮制者对误差理论的诬陷之词。误差概念的二重性,恰恰是逻辑学中概念的一般性、特殊性的体现。
笔者把“误差”区分为“误差元”与“误差范围”,是对计量界习惯用语的一种细化,是把误差一词的多种功能,区分开,各行一职,易于理解,方便应用。
《史法测量计量学》的作法
1误差元定义为测得值减真值。就是【甲】的含义。
2 误差范围定义为误差元的绝对值的一定概率(大于99%)意义上的最大可能值。就是【乙】的含义。
3 误差范围是集合的概念,该集合的元素是误差元。由误差元构成误差范围。
4 基于物理公式求误差元,由误差元而求误差范围,进而推导误差合成公式,进而推导测得值区间公式与测量结果区间公式,表达测量结果;同样程序,推导计量的误差公式与合格性判别公式。从而实现误差理论的公式化。
基于十项法则而实现了理论公式化的《史法测量计量学》,使经典误差理论面貌一新。而“误差元”概念的提出,是误差理论革新的基础。
不确定度体系是个反面的例子。不确定度的架构:A类标准不确定度、B标准不确定度、合成标准不确定度、扩展不确定度,似乎体系完成,实际上缺少最基本的构成单元,没法进行公式推导。“不确定度”是个集合的概念,集合而没有元素,是个空集。不确定度体系打着“反误差理论”的旗号,GUM宣布“不提真值,不提误差”;而实际运作,却用误差理论的MPEV来计算B类标准不确定度。声称不确定度是包含真值的区间的半宽——先说“真值不可知”,后说区间包含真值。“不可知”的真值,怎能知道它在区间中?包括在区间中,而区间又没有无限缩小的门限,那不是精确地知道真值吗?“真值不可知论”无法自圆其说!
误差有随机误差与系统误差之分。对随机误差的分析,十九世纪初,高斯、贝塞尔奠定了坚实的基础。此理论被随后发展起来统计理论所引用;而随着统计理论的广泛应用,人们又常常用统计理论来讲述随机误差,于是便带入一些统计学的术语,“偏差”一词便混入误差理论中。但应知这不是必要的,误差量的随机变化,应称为“随机误差”。应把“偏差”一词主要留给“统计测量”用。(现代为方便,某些情况下,可以实现二者的转换。)
(二)偏差
测量有两类:基础测量(被测量是常量)和统计测量(被测量是统计变量)。
一个巴掌拍不响,测量中有对象与手段两个方面。
基础测量的任务是认识量值的大小。这里隐含着前提条件:被测量是常量。当被测量是常量时,表征量(误差)属于手段。这是误差理论适用的范畴。有些量是变量,但变化速度较慢,在测量的一次采样时间内变化可略(近似为常量),可逐次测量被测量的数值,再考察其变化,也是基础测量。
当被测量是统计变量时,被测量的测量值与采样时间有关。这时为表达统计变量的固有特性,就要选择误差可略的测量仪器,以便精确表达对象的特性。就是表达统计变量的两大特征量:平均值L平和单值的标准偏差σ。
偏差的概念是统计理论的基本概念,也是测量计量学理论中,统计测量的必要的概念。“偏差”是客观存在,是对象的问题。统计测量的前提是测量仪器的误差可略,而统计的对象是被测量的偏差;偏差是对象的性能,岂可取消?
(三)两类测量的区分方法
简单的、低精度的测量,如日常生活中的测量,普通商品的交易测量,可以只测量一次。但精密测量,要进行重复测量。这是基本常识。
-
怎样判断所进行的测量,是基础测量还是统计测量呢?
1 必须知道所用测量仪器的误差范围R仪/指标(准确度),近些年又称最大允许误差(MPEM),最时髦的称呼是扩展不确定度(U)。测量者知道的是测量仪器的指标值R仪/指标。指标值可当实际值用。
2 重复测量N次(N可取20,不得小于10),按贝塞尔公式计算σ
若
σ ≤ R仪/指标 / 3 (1)
为基础测量(被测量的变化可略)。
若
R仪/指标 ≤ σ (2)
为统计测量(测量仪器的误差可略)。
若
R仪/指标 / 3 < σ < R仪/指标 (3)
为两类测量的混合测量。
理由说明
1) 公式(1)可表达为
3σ ≤ R仪/指标
随机变化在误差范围内,可视为仪器的随机误差。认为被测量是常量。表达量3σ(随机误差范围)属于手段(测量仪器)。
2)公式(2)可表达为
R仪/指标 ≤(3σ)/ 3
测量的误差范围,小于被测对象(随机变化范围3σ)的1/3,可以忽略。手段的误差可略,表达量3σ(偏差范围)属于对象(统计变量)。
测量结果表达统计变量的偏差范围,因而是统计测量。
-
精密测量中,进行了多次测量,就可按贝塞尔公式计算σ,而选用测量仪器时又必然知道测量仪器的误差范围值R仪/指标。比较σ与R仪/指标,即可区分两类测量。
基础测量,用平均值的标准误差σ平,即除以根号N.
统计测量,用单值的标准偏差σ,即不能除以根号N.
(四)测量结果表达
基础测量的测量值是Mi,测得值是M平,被测量的真值是Z,误差范围是R,测量结果为
Z = M平 ± R
测量结果的意义:被测量的最佳表征值是M平。被测量的真值可能小些,但不会小于M平 ± R;被测量的真值可能大些,但不会大于M平 + R。
统计测量的测量值,各个是相对真值(测量仪器误差可略),称“真值”已无必要,统称量值。统计测量的表征量是量值的平均值L平、单值的标准偏差σ。99%以上概率的偏差范围是3σ。
统计测量的测量值Mi就是被测量的量值Li,因此,统计测量的结果表达式为
L = L平± 3σ
频率稳定度的测量、稳压电源波动性的测量、温度源的温度随机变化的测量、测量仪器精密度的测量,都是统计测量,都不能除以根号N.
有些源类仪器或计量标准,随机变化不可忽略,性能表征必须包括随机偏差与系统偏差两部分。测量值减量值期望值称随机偏差,量值期望值与标称值LO之差是系统偏差。系统变差范围与随机偏差范围(3σ)均方根合成,得偏差范围R。测量结果为
L = L平 ± R
测量结果的意义是:被测量是一群值。被测量L的最佳表征量测量值的平均值L平,被测量可能小些,但最小值不小于L平 – R;被测量可能大些,但最大值不大于L平 + R。
-
(五)不确定度体系揭底
不确定度体系的炮制者不懂得两类测量的区分。于是出现许多概念与作法上的错误。
不确定度主定义是“分散性”,缺偏离性,只适应统计测量的随机变量测量部分,不适用于“基础测量”(大量的被测量为常数的普通测量);也不适用于有标称值的统计测量。
所谓的“包含区间”,只是模仿误差理论的基础测量的区间,而忽视了统计区间的特殊性(随机偏差范围必须是3σ)。
A类标准不确定度定义为σ除以根号N,不能用于统计测量场合。而现代测量的很大一部分是统计测量(如前边提到的频率源的频率稳定度的测量、仪器精密度的测量等)。
B类标准不确定度,奇怪地抄袭自己说的“误差不可求”的误差范围量MPEV;C类合成不确定,是合成结果,走的是“方差路线”,假设分布、假设不相关,用者无法求证,都是不能证实的空想,且把重复测量数据的“时域统计”,错搞成多台仪器测量一个量的“台域统计”,这种统计方式错位,是根本性的错误。合成不确定度U,因子k乘错了地方。
不确定度体系错误多多,究其根源,有哲学上的,有逻辑上的,有统计方法上的;而对基础测量与统计测量的不能区分,也是一个重要的认识根源。
废弃不确定度体系,是测量计量界发展、创新的第一步!
-
|