文档视界 最新最全的文档下载
当前位置:文档视界 › 粗大-系统-随机误差处理

粗大-系统-随机误差处理

粗大-系统-随机误差处理
粗大-系统-随机误差处理

课程设计用仪器设备名称

此次课程设计用到的仪器设备和软件包括: (1) 个人计算机; (2) Matlab 软件。

课程设计过程

1、课程设计处理原理:

此次课程开展的数据处理包:(1)粗大误差处理;(2)系统误差处理;(3)随机误差处理。他们的原理分别分析如下:

(1)粗大误差处理

对于粗大误差,采用莱以特准则和罗曼诺夫斯基准则。

莱以特准则:求出数据的算数平均值x 和标准差σ,将残差的绝对值i x v 和

3σ进行比较,大于3σ的值都认为是粗大误差。

罗曼诺夫斯基准则:首先剔除该数据中的最大值,然后再按照t 分布检验,

求出该项与剔除后平均值的差,即d x x ?,再与()2,K n a σ?进行比较,如果前者大于等于后者,那么该数据有系统误差。

(2)系统误差处理

对于系统误差,我们采用了残差总和判断法,阿贝-赫梅判别法,标准差比较法,他们的原理如下:

残差总和判断法:对于等精度的系统测量数据12,,...n x x x ,设相对的残差

分别是12,,...n v v v ,若有12n

i i v =>∑,则怀疑测量数据有系统误差

阿贝-赫梅判别法:对于等精度的系统测量数据12,,...n x x x ,设相对的残,

分别是12,,...n v v v ,122311

1

...n

n n i i i u v v v v v v v v

?+==+++=

∑,如果2u >,

则判定该组数据含有系统误差。

标准差比较法:对于等精度的系统测量数据12,,...n x x x ,设相对的残差分

别是12,

,...n v v v ,用不同的公式计算标准差,通过比较可以发现存在的系

统误差。用贝塞尔公式计算,1s

=

,用别捷尔斯公式计算,

1s

=211s s ≥,则怀疑测量中存在系统误差。 (3)随机误差处理

我们考虑了正态分布和t 分布两种情况,通过置信概率和自由度分别在正态分布积分表和t 分布表中找到对应的t 值,再求出极限误差lim x t ?σ=+。 2

课程设计的整体流程图如图(一)所示。在图(一)中,粗大误差分析,系统误差分析,随机误差分析都作为子程序存在。首先我们是将存储在txt 文件中的测量数据导入到matlab 中,然后进行在子程序中用两种方式进行粗大误差分析,并返回剔除异常值以及剔除异常值后的测量数据。接着进行系统误差分析,用了三种方法检测是否具有系统误差,并返回测量结果。之后进行随机误差分析,返回两种分布的极限误差。最后将本次测量结果都写入到txt 文件中。

斯基准则进行分析。首先看莱以特准则,计算测量数据第i项的残差,之后比较残差与三倍标准差的的值大小,如果残差大于三倍标准差就剔除该项,否则进行下一项的比较,比较完成后返回剔除异常值后剩余的数据。另外是罗曼诺夫斯基准则,首先将最大值作为怀疑对象,从测量数据中剔除出来。然后求该值与剔除后数据的平均值之差,与t分布下的标准差进行比较,如果前者大,则进行下一次循环,否则结束循环,并把该次循环中的最大值重新放入测量数据中,最后返回剔除异常值后剩余的数据。

(3)系统误差处理

计算判断方法所需要的数值,然后对各个方法的判断条件进行比较,如果满足就返回有系统误差,否则返回没有系统误差。

如(图四)所示,首先接收已经剔除异常值的数据,然后计算平均值和标准差,进行正态分布和t 分

布的查表,我将正态分布和t 分布的表格数据存储到matlab 的数组中,并将它们封装成独立的

子m 程序,只要输入对应的自由度和置信概率就

可以得到相应的t 值。然后将两个t 值乘上标准

差得到对应的极限误差,并返回两个极限误差。

3、实验规划

如何输入数据:将测量结果以行存储在txt文件中,,在matlab中利用textread函数读取txt数据,并将其存储在一维数组中。

如何使用matlab:首先新建一个主文件并保存,接着建立了5个函数,如下所示: Thick_Error.m 粗大误差处理

Systematic_Error.m 系统误差处理

Random_Error.m 随机误差处理

Normal_distribution.m正态分布t值查找

T_FenBu.m t分布t值查找

如何编写程序:依照误差处理的原理一步一步进行数据分析,将所得结果进行打印在命令行窗口,并将所有数据打印在txt文件中

如何程序运行、调试程序:运行上边三角运行按钮,还可以选中某些行代码右键运行。运行错误时会设置断点,一步一步运行,并看着工作区的显示的数值是否是我想得到的那个值。通常我还在程序中加一些打印字符

串,用于发现错误之处。

4、代码分析

(1)数据输入:

path="C:\Users\dingshuai\Desktop\误差\课程设计\误差处理.txt";

date=textread(path,'%f',15)';

首先将txt文件路径存储在path中,利用textread函数读取存储在txt文件中的15个测量数据,并存储在数组date中

(2)主函数

粗大误差处理

[result_1,rid_value_1,result_2,rid_value_2]=Thick_Error(date);

%莱以特准则:rid_value_1表示剔除值 result_1表示剔除后剩余数据

%罗曼诺夫斯基准则:rid_value_2表示剔除值 result_2表示剔除后剩余数据

disp("莱以特准则剔除数据");disp(rid_value_1);

disp("罗曼诺夫斯基准则");disp(rid_value_2);

判断系统误差

[answer_1,answer_2,answer_3]=Systematic_Error(result_2); %answer 是否具

有系统误差

% answer_1,answer_2,answer_3分别对应残差总和判断法,阿贝-赫梅判别法,标准差

比较法的判断

disp("残差总和判断法是否有系统误差");disp(answer_1);

disp("阿贝-赫梅判别法是否有系统误差");disp(answer_2);

disp("标准差比较法是否有系统误差");disp(answer_3);

随机误差

[limit_error_zt,limit_error_t]=Random_Error(result_2);

%分别表示正态分布和t分布的极限误差

disp("正态分布极限误差")

disp(limit_error_zt);

disp("t分布的极限误差");

disp(limit_error_t);

写入文件

fileID=fopen(path,'w');

fprintf(fileID,'%.2f ',date); fprintf(fileID,'\n');

fprintf(fileID,'算数平均值: %.2f\n',mean(result_2));

fprintf(fileID,'莱以特准则粗大误差剔除数据: %.2f\n',rid_value_1);

fprintf(fileID,'%s',"罗曼诺夫斯基准则粗大误差剔除数据: ");

fprintf(fileID,'%.2f ',rid_value_2); fprintf(fileID,'\n');

fprintf(fileID,'残差总和判断法是否有系统误差是否有系统误差: %s\n',answer_1); fprintf(fileID,'阿贝-赫梅判别法是否有系统误差是否有系统误

差: %s\n',answer_1);

fprintf(fileID,'标准差比较法是否有系统误差是否有系统误差: %s\n',answer_1); fprintf(fileID,'按正态分布结

果: %.2f+-%.2f\n',mean(result_2),limit_error_zt);

fprintf(fileID,'按t分布结果: %.2f+-%.2f',mean(result_2),limit_error_t); fclose(fileID);

利用子函数求出各种数值结果,将结果打印在命令行窗口,并将结果写入txt

文件

(3)莱以特准则

a=1; %用于剔除数据的索引

tem_date=date;

date_avg=mean(tem_date); %求平均值

date_std=std(tem_date); %求标准差

residual=tem_date-date_avg; %求残差

for i=1:length(tem_date) %大于三倍标准差元素进行剔除

if(residual(i)>(3*date_std))

rid_value_1(a)=tem_date(i); %求剔除值

a=a+1; %索引加一,用于存储下次异常值

tem_date(i)=[]; %剔除粗大误差

end

end

result_1=tem_date;

首先定义a值,作为异常值数组的索引,将测量数据存储到tem_date中,然后求其平均值date_avg,标准差date_std,再求其残差residual,然后进行for循环,如果满足莱以特准则的条件,就让该索引对应的值为空,即剔除该数据,最后将剔除异常值的数据存储到result_1中,并返回到主函数。(4)罗曼诺夫斯基准则

b=1; %用于剔除数据的索引

while(1)

tem_date=date; %临时保存date原本数据

[max_value,i]=max(tem_date); %求其最大值及其索引,作为怀疑对象

rid_value_2(b)=max_value; %存储怀疑对象

tem_date(i)=[]; %剔除怀疑对象

avg=mean(date); %求平均值

std_=std(date); %求标准差

if(abs(max_value-avg)<(std_*T_FenBu((length(tem_date)-1),0.05)))

rid_value_2(b)=[]; %如果不满足粗大误差条件就将怀疑对象清除break;

else

b=b+1; %满足粗大误差条件就将怀疑对象增一

date=tem_date;

end

end

result_2=date;

首先定义b值,作为异常值数组的索引,接着进入while循环,其中有break 语句,所以不是死循环。提取其最大值及其索引,将怀疑对象存储在

rid_value_2中,计算平均值和标准差,再进行罗曼诺夫斯基准则的判断条件,如果该值满足,则将异常值索引加1,方便下次异常值存储,如果不满足,将该次怀疑的异常值对象去掉,并退出循环,最后再将测量数据返回主函数

(5)判断系统误差

输入: date 表示要进行系统误差检验的数据

返回值: answer_1,answer_2,answer_3分别对应残差总和判断法,阿贝-赫梅判别法,标准差比较法的判断

残差总和判断法

function [answer_1,answer_2,answer_3]=Systematic_Error(date)

date_avg=mean(date);%求平均值

residual=abs(date-date_avg);%求残差绝对值

sum_residual=sum(residual);%求残差绝对值和

s=sqrt((sum(residual.*residual))/(length(date)));%贝塞尔公式求标准差

if(sum_residual>(2*s*sqrt(length(date))))

answer_1="数据有系统误差";

else

answer_1="数据没有系统误差";

end

阿贝-赫梅判别法

date_1=date(1:length(date)-1);

date_2=date(2:length(date));

u=abs(sum(date_1.*date_2));

if(u>(sqrt(length(date)-1)*std(date)*std(date)))

answer_2="数据有系统误差";

else

answer_2="数据没有系统误差";

end

标准差比较法

s1=std(date);

s2=1.253*sum_residual/sqrt(length(date)*(length(date)-1));

if((s2/s1)<(1+2/sqrt(length(date)-1)))

answer_3="数据没有系统误差";

else

answer_3="数据有系统误差";

end

从主函数中获取已经剔除异常值的数据,利用三种方法进行判断,并且返回三种方法各自分析的结果。

(6)随机误差处理

输入: date 表示要进行系统误差检验的数据

返回值: 正态分布和t分布的极限误差

function [limit_error_zt,limit_error_t]=Random_Error(date)

date_avg=mean(date);%求平均值

residual=abs(date-date_avg);%求残差绝对值

s=sqrt((sum(residual.*residual))/(length(date)));

s_x=s/sqrt(length(date));%求单次重复标准差

正态分布

t_zt=Normal_distribution(0.95/2); % 置信概率为%95,自由度为length(date)-1 limit_error_zt=t_zt*s_x;

t分布

t_t=T_FenBu(length(date)-1,0.05);

limit_error_t=t_t*s_x;

接收剔除异常值后的数据,计算平均值和标准差,再通过

Normal_distribution和T_FenBu函数获取对应的t值,计算两种情况的极限误差,返回主函数中。

两种分布获取t值代码如下:

输入: Fiducial_Probability 测量数据的置信概率

返回值: t 正态分布的t值

正态分布

function t=Normal_distribution(Fiducial_Probability)

a=[0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 1.60 1.65 1.70 1.75 1.80 1.85

1.90 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 1.95

2.00 2.10 2.20 2.30 2.40

2.50 0.80 0.85 0.90 0.95 1.00 1.05 1.10 1.15 2.60 2.70 2.80 2.90

3.5 3.20

3.40 1.20 1.25 1.30 1.35 1.40 1.45 1.50 1.55 3.60 3.80

4.00 4.50

5.00 ]; b=[0.0000 0.0199 0.0398 0.0596 0.0793 0.0987 0.1179 0.1368 0.4452 0.4505 0.4554 0.4599 0.4641 0.4678 0.4713 0.1554 0.1736 0.1915 0.2088 0.2257 0.2422 0.2580 0.2734 0.4744 0.4772 0.4821 0.4861 0.4893 0.4918 0.4938 0.2881 0.3023 0.3159 0.3289 0.3413 0.3531 0.3643 0.3740 0.4953 0.4965 0.4974 0.4981 0.49865 0.49931 0.49966 0.3949 0.3944 0.4032 0.4115 0.4192 0.4265 0.4332 0.4394 0.499841 0.49928 0.49968 0.499997 0.49999997];

[~,i]=min(abs(b-Fiducial_Probability));%i表示最小值在向量中的索引

t=a(i);

输入: dof 代表自由度a 代表1-置信概率

返回值: t t分布的t值

t分布

function t=T_FenBu(dof,a)

v=[1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100];

a1=[12.71 4.30 3.18 2.78 2.57 2.45 2.36 2.31 3.26 .23 2.20 2.18 2.16 2.14 2.13 2.12 2.11 2.10 2.09 2.09 2.08 2.07 2.07 2.06 2.06 2.06 2.05 2.05 2.05 2.04 2.02 2.01 2.00 1.99 1.99 1.99 1.98];

a2=[63.66 9.92 5.84 4.60 4.03 3.71 3.50 3.36 3.25 3.17 3.11 3.05 3.01 2.98 2.95 2.92 2.90 2.88 2.86 2.85 2.83 2.82 2.81 2.80 2.79 2.78 2.77 2.76 2.76 2.75 2.70 2.68 2.66 2.65 2.64 2.63 2.63];

a3=[235.0 19.21 9.21 5.51 4.90 4.53 4.28 4.09 3.96 3.85 3.76 3.69 3.64 3.59 3.54 3.51 3.48 3.45 3.42 3.40 3.38 3.36 3.34 3.33 3.32 3.30 3.29 3.28 3.27 3.20 3.18 3.13 3.11 3.10 3.09 3.08 3.00];

for i=1:length(v)

if(v(i)==dof) %首先判断自由度一样

if(a==0.05) %再判断a一样

t=a1(i);

elseif(a==0.01)

t=a2(i);

elseif(a==0.0027)

t=a3(i);

else

t=0;

end

end

end

(7)正态分布输出结果

按正态分布结果: 20.40+-0.03

(8)t分布输出结果

按t分布结果: 20.40+-0.03

5、实验结果及分析

实验结果如左所示,将测量数据的平均值、

标准差、粗大误差,系统误差以及极限误差显示

在命令行窗口,txt文件如下图所示,如有其它

数据需要,可对写入代码稍作修改将其它数据写

入。

输出的数据均有较多的位数保留,如不需

要,可适当进行取舍。

另外,程序对相关的查表值利用数组进行写

入,可满足大部分情况下的数据处理,进行数据

修改或者置信概率修改仍可得到正确的处理结

果。

课程设计心得

通过这次学习,对MATLAB的使用更加熟练了,虽然以前数学建模的时候用过这个软件,但是很多操作依旧不熟悉,通过在百度上查找,现在我也掌握的了如何从txt文件中读写数据。但是也有很多不足的地方,比如对于正态分布和t 分布的表格的存储我是用数组存储的,感觉这个方法效率不高,但是上网查也没查到很有效的方法。另外,我也用到了visio这个流程图软件,以前从来没有用过,现在对它的使用虽然不熟练,但是也不陌生了。

这次的难点我觉得有两个,一个是在编写程序过程中部分函数不是很了解,再加上对于函数的使用有些在网上的解释的不是很清楚。第二个就是测量误差的方法记得不是很牢,依然需要去重新翻阅课件。

这次课设学到了不少,也发现自己对于知识的理解不够深刻,像是依旧停留在记公式的状态。我需要进一步的加深理解,把这些知识争取能够成为自己内化的东西

附录

说明:代码是以实时函数方式打开进行复制

主函数:Error.m

clear;clc;

path="C:\Users\dingshuai\Desktop\误差\课程设计\误差处理.txt";

date=textread(path,'%f',15)';

粗大误差处理

[result_1,rid_value_1,result_2,rid_value_2]=Thick_Error(date);

%莱以特准则:rid_value_1表示剔除值 result_1表示剔除后剩余数据

%罗曼诺夫斯基准则:rid_value_2表示剔除值 result_2表示剔除后剩余数据

disp("莱以特准则剔除数据");disp(rid_value_1);

disp("罗曼诺夫斯基准则");disp(rid_value_2);

判断系统误差

[answer_1,answer_2,answer_3]=Systematic_Error(result_2); %answer 是否具有系统误差

% answer_1,answer_2,answer_3分别对应残差总和判断法,阿贝-赫梅判别法,标准差

比较法的判断

disp("残差总和判断法是否有系统误差");disp(answer_1);

disp("阿贝-赫梅判别法是否有系统误差");disp(answer_2);

disp("标准差比较法是否有系统误差");disp(answer_3);

随机误差

[limit_error_zt,limit_error_t]=Random_Error(result_2);

%分别表示正态分布和t分布的极限误差

disp("剔除异常值后的平均值");

disp(mean(result_2));

disp("正态分布极限误差")

disp(limit_error_zt);

disp("t分布的极限误差");

disp(limit_error_t);

写入文件

fileID=fopen(path,'w');

fprintf(fileID,'%.2f ',date); fprintf(fileID,'\n');

fprintf(fileID,'算数平均值: %.2f\n',mean(result_2));

fprintf(fileID,'莱以特准则粗大误差剔除数据: %.2f\n',rid_value_1);

fprintf(fileID,'%s',"罗曼诺夫斯基准则粗大误差剔除数据: ");

fprintf(fileID,'%.2f ',rid_value_2); fprintf(fileID,'\n');

fprintf(fileID,'残差总和判断法是否有系统误差是否有系统误差: %s\n',answer_1); fprintf(fileID,'阿贝-赫梅判别法是否有系统误差是否有系统误

差: %s\n',answer_1);

fprintf(fileID,'标准差比较法是否有系统误差是否有系统误差: %s\n',answer_1); fprintf(fileID,'按正态分布结

果: %.2f+-%.2f\n',mean(result_2),limit_error_zt);

fprintf(fileID,'按t分布结果: %.2f+-%.2f',mean(result_2),limit_error_t); fclose(fileID);

粗大误差处理:

输入: date 表示要进行粗大误差检验的数据

返回值:莱以特准则:rid_value_1表示剔除值result_1表示剔除后剩余数据返回值:罗曼诺夫斯基准则:rid_value_2表示剔除值result_2表示剔除后剩余数据

莱以特准则

function [result_1,rid_value_1,result_2,rid_value_2]=Thick_Error(date)

a=1; %用于剔除数据的索引

tem_date=date;

date_avg=mean(tem_date); %求平均值

date_std=std(tem_date); %求标准差

residual=tem_date-date_avg; %求残差

for i=1:length(tem_date) %大于三倍标准差元素进行剔除

if(residual(i)>(3*date_std))

rid_value_1(a)=tem_date(i); %求剔除值

a=a+1; %索引加一,用于存储下次异常值

tem_date(i)=[]; %剔除粗大误差

end

end

result_1=tem_date;

罗曼诺夫斯基准则

b=1; %用于剔除数据的索引

while(1)

tem_date=date; %临时保存date原本数据

[max_value,i]=max(tem_date); %求其最大值及其索引,作为怀疑对象

rid_value_2(b)=max_value; %存储怀疑对象

tem_date(i)=[]; %剔除怀疑对象

avg=mean(date); %求平均值

std_=std(date); %求标准差

if(abs(max_value-avg)<(std_*T_FenBu((length(tem_date)-1),0.05)))

rid_value_2(b)=[]; %如果不满足粗大误差条件就将怀疑对象清除break;

else

b=b+1; %满足粗大误差条件就将怀疑对象增一

date=tem_date;

end

end

result_2=date;

系统误差处理:

输入: date 表示要进行系统误差检验的数据

返回值: answer_1,answer_2,answer_3分别对应残差总和判断法,阿贝-赫梅判别法,标准差比较法的判断

残差总和判断法

function [answer_1,answer_2,answer_3]=Systematic_Error(date)

date_avg=mean(date);%求平均值

residual=abs(date-date_avg);%求残差绝对值

sum_residual=sum(residual);%求残差绝对值和

s=sqrt((sum(residual.*residual))/(length(date)));%贝塞尔公式求标准差

if(sum_residual>(2*s*sqrt(length(date))))

answer_1="数据有系统误差";

else

answer_1="数据没有系统误差";

end

阿贝-赫梅判别法

date_1=date(1:length(date)-1);

date_2=date(2:length(date));

u=abs(sum(date_1.*date_2));

if(u>(sqrt(length(date)-1)*std(date)*std(date)))

answer_2="数据有系统误差";

else

answer_2="数据没有系统误差";

end

标准差比较法

s1=std(date);

s2=1.253*sum_residual/sqrt(length(date)*(length(date)-1));

if((s2/s1)<(1+2/sqrt(length(date)-1)))

answer_3="数据没有系统误差";

else

answer_3="数据有系统误差";

end

随机误差处理:

输入: date 表示要进行系统误差检验的数据

返回值: 正态分布和t分布的极限误差

function [limit_error_zt,limit_error_t]=Random_Error(date)

date_avg=mean(date);%求平均值

residual=abs(date-date_avg);%求残差绝对值

s=sqrt((sum(residual.*residual))/(length(date)));

s_x=s/sqrt(length(date));%求单次重复标准差

正态分布

t_zt=Normal_distribution(0.95/2); % 置信概率为%95,自由度为length(date)-1 limit_error_zt=t_zt*s_x;

t分布

t_t=T_FenBu(length(date)-1,0.05);

limit_error_t=t_t*s_x;

正态分布查表:

输入: Fiducial_Probability 测量数据的置信概率

返回值: t 正态分布的t值

正态分布

function t=Normal_distribution(Fiducial_Probability)

a=[0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 1.60 1.65 1.70 1.75 1.80 1.85

1.90 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 1.95

2.00 2.10 2.20 2.30 2.40

2.50 0.80 0.85 0.90 0.95 1.00 1.05 1.10 1.15 2.60 2.70 2.80 2.90

3.5 3.20

3.40 1.20 1.25 1.30 1.35 1.40 1.45 1.50 1.55 3.60 3.80

4.00 4.50

5.00 ];

b=[0.0000 0.0199 0.0398 0.0596 0.0793 0.0987 0.1179 0.1368 0.4452 0.4505 0.4554 0.4599 0.4641 0.4678 0.4713 0.1554 0.1736 0.1915 0.2088 0.2257 0.2422 0.2580 0.2734 0.4744 0.4772 0.4821 0.4861 0.4893 0.4918 0.4938 0.2881 0.3023 0.3159 0.3289 0.3413 0.3531 0.3643 0.3740 0.4953 0.4965 0.4974 0.4981 0.49865 0.49931 0.49966 0.3949 0.3944 0.4032 0.4115 0.4192 0.4265 0.4332 0.4394 0.499841 0.49928 0.49968 0.499997 0.49999997];

[~,i]=min(abs(b-Fiducial_Probability));%i表示最小值在向量中的索引

t=a(i);

t分布查表:

输入: dof 代表自由度a 代表1-置信概率

返回值: t t分布的t值

t分布

function t=T_FenBu(dof,a)

v=[1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100];

a1=[12.71 4.30 3.18 2.78 2.57 2.45 2.36 2.31 3.26 .23 2.20 2.18 2.16 2.14 2.13 2.12 2.11 2.10 2.09 2.09 2.08 2.07 2.07 2.06 2.06 2.06 2.05 2.05 2.05 2.04 2.02 2.01 2.00 1.99 1.99 1.99 1.98];

a2=[63.66 9.92 5.84 4.60 4.03 3.71 3.50 3.36 3.25 3.17 3.11 3.05 3.01 2.98 2.95 2.92 2.90 2.88 2.86 2.85 2.83 2.82 2.81 2.80 2.79 2.78 2.77 2.76 2.76 2.75 2.70 2.68 2.66 2.65 2.64 2.63 2.63];

a3=[235.0 19.21 9.21 5.51 4.90 4.53 4.28 4.09 3.96 3.85 3.76 3.69 3.64 3.59 3.54 3.51 3.48 3.45 3.42 3.40 3.38 3.36 3.34 3.33 3.32 3.30 3.29 3.28 3.27 3.20 3.18 3.13 3.11 3.10 3.09 3.08 3.00];

for i=1:length(v)

if(v(i)==dof) %首先判断自由度一样

if(a==0.05) %再判断a一样

t=a1(i);

elseif(a==0.01)

t=a2(i);

elseif(a==0.0027)

t=a3(i);

else

t=0;

end

end

end

粗大误差处理方法

粗大误差处理方法 在一组条件完全相同的重复试验中,个别的测量值可能会出现异常。如测量值过大或过小,这些过大或过小的测量数据是不正常的,或称为可疑的。对于这些可疑数据应该用数理统计的方法判别其真伪,并决定取舍。常用的方法有拉依达法、肖维纳特(Chavenet)法。格拉布斯(Grubbs)法等。 一、拉依达法 当试验次数较多时,可简单地用3倍标准偏差(3S)作为确定可疑数据取舍的标准。当某一测量数据(xi)与其测量结果的算术平均值(x-‘)之差大于3倍标准偏差时,用公式表示为: ︳xi -x-‘︳>3S 则该测量数据应舍弃。 这是美国混凝土标准中所采用的方法,由于该方法是以3倍标准偏差作为判别标准,所以亦称3倍标准偏差法,简称3S法。 取3S的理由是:根据随机变量的正态分布规律,在多次试验中,测量值落在x-‘一3S与x-‘十3S之间的概率为99.73%,出现在此范围之外的概率仅为0.27%,也就是在近400次试验中才能遇到一次,这种事件为小概率事件,出现的可能性很小,几乎是不可能。因而在实际试验中,一旦出现,就认为该测量数据是不可靠的,应将其舍弃。 另外,当测量值与平均值之差大于2倍标准偏差(即︳xi -x-‘︳>2S)时,则该测量值应保留,但需存疑。如发现生产(施工)、试验过程屯有可疑的变异时,该测量值则应予舍弃。 拉依达法简单方便,不需查表,但要求较宽,当试验检测次数较多或要求不高时可以应用,当试验检测次数较少时(如n<10)在一组测量值中即使混有异常值,也无法舍弃。 二、肖维纳特法 进行n次试验,其测量值服从正态分布,以概率1/(2n)设定一判别范围(一knS,knS),当偏差(测量值xi与其算术平均值x-‘之差)超出该范围时,就意味着该测量值xi 是可疑的,应予舍弃。判别范围由下式确定: 肖维纳特法可疑数据舍弃的标准为: ︳xi一x-‘︳/S≥kn

谈谈系统误差的产生原因及其消除或减少的方法

谈谈系统误差的产生原因及其消除或减少的方法 在讨论随机误差时,总是有意忽略系统误差,认为它等于零。若系统误差不存在,期望值就是真值。但是,在实际工作中系统误差是不能忽略的。所以要研究系统误差,发现和消除系统误差。 一、系统误差产生的原因 在长期的测量实践中人们发现,系统误差的产生一般的与测量仪器或装置本身的准确程度有关;与测量者本身的状况及测量时的外界条件有关。 1、在检定或测试中,标准仪器或设备的本身存在一定的误差。在进行计量检定,向下一级标准量值传递时,标准值的误差是固定不变的,属于系统误差。又称为工具误差或仪器误差。如:标称值为100g的砝码,经检定实际值为99.997g,即误差为+0.003g。用此砝码去秤量其他物体的质量,按标称值使用,则始终把被测量秤大,产生+0.003g的恒定系统误差。 某些仪器或设备,在测量前须先进行调零位,若因测量前未调零位或存在调零偏差,使得标准仪器在测量前即具有某一初始值,该初始值必然直接影响测量结果,给测量结果带来误差。这种误差,一般称零位误差,或简称零差。 某些仪器或设备,如未按要求放置,特别是某些电磁测量和无线电测量仪器或设备,未正确接地或屏蔽,或未用专用连接导线,也会给测量结果带来误差。这种误差称为装置误差。 2、测量时的客观环境条件(如温度、湿度、恒定磁场等),也会给测量结果带来误差。如,重力加速度因地点不同而异,若与重力加速度有关的某些测量,未按测量地点的不同加以适当的修正,也会给测量结果带来误差。因这种误差是由客观环境因素引起的,一般把它称为环境误差。 3、由于某些测量方法的不完善,特别是检定与测试中所使用的某些仪器或设备,在设计制造时受某些条件的限制(如元器件,制造工艺等),不得不降低某些指标,采用一些近似公式,这也会给测量结果带来误差。这种误差称方法误差或称理论误差。 4、在测量中,测量者本身生理上的某些缺陷,如听觉、视力等缺陷,也会给测量结果带来误差。此项误差又称为人员误差。 二、消除或减少系统误差的方法 mad消除或减少系统误差有两个基本方法。一是事先研究系统误差的性质和大小,以修正量的方式,从测量结果中予以修正;二是根据系统误差的性质,在测量时选择适当的测量方法,使系统误差相互抵消而不带入测量结果。

实验数据误差分析和数据处理

第二章 实验数据误差分析和数据处理 第一节 实验数据的误差分析 由于实验方法和实验设备的不完善,周围环境的影响,以及人的观察力,测量程序等限制,实验观测值和真值之间,总是存在一定的差异。人们常用绝对误差、相对误差或有效数字来说明一个近似值的准确程度。为了评定实验数据的精确性或误差,认清误差的来源及其影响,需要对实验的误差进行分析和讨论。由此可以判定哪些因素是影响实验精确度的主要方面,从而在以后实验中,进一步改进实验方案,缩小实验观测值和真值之间的差值,提高实验的精确性。 一、误差的基本概念 测量是人类认识事物本质所不可缺少的手段。通过测量和实验能使人们对事物获得定量的概念和发现事物的规律性。科学上很多新的发现和突破都是以实验测量为基础的。测量就是用实验的方法,将被测物理量与所选用作为标准的同类量进行比较,从而确定它的大小。 1.真值与平均值 真值是待测物理量客观存在的确定值,也称理论值或定义值。通常真值是无法测得的。若在实验中,测量的次数无限多时,根据误差的分布定律,正负误差的出现几率相等。再经过细致地消除系统误差,将测量值加以平均,可以获得非常接近于真值的数值。但是实际上实验测量的次数总是有限的。用有限测量值求得的平均值只能是近似真值,常用的平均值有下列几种: (1) 算术平均值 算术平均值是最常见的一种平均值。 设1x 、2x 、……、n x 为各次测量值,n 代表测量次数,则算术平均值为 n x n x x x x n i i n ∑==+???++=121 (2-1) (2) 几何平均值 几何平均值是将一组n 个测量值连乘并开n 次方求得的平均值。即 n n x x x x ????=21几 (2-2) (3)均方根平均值 n x n x x x x n i i n ∑==+???++= 1 222221均 (2-3) (4) 对数平均值 在化学反应、热量和质量传递中,其分布曲线多具有对数的特性,在这种情况下表征平均值常用对数平均值。 设两个量1x 、2x ,其对数平均值

实验大数据误差分析报告与大数据处理

第一章实验数据误差分析与数据处理 第一节实验数据误差分析 一、概述 由于实验方法和实验设备的不完善,周围环境的影响,以及人的观察力,测量程序等限制,实验测量值和真值之间,总是存在一定的差异,在数值上即表现为误差。为了提高实验的精度,缩小实验观测值和真值之间的差值,需要对实验数据误差进行分析和讨论。 实验数据误差分析并不是即成事实的消极措施,而是给研究人员提供参与科学实验的积极武器,通过误差分析,可以认清误差的来源及影响,使我们有可能预先确定导致实验总误差的最大组成因素,并设法排除数据中所包含的无效成分,进一步改进实验方案。实验误差分析也提醒我们注意主要误差来源,精心操作,使研究的准确度得以提高。 二、实验误差的来源 实验误差从总体上讲有实验装置(包括标准器具、仪器仪表等)、实验方法、实验环境、实验人员和被测量五个来源。 1.实验装置误差 测量装置是标准器具、仪器仪表和辅助设备的总体。实验装置误差是指由测量装置产生的测量误差。它来源于: (1)标准器具误差 标准器具是指用以复现量值的计量器具。由于加工的限制,标准器复现的量值单位是有误差的。例如,标准刻线米尺的0刻线和1 000 mm刻线之间的实际长度与1 000 mm单位是有差异的。又如,标称值为 1kg的砝码的实际质量(真值)并不等于1kg等等。 (2)仪器仪表误差 凡是用于被测量和复现计量单位的标准量进行比较的设备,称为仪器或仪表.它们将被测量转换成可直接观察的指示值。例如,温度计、电流表、压力表、干涉仪、天平,等等。 由于仪器仪表在加工、装配和调试中,不可避免地存在误差,以致仪器仪表的指示值不等于被测量的真值,造成测量误差。例如,天平的两臂不可能加工、调整到绝对相等,称量时,按天平工作原理,天平平衡被认为两边的质量相等。但是,由于天平的不等臂,虽然天平达到平衡,但两边的质量并不等,即造成测量误差。 (3)附件误差 为测量创造必要条件或使测量方便地进行而采用的各种辅助设备或附件,均属测量附件。如电测量中的转换开关及移动测点、电源、热源和连接导线等均为测量附件,且均产生测量误差。又如,热工计量用的水槽,作为温度测量附件,提供测量水银温度计所需要的温场,由于水槽内各处温度的不均匀,便引起测量误差,等等。 按装置误差具体形成原因,可分为结构性的装置误差、调整性的装置误差和变化性的装置误差。结构性的装置误差如:天平的不等臂,线纹尺刻线不均匀,量块工作面的不平行性,光学零件的光学性能缺陷,等等。这些误差大部分是由于制造工艺不完善和长期使用磨损引起的。调整性的装置误差如投影仪物镜放大倍数调整不准确,水平仪的零位调整不准确,千分尺的零位调整不准确,等等。这些误差是由于仪器仪表在使用时,未调整到理想状态引起的。变化性的装置误差如:激光波长的长期不稳定性,电阻等元器件的老化,晶体振荡器频率的长期漂移,等等。这些误差是由于仪器仪表随时间的不稳定性和随空间位置变化的不均匀性造成的。 2.环境误差 环境误差系指测量中由于各种环境因素造成的测量误差。 被测量在不同的环境中测量,其结果是不同的。这一客观事实说明,环境对测量是有影响的,是测量的误差来源之一。环境造成测量误差的主要原因是测量装置包括标准器具、仪器仪表、测量附件同被测对象随着环境的变化而变化着。 测量环境除了偏离标准环境产生测量误差以外,从而引起测量环境微观变化的测量误差。 3.方法误差

矢量网络分析仪的误差分析和处理

矢量网络分析仪的误差分析和处理 一、矢量网络分析仪的误差来源 矢量网络分析仪的测量的误差主要有漂移误差、随机误差、系统误差这三大种类。 1、漂移误差 漂移误差是由于进行校准之后仪器或测试系统性能发生变化所引起,主要由测试装置内部互连电缆的热膨胀特性以及微波变频器的变换稳定性引起,且可以通过重新校准来消除。校准维持精确的时间范围取决于在测试环境下测试系统所经受到的漂移速率。通常,提供稳定的环境温度便能将漂移减至最小。 2、随机误差 随机误差是不可预测的且不能通过误差予以消除,然而,有若干可以将其对测量精度的影响减至最小的方法,以下是随机误差的三个主要来源: (1)仪器噪声误差 噪声是分析仪元件中产生的不希望的电扰动。这些扰动包括:接收机的宽带本底噪声引起的低电平噪声;测试装置内部本振源的本底噪声和相位噪声引起的高电平噪声或迹线数据抖动。 可以通过采取以下一种或多种措施来减小噪声误差:提高馈至被测装置的源功率;减小中频带宽;应用多次测量扫描平均。

(2)开关重复性误差 分析仪中使用了用来转换源衰减器设置的机械射频开关。有时,机械射频开关动作时,触点的闭合不同于其上次动作的闭合。在分析仪内部出现这种情况时,便会严重影响测量的精度。 在关键性测量期间,避免转换衰减器设置,可以减小开关重复性误差的影响。 (3)连接器重复性误差 连接器的磨损会改变电性能。可以通过实施良好的连接器维护方法来减小连接器的重复性误差。 3、系统误差 系统误差是由分析仪和测试装置中的不完善性所引起。系统误差是重复误差(因而可预测),且假定不随时间变化,可以在校准过程中加以确定,且可以在测量期间用数学方法减小。系统误差决不能完全消除,由于校准过程的局限性而总是存在某些残余误差,残余(测量校准后的)系统误差来自下列因素:校准标准的不完善性、连接器界面、互连电缆、仪表。 反射测量产生下列三项系统误差:方向性、源匹配、频率响应反射跟踪。 传输测量产生下列三项系统误差:隔离、负载匹配、频率响应传输跟踪。 下面分别介绍这六项系统误差,其中提到的通道A为反射接收机,通道B为传输接收机,通道R为参考接收机。 (1)方向性误差 所有网络分析仪都利用定向耦合器或电桥来进行反射测量。对理想的耦合器,只有来自被测件(DUT)的反射信号出现在通道A上。实际上,有少量入射信号经耦合器的正向路径泄漏并进入通道A(如

系统误差和偶然误差的区别

偶然错误也称为随机错误,与系统错误不同,如下所示: 1,原因不同 1.随机误差:它是由各种不稳定的随机因素引起的,例如室温,相对湿度和气压。 2.系统误差:样本与研究任务不符;他们不了解人口分布的性质,并选择可能扭曲人口分布的抽样程序;有意识地选择最方便,最有利的人口要素来解决问题,但是这些要素并不代表人口(例如,仅抽样先进企业)。 2,不同的表达方式 1.随机误差:是由于在确定较小的随机波动和形成相互补偿误差的过程中的一系列相关因素。 2.系统误差:指一种非随机误差。例如,违反随机原则的偏差误差,采样中的记录记录引起的误差等。 3,不同的特点 1.随机误差:其绝对值和符号是不可预测的。 2.系统错误:可重复性,单向性,可测试性。 主要区别在于性质,原因和特征不同 1,性质不同 1.意外错误 偶然误差一般是指随机误差,是由于在确定过程中一系列相关因素的随机小波动,具有相互补偿的关系。 2.系统错误

系统误差是一种非随机误差。在重复性条件下,测量结果的平均值与测量结果的真实值之间的差是无限的。 2,原因不同 1.意外错误 原因是分析过程中各种不稳定的随机因素的影响,例如室温,相对湿度和气压等环境条件的不稳定性,分析人员操作的细微差异以及仪器的不稳定性。 2.系统错误 主要原因如下: (1)样本不符合研究任务。 (2)在不了解人口分布本质的情况下,我们选择了可能会使人口分布失真的抽样程序。 (3)有意识地选择解决问题的最方便,最有利的要素,但这些要素并不代表人口(例如,仅抽样先进企业)。 3,不同的特点 1.意外错误 大小和方向不固定。 2.系统错误 重复性,单向性和可测试性。

数据处理与误差分析报告

物理实验课的基本程序 物理实验的每一个课题的完成,一般分为预习、课堂操作和完成实验报告三个阶段。 §1 实验前的预习 为了在规定时间内,高质量地完成实验任务,学生一定要作好实验前的预习。 实验课前认真阅读教材,在弄清本次实验的原理、仪器性能及测试方法和步骤的基础上,在实验报告纸上写出实验预习报告。预习报告包括下列栏目: 实验名称 写出本次实验的名称。 实验目的 应简单明确地写明本次实验的目的要求。 实验原理 扼要地叙述实验原理,写出主要公式及符号的意义,画上主要的示意图、电路图或光路图。若讲义与实际所用不符,应以实际采用的原理图为准。 实验内容 简明扼要地写出实验内容、操作步骤。为了使测量数据清晰明了,防止遗漏,应根据实验的要求,用一张A4白纸预先设计好数据表格,便于测量时直接填入测量的原始数据。注意要正确地表示出有效数字和单位。 §2 课堂操作 进入实验室,首先要了解实验规则及注意事项,其次就是熟悉仪器和安装调整仪器(例如,千分 尺调零、天平调水平和平衡、光路调同轴等高等)。 准备就绪后开始测量。测量的原始数据(一定不要加工、修改)应忠实地、整齐地记录在预 先设计好的实验数据表格里,数据的有效位数应由仪器的精度或分度值加以确定。数据之间要留有间隙,以便补充。发现是错误的数据用铅笔划掉,不要毁掉,因为常常在核对以后发现它并没有错,不要忘记记录有关的实验环境条件(如环境温度、湿度等),仪器的精度,规格及测量量的单位。实验原始数据的优劣,决定着实验的成败,读数时务必要认真仔细。运算的错误可以修改,原始数据则不能擅自改动。全部数据必须经老师检查、签名,否则本次实验无效。两人同作一个实验时,要既分工又协作,以便共同完成实验。实验完毕后,应切断电源,整理好仪器,并将桌面收拾整洁方能离开实验室。 §3 实验报告 实验报告是实验工作的总结。要用简明的形式将实验报告完整而又准确地表达出来。实验报告 要求文字通顺,字迹端正,图表规矩,结果正确,讨论认真。应养成实验完后尽早写出实验报告的习惯,因为这样做可以收到事半功倍的效果。 完整的实验报告应包括下述几部分内容: 数据表格 在实验报告纸上设计好合理的表格,将原始数据整理后填入表格之中(有老师签 名的原始数据记录纸要附在本次报告一起交)。 数据处理 根据测量数据,可采用列表和作图法(用坐标纸),对所得的数据进行分析。按照 实验要求计算待测的量值、绝对误差及相对误差。书写在报告上的计算过程应是:公式→代入数据→结果,中间计算可以不写,绝对不能写成:公式→结果,或只写结果。而对误差的计算应是:先列出各单项误差,按如下步骤书写,公式→代入数据→用百分数书写的结果。 结果表达 按下面格式写出最后结果: )N ()(N )N (总绝对误差测量结果待测量?±=.. %100(??=N N )Er 相对误差

对粗大误差和随机误差处理

用matlab 对一组随机数据的随机误差的处理 当今社会,人们对测量和仪器的精确性要求越来越高,传统的测量精确度远远不能满足当今科技以及人们生活方面的要求,所以需要一种能够快速分析误差的方法出现。matlab 可以大大减少人工运算的成本,成本低,可行性高,而且具有普遍性,故采用matlab 来进行误差处理。 等精度测量粗大误差处理 粗大误差的判别准则 (1)莱以特准则(3σ准则) 具体方法:求出平均值和σ,将残差的绝对值与3σ进行比较,大于3σ的测量值都是坏值。这种方法称为 3σ法则(正态分布)。 适合测量点数较大的情况,计算所有的点。逐一剔除异常值 (2)罗曼诺夫斯基准则 具体方法:首先剔除一个可疑的测得值,然后按照t 分布检验被剔除的测量值是否含有粗大误差。如果是,剔除后,再判断其它的测试结果点。 适合条件:测量次数较少的情况,是逐一剔除的。 等精度测量随机误差处理 (1) 算数平均值 1 1==∑n i n i x x 大多数情况下,真值未知,用=-i i v x x 来代替误差: σ==σ=s δ=-i i x x n :测量次数 (2)测量列算数平均值标准差 /σσ=x (3)算数平均值的极限误差: ,δδσ= =t t lim δσ=±x t t 为置信系数,通过查表可得。 |()d x x |K n -2,a σ -≥1,1=-1n i i i d x x n =≠∑

结果表示: lim δ=±X x t x (4 (5 软件流程设计 等精度测量计算流程 开始 读取数据文件

matlab程序 clc; clear; data=load('test.txt'); % v_2=0; %定义残差的平方 average_data=0; %定义数据的平均值 average_data=mean(data);%计算平均值 if(length(data)<10) %判断数据的长度,用罗曼诺夫斯基准则剔除粗大误差 while(1) for i=1:length(data) %计算残差和残差的平方和 v(i)=data(i)-average_data; v_2=v_2+v(i)^2; end [max_v,I]=max(abs(v));` sum=0; for i=1:length(data)

误差分析和数据处理

误差分析和数据处理

误差和分析数据处理 1 数据的准确度和精度 在任何一项分析工作中,我们都可以看到用同一个分析方法,测定同一个样品,虽然经过多 少次测定,但是测定结果总不会是完全一样。这 说明在测定中有误差。为此我们必须了解误差产 生的原因及其表示方法,尽可能将误差减到最 小,以提高分析结果的准确度。 1.1 真实值、平均值与中位数 (一)真实值 真值是指某物理量客观存在的确定值。通常一个物理量的真值是不知道的,是我们努力要求 测到的。严格来讲,由于测量仪器,测定方法、 环境、人的观察力、测量的程序等,都不可能是 完善无缺的,故真值是无法测得的,是一个理想 值。科学实验中真值的定义是:设在测量中观察 的次数为无限多,则根据误差分布定律正负误差 出现的机率相等,故将各观察值相加,加以平均, 在无系统误差情况下,可能获得极近于真值的数 值。故“真值”在现实中是指观察次数无限多时, 所求得的平均值(或是写入文献手册中所谓的 “公认值”)。

(二)平均值 然而对我们工程实验而言,观察的次数都是 有限的,故用有限观察次数求出的平均值,只能 是近似真值,或称为最佳值。一般我们称这一最 佳值为平均值。常用的平均值有下列几种: (1)算术平均值 这种平均值最常用。凡测量值的分布服从正 态分布时,用最小二乘法原理可以证明:在一组 等精度的测量中,算术平均值为最佳值或最可信 赖值。 n x n x x x x n i i n ∑=++==121 式中: n x x x 21、——各次观测值;n ――观察 的次数。 (2)均方根平均值 n x n x x x x n i i n ∑=++==12 22221 均 (3)加权平均值 设对同一物理量用不同方法去测定,或对同 一物理量由不同人去测定,计算平均值时,常对 比较可靠的数值予以加重平均,称为加权平均。

误差分析与数据处理

误差理论与数据处理 一.绪论 当你能对世界进行测量的时候,就可以把世界变成数据来了解。 1.研究误差的意义 分析误差产生原因,从而消除误差; 正确处理所得数据,从而接近真值; 选择合理的方法,设计合理的系统。 2.误差的基本概念 误差=测量值—真值 约定真值:对于给定用途具有适当不确定度的、赋予特定量的值。 绝对误差=|测量值—真值| 相对误差=绝对误差/|真值|=绝对误差/|测量值| 修正值:与误差大小近似相等,但方向相反。修正值本身还有误差。 引用误差=示值误差/测量范围上限 3.误差来源 测量装置误差:标准量具的误差、一起误差、附件误差 环境误差:温度、湿度、气压、振动、照明、加速度、电磁场等。 方法误差 人员误差 4.误差分类 系统误差:在相同条件下,多次测量同一量值时,该误差的绝对值和符号保持不变,或者在条件改变时,按某一确定规律变化的误差。(均值和真值之差)系统误差分类:已定系统误差、未定系统误差、不变系统误差、变化系统误差(线性、周期性、复杂规律) 随机误差:大小、方向均随机不定,不可预见,不可修正。(抑制、统计分布规律) 粗大误差:明显超出统计规律预期值的误差。(异常因素或疏忽) 5.精度 准确度:系统误差的大小(偏移程度)

精密度:随机误差的大小(分散程度) 精确度:测量结果与被测量真值之间的一致程度 精确度(精度)在数值上一般多用相对误差来表示,但不用百分数。如某一测量结果的相对误差为0.001%,则其精度为10-5。 重复性:指在相同条件下在短时间内对同一个量进行多次测量所得测量结果之间的一致程度,一般用测量结果的分散性来定量表示。 复现性:指在变化条件下,对同一个量进行多次测量所得测量结果之间的一致程度,一般用测量结果的分散性来定量表示。 稳定性:测量仪器保持其计量特性随时间恒定的能力。 示值误差:指测量仪器的示值与对应输入量的真值之差。由于真值不能确定,故在实际应用中常采用约定真值。 偏移:指系统误差 最大允许误差:给定的测量仪器,规范、规程等所允许的误差极限值。有时也称为允许误差限。 不确定度:与测量结果相关联的、用于合理表征被测量值分散性大小的参数。 6.有效数字 最末一位数字是不可靠的,而倒数第二位数字是可靠的。在进行重要的测量时,测量结果和测量误差可再多取一位数字作为参考。 二.误差基本性质与处理 1.随机误差产生原因 测量装置、环境因素、人为因素。 随机误差整体具有统计学规律,多数随机误差服从正态分布。(单峰、对称、有界、均值趋于零) 2.算术平均值 由于实际上都是有限次测量,因此,我们只能把算术平均值近似地作为被测量的真值。 一般情况下,被测量的真值为未知,这时可用算术平均值代替被测量的真值进行计算。此时的随机误差称为残余误差,简称残差 残余误差代数和为零这一性质,可用来校核算术平均值及其残余误差计算的

系统误差和偶然误差的区别

系统误差: 系统误差,是指一种非随机性误差。如违反随机原则的偏向性误差,在抽样中由登记记录造成的误差等。它使总体特征值在样本中变得过高或过低。产生原因主要有:(1)所抽取的样本不符合研究任务;(2)不了解总体分布的性质选择了可能曲解总体分布的抽样程序;(3)有意识地选择最方便的和解决问题最有利的总体元素,但这些元素并不代表总体(例如只对先进企业进行抽样)。这类误差只要事先作好充分准备,是可以避免的。 定义: 系统误差(Systematic error) 在重复性条件下,对同一被测量进行无限多次测量所得结果的平均值与被测量的真值之差。 系统误差是与分析过程中某些固定的原因引起的一类误差,它具有重复性、单向性、可测性。即在相同的条件下,重复测定时会重复出现,使测定结果系统偏高或系统偏低,其数值大小也有一定的规律。例如,测定的结果虽然精密度不错,但由于系统误差的存在,导致测定数据的平均值显著偏离其真值。如果能找出产生误差的原因,并设法测定出其大小,那么系统误差可以通过校正的方法予以减少或者消除,系统误差是定量分析中误差主要来源。 在对同一被测量进行多次测量过程中,出现某种保持恒定或按确定的方法变化的误差,就是系统误差。 原理:

相同待测量大量重复测量的平均结果和待测量真值的差。一般而言,由于测量步骤的不尽完善会引起测量结果的误差,其中有的来自系统误差,有的来自随机误差。随机误差被假设来自无法预测的影响量或影响的随机的时间和空间变异。一些系统误差可以消除,通常可以降低,如果系统来自影响量对测量结果的可辨识效应。 系统误差有下列情况:误读、误算、视差、刻度误差、磨损误差、接触力误差、挠曲误差、余弦误差、阿贝误差、热变形误差等。 系统误差的特点是测量结果向一个方向偏离,其数值按一定规律变化,具有重复性、单向性。我们应根据具体的实验条件,系统误差的特点,找出产生系统误差的主要原因,采取适当措施降低它的影响。

偶然误差的处理(精)

§1.2偶然误差的处理 在这一节里,我们假定在没有系统误差存在的情况下,来讨论偶然误差问题。 一、测量结果的最佳值——多次测量的平均值 对某一物理量进行测量时,最好进行多次重复测量。根据多次重复测量的结果,可能获得一个最接近真值的最佳值。 在相同条件下,对某物理量x进行了n次重复测量,其测量值分别 当测量次数无限增多时,根据偶然误差的性质可以证明:该平均值 作为测量的结果。 二、算术平均绝对误差 真值无法得到,误差也就无法估算。由于平均值是最佳值,可以把它作为近真值来估算误差。一般定义测量值与平均值之差为“偏差”或“离差”,它们与误差是有区别的。然而当测量次数很多时,“偏差”会接近误差。在以下讨论中,不去严格区分“偏差”和误差,把它们统称为误差。

取 量结果表达式可写为 三、标准误差——方均根误差a 在现代实验测量中,通常用标准误差来衡量一组测量值的精密度,标准误差就是均方根误差。物理量x的标准误差用σx表示,它的定义是:当测量次数无限多时,有 测量次数不可能无限多,根据误差理论,当测量次数有限时,(1-4)式应改写成: (1-5)式是n次重复测量中单次测量的标准误差,n次测量结果平均

当偶然误差用标准误差来表示时,测量结果应写为 四、相对误差 我们把测量结果及其偶然误差写为x±Δx的形式,其中x是测量值,它可以是一次测量值,也可以是多次测量的平均值;Δx是绝对误差,它可以是一次测量中绝对误差的绝对值,也可以是平均绝对误差或标准误差。在对同一对象采用不同精度的仪器或测量方法来测量时,Δx能够表示出测量的不同精确度。但对不同对象进行测量时,却反映不出不同的精确度。例如,用米尺测量两物体的长度,测量结果为: x1=100.00±0.05cm,x2=10.00±0.05cm,两者的绝对误差相同,均为0.05cm,但误差点测量值的比例不同,前者的精确度高于后者。因此,引入相对误差,它可以评价上述两测量结果精确度的差别。相对误差通常用百分比表示,所以又称为百分比误差。相对误差E定义为 (1-8)式中的x通常取平均值,也可以用公认值或理论值代替。 例对某电压测量的数据处理(见表1-1)。 表1-1电压的测量

粗大误差处理

. 莱以特准则 load a.txt while(1) i=1:length(a); n=length(a); v(i)=a(i)-mean(a); bzc=sqrt(sum(v(i).^2)/(length(a)-1)); d=3*bzc; [maxv,I]=max(abs(v(i))); if maxv>d fprintf('cdw is %f\n',a(I)); a(I)=[]; else break; end end cdw is 29.520000 cdw is 28.400000 罗曼诺夫斯基准则 load a.txt n=input('please input n:\n'); xzd=input('please input xzd:\n'); switch xzd case xzd==0.05 x=1; otherwise x=2; end b=a(n); a(n)=[]; while(1) c=mean(a); i=1:length(a); n=length(a); v(i)=a(i)-mean(a); bzc=sqrt(sum(v(i).^2)/(length(a)-1)); k=[4.97 3.56 3.04 2.78 2.62 2.51 2.43 2.37 2.33 2.29 2.26 2.24 2.22 2.20 2.18 2.17 2.16 2.15 2.14 2.13 2.12 2.11 2.10 2.10 2.09 2.09 2.08;11.46 6.53 5.04 4.36 3.96 3.71 3.54 3.41 3.31 3.23 3.17 3.12 3.08 3.04 3.01 3.00 2.95 2.93 2.91 2.90 2.88 2.86 2.85 2.84 2.83 2.82 2.81]; g=k(x,n-2); f=g*bzc; e=abs(b-c); if e>f fprintf('cdw is %f\n',b); else fprintf('wcdw\n'); end break; end please input n: 4 please input xzd: 0.05 cdw is 29.520000

系统误差和随机误差

系统误差和随机误差 测量误差包括系统误差和随机误差两类不同性质的误差 系统误差 是指“在重复性条件下,对同一被测量进行无限次测量所得结果的平均值与被测量真值之差”。它是在重复测量中保持恒定不变或可按预见方式变化的测量误差的分量。由于只能进行有限次数的重复测量,真值也只能是用约定真值代替,因此可能确定的系统误差也只是估计值。系统误差的来源可以是已知或未知的,那么怎样发现系统误差呢? 1、在规定的测量条件下多次测量同一个被测对量,从所得测量结果与计量标准所复现的量值之差可以发现并得到恒定的系统误差的估计值 2、在测量条件改变时,例如随时间、温度等街道条件改变时按某一确定的规律变化,可能是线性的或非线性地增长可减小,就可以发现测量结果中存在的可变的系统误差。通常消除或减小系统误差的方法有以下几种: (1)采用修正的方法:对系统误差的已知部分,用对测量结果进行修正的方法来减小系统误差。修正系统误差的方法包括在测量结果上加修正值;对测量结果乘修正因子;画修正曲线;以及制定修正值表等。例如:测量结果为20℃,用计量标准测量的结果是℃,则已知系统误差的估计值为℃,也就是说修正值是+℃,已修正测量结果等于未修正测量结果加修正值。即已修正测量结果为20℃+℃=℃。 (2)在实验过程中尽可能减少或消除一切产生系统误差的因素。例如在使用仪器时,应该对中的未能对中,应该调整到水平、垂直或平行理想状态的未能调好等等,都会带来系统误差,操作者要仔细调整,以便减小误差等。 (3)选择适当的测量方法,使系统误差抵消而不致带入测量结果中。例如:对恒定系统误差消除法,可采用异号法,即改变测量中的某些条件,例如测量方向、电压极性等,使两种

随机误差与系统误差

二、随机误差和系统误差 1.随机误差是指“测量结果与在重复性条件下,对同一被测量进行无限多次测量所得结果的平均值之差”(5.19条)。 这是1993年由BIPM、IEC、ISO、OIML等国际组织做了原则修改后的新定义。它表明测量结果是真值、系统误差与随机误差这三者的代数和;而测量结果与无限多次测量所得结果的平均值(即总体均值)差,则是这一测量结果的随机误差分量。随机误差等于误差减去系统误差。1993年前,随机误差被定义为在同一量的多次测量过程中,以不可预知方式变化的测量误差的分量。 老定义中这个以不可预知方式变化的分量,是指相同条件下多次测量时误差的绝对值和符号变化不定的分量,它时大时小、时正时负、不可预定。例如:天平的变动性、测微仪的示值变化等,都是随机误差分量的反映。事实上,多次测量时的条件不可能绝对地完全相同,多种因素的起伏变化或微小差异综合在一起,共同影响而致使每个测得值的误差以不可预定的方式变化。现在,随机误差是按其本质进行定义的,但可能确定的只是其估计值,因为测量只能进行有限次数,重复测量也是在“重复性条件”下进行的(见5.6条)。就单个随机误差估计值而言,它没有确定的规律;但就整体而言,却服从一定的统计规律,故可用统计方法估计其界限或它对测量结果的影响。 随机误差大抵来源于影响量的变化,这种变化在时间上和空间上是不可预知的或随机的,它会引起被测量重复观测值的变化,故称之为“随机效应”。可以认为正是这种随机效应导致了重复观测中的分散性,我们用统计方法得到的实验标准[偏]差是分散性,确切地说是来源于测量过程中的随机效应,而并非来源于测量结果中的随机误差分量。 随机误差的统计规律性,主要可归纳为对称性、有界性和单峰性三条: 1.对称性是指绝对值相等而符号相反的误差,出现的次数大致相等,也即测得值是以它们的算术平均值为中心而对称分布的。由于所有误差的代数和趋近于零,故随机误差又具有抵偿性,这个统计特性是最为本质的;换言之,凡具有抵偿性的误差,原则上均可按随机误差处理。

数据处理及误差分析

盛年不重来,一日难再晨。及时宜自勉,岁月不待人。 物理实验课的基本程序 物理实验的每一个课题的完成,一般分为预习、课堂操作和完成实验报告三个阶段。 §1 实验前的预习 为了在规定时间内,高质量地完成实验任务,学生一定要作好实验前的预习。 实验课前认真阅读教材,在弄清本次实验的原理、仪器性能及测试方法和步骤的基础上,在实验报告纸上写出实验预习报告。预习报告包括下列栏目: 实验名称 写出本次实验的名称。 实验目的 应简单明确地写明本次实验的目的要求。 实验原理 扼要地叙述实验原理,写出主要公式及符号的意义,画上主要的示意图、电路图或光路图。若讲义与实际所用不符,应以实际采用的原理图为准。 实验内容 简明扼要地写出实验内容、操作步骤。为了使测量数据清晰明了,防止遗漏,应根据实验的要求,用一张A4白纸预先设计好数据表格,便于测量时直接填入测量的原始数据。注意要正确地表示出有效数字和单位。 §2 课堂操作 进入实验室,首先要了解实验规则及注意事项,其次就是熟悉仪器和安装调整仪器(例如,千分尺调零、天平调水平和平衡、光路调同轴等高等)。 准备就绪后开始测量。测量的原始数据(一定不要加工、修改)应忠实地、整齐地记录在预先设计好的实验数据表格里,数据的有效位数应由仪器的精度或分度值加以确定。数据之间要留有间隙,以便补充。发现是错误的数据用铅笔划掉,不要毁掉,因为常常在核对以后发现它并没有错,不要忘记记录有关的实验环境条件(如环境温度、湿度等),仪器的精度,规格及测量量的单位。实验原始数据的优劣,决定着实验的成败,读数时务必要认真仔细。运算的错误可以修改,原始数据则不能擅自改动。全部数据必须经老师检查、签名,否则本次实验无效。两人同作一个实验时,要既分工又协作,以便共同完成实验。实验完毕后,应切断电源,整理好仪器,并将桌面收拾整洁方能离开实验室。 §3 实验报告 实验报告是实验工作的总结。要用简明的形式将实验报告完整而又准确地表达出来。实验报告要求文字通顺,字迹端正,图表规矩,结果正确,讨论认真。应养成实验完后尽早写出实验报告的习惯,因为这样做可以收到事半功倍的效果。 完整的实验报告应包括下述几部分内容: 数据表格 在实验报告纸上设计好合理的表格,将原始数据整理后填入表格之中(有老师签名的原始数据记录纸要附在本次报告一起交)。 数据处理 根据测量数据,可采用列表和作图法(用坐标纸),对所得的数据进行分析。按照实验要求计算待测的量值、绝对误差及相对误差。书写在报告上的计算过程应是:公式→代入数据→结果,中间计算可以不写,绝对不能写成:公式→结果,或只写结果。而对误差的计算应是:先列出各单项误差,按如下步骤书写,公式→代入数据→用百分数书写的结果。 结果表达 按下面格式写出最后结果: )N ()(N )N (总绝对误差测量结果待测量?±=.. %100(??=N N )Er 相对误差 结果分析 对本次实验的结果及主要误差因数作简要的分析讨论,并完成课后的思考题。还

“误差分析和数据处理”习题及解答

“误差分析和数据处理”习题及解答 1.指出下列情况属于偶然误差还是系统误差? (1)视差;(2)游标尺零点不准;(3)天平零点漂移;(4)水银温度计毛细管不均匀。 答:(1)偶然误差;(2)系统误差;(3)偶然误差;(4)系统误差。 2.将下列数据舍入到小数点后3位: 3.14159; 2.71729; 4.510150; 3.21650; 5.6235; 7.691499。 答:根据“四舍六入逢五尾留双”规则,上述数据依次舍为: 3.142; 2.717; 4.510; 3.216; 5.624; 7.691。 3.下述说法正确否?为什么? (1)用等臂天平称衡采取复称法是为了减少偶然误差,所以取左右两边所称得质量的平均值作为测量结果,即 ()1 2 m m m = +左右 (2)用米尺测一长度两次,分别为10.53 cm 及10.54 cm ,因此测量误差为0.01 cm 。 答:(1)错。等臂天平称衡时的复称法可抵消因天平不等臂而产生的系统误差。被测物(质量为m )放在左边,右边用砝码(质量为m r )使之平衡,ml 1 = m r l 2,即 2 r 1 l m m l = 当l 1 = l 2时,m = m r 。当l 1 ≠ l 2时,若我们仍以m r 作为m 的质量就会在测量结果中出现系统误差。为了抵消这一误差,可将被测物与砝码互换位置,再得到新的平衡,m l l 1 = ml 2,即 1 l 2 l m m l = 将上述两次称衡结果相乘而后再开方,得 m = 这时测量结果中不再包含因天平不等臂所引起的系统误差。 (2)错。有效数字末位本就有正负一个单位出入;测量次数太少;真值未知。 4.氟化钠晶体经过五次重复称量,其质量(以克计)如下表所示。试求此晶体的平均质量、平均误差和标准误差。

粗大-系统-随机误差处理

课程设计用仪器设备名称 此次课程设计用到的仪器设备和软件包括: (1) 个人计算机; (2) Matlab 软件。 课程设计过程 1、课程设计处理原理: 此次课程开展的数据处理包:(1)粗大误差处理;(2)系统误差处理;(3)随机误差处理。他们的原理分别分析如下: (1)粗大误差处理 对于粗大误差,采用莱以特准则和罗曼诺夫斯基准则。 莱以特准则:求出数据的算数平均值x 和标准差σ,将残差的绝对值i x v 和 3σ进行比较,大于3σ的值都认为是粗大误差。 罗曼诺夫斯基准则:首先剔除该数据中的最大值,然后再按照t 分布检验, 求出该项与剔除后平均值的差,即d x x ?,再与()2,K n a σ?进行比较,如果前者大于等于后者,那么该数据有系统误差。 (2)系统误差处理 对于系统误差,我们采用了残差总和判断法,阿贝-赫梅判别法,标准差比较法,他们的原理如下: 残差总和判断法:对于等精度的系统测量数据12,,...n x x x ,设相对的残差 分别是12,,...n v v v ,若有12n i i v =>∑,则怀疑测量数据有系统误差 阿贝-赫梅判别法:对于等精度的系统测量数据12,,...n x x x ,设相对的残, 分别是12,,...n v v v ,122311 1 ...n n n i i i u v v v v v v v v ?+==+++= ∑,如果2u >, 则判定该组数据含有系统误差。 标准差比较法:对于等精度的系统测量数据12,,...n x x x ,设相对的残差分

别是12, ,...n v v v ,用不同的公式计算标准差,通过比较可以发现存在的系 统误差。用贝塞尔公式计算,1s = ,用别捷尔斯公式计算, 1s =211s s ≥,则怀疑测量中存在系统误差。 (3)随机误差处理 我们考虑了正态分布和t 分布两种情况,通过置信概率和自由度分别在正态分布积分表和t 分布表中找到对应的t 值,再求出极限误差lim x t ?σ=+。 2 课程设计的整体流程图如图(一)所示。在图(一)中,粗大误差分析,系统误差分析,随机误差分析都作为子程序存在。首先我们是将存储在txt 文件中的测量数据导入到matlab 中,然后进行在子程序中用两种方式进行粗大误差分析,并返回剔除异常值以及剔除异常值后的测量数据。接着进行系统误差分析,用了三种方法检测是否具有系统误差,并返回测量结果。之后进行随机误差分析,返回两种分布的极限误差。最后将本次测量结果都写入到txt 文件中。

粗大误差处理

莱以特准则 load a.txt while(1) i=1:length(a); n=length(a); v(i)=a(i)-mean(a); bzc=sqrt(sum(v(i).^2)/(length(a)-1)); d=3*bzc; [maxv,I]=max(abs(v(i))); if maxv>d fprintf('cdw is %f\n',a(I)); a(I)=[]; else break; end end cdw is 29.520000 cdw is 28.400000 罗曼诺夫斯基准则 load a.txt n=input('please input n:\n'); xzd=input('please input xzd:\n'); switch xzd case xzd==0.05 x=1; otherwise x=2; end b=a(n); a(n)=[]; while(1) c=mean(a); i=1:length(a); n=length(a); v(i)=a(i)-mean(a); bzc=sqrt(sum(v(i).^2)/(length(a)-1)); k=[4.97 3.56 3.04 2.78 2.62 2.51 2.43 2.37 2.33 2.29 2.26 2.24 2.22 2.20 2.18 2.17 2.16 2.15 2.14 2.13 2.12 2.11 2.10 2.10 2.09 2.09 2.08;11.46 6.53 5.04 4.36 3.96 3.71 3.54 3.41 3.31 3.23 3.17 3.12 3.08 3.04 3.01 3.00 2.95 2.93 2.91 2.90 2.88 2.86 2.85 2.84 2.83 2.82 2.81]; g=k(x,n-2); f=g*bzc; e=abs(b-c); if e>f fprintf('cdw is %f\n',b); else fprintf('wcdw\n'); end break; end please input n: 4 please input xzd: 0.05 cdw is 29.520000

相关文档
相关文档 最新文档