文档视界 最新最全的文档下载
当前位置:文档视界 › 生物统计复习提纲

生物统计复习提纲

生物统计复习提纲
生物统计复习提纲

生物统计复习提纲

第一章

1、生物统计是数理统计的原理和方法在生物科学中的应用。

2、生物统计的作用或任务(1)提供试验或调查设计的方法 (2)提供整理分析资料的方法

3、生物统计的基本特点 (1)通过样本推断总体 (2)统计推断有很大的可靠性,但也有犯错误的可能性

4、常用术语

(1)总体与样本

总体:研究对象的全体

样本:从总体随机抽出的一部分,是总体的代表 n—为样本的大小. n>30为大样本;n≤30为小样本,通过样本了解总体

(2)参数由总体计算的特征数。是一个未知的常数

统计量——由样本计算的特征数。是一个变量,是参数的估计值。

注意:参数用希腊字母表示。统计量用拉丁字母表示,常用参数与相应统计量的符号。如: x一u s —σ r —ρ b—β

(3)准确性:指观测值与总体真值的接近程度;

精确性:指观测值彼此接近的程度

(4)系统误差:由非试验条件的不同造成的差异,影响试验的准确性。是可以消除的。正确的设计中不应存在系统误差。

(5)随机误差由许多无法控制的偶然因素综合作用而造成的差异,是不可避兔的,只能尽量使之减小。随机误差影响试验的精确性。一般所说的误差是指随机误差,即狭义的试验误差。

第二章资料的整理

1.数量性状资料:能以测量或计数的方式表示其特征的性状。按取得数据的方式分两种:

(1)计量资料:指由测量手段得到的资料,可是整数,也可是小数。又称为连续性变数资料

(2)计数资料:由计数方式取得的数量性状资料。只能取整数,不能取小数,所以数据是间断的,又称不连续变数资料。

2.质量性状资料:指只能观察,不能直接度量的性状,主要以计数方式取得数据,其数据不能表示性状的特征,只表示某性状出现的次数。

3.小样本资料的整理:只需直接计算出两个特征数:平均数x和标准差S

4.大样本(数量性状资料)要整理成次数分布表,制作次数分布表要注意三点:(1)确定第一组的下限(或第一组的组中值)a,使第一组下限略小于资料中的最小值 (即小1/2组距)

b,使第一组组中值等于或接近最小值。(2) 如何解决与组距相等变数的归组混乱问题,统一规定为归于下一组。(3) 组数的确定:过多增大计算量;过少由表计算的统计量精确度低

第三章平均数、标准差、变异系数

1.算术平均数计算式х= Σх/ n 大样本(加权法)х= Σfx/Σf

2.平均数是资料的代表值,表明观测值相对集中性

3.平均数的基本性质 (1)离均差之和等于零:即Σ

(x-x)=0 х是u 的无偏估计

(2)离均差平方和最小:

即Σ(X-x) <Σ(X-a)。由此说明X

对样本的代表性最强。

4.中位数:资料呈偏离态时,用中位

数表示其集中性。

1.几何平均数:用于生产的动态分析

以及疾病与药物效价分析。

2.调和平均数:主要用于畜群不同阶

段平均增长率或畜群不同规模的平均

规模。

3.众数:出现次数最多的数或次数最

多一组的组中值。

4.标准差(S) 度量资料变异程度,实

质是变数到平均数的平均距离。S是δ

的无偏估计。

S=

具有与平均数相同的单位。

标准差的主要特性:

(1)给每个变数加或减一个常数算出

的S值不变

(2)给每个变数乘以(或除以)常数a,

所得S是原s的a倍 (或1/a倍)

(3) X土S 范围内约占68.27%

X土2S 范围内约占95.45%

X土3S 范围内约占99.73%

自由度(df):变异数列受到一些

条件限制后所得独立变数之个数。

df=n-1

9,全距近似地等于6倍标准差可

用全距/6来粗略的估计S。

10.变异系数:CV=S/X ×IO0% 是一个

无单位的相对数。适用于:平均数不

等、单位不同的样本间变异程度的比

较。CV与S和X两个统计量有关。

11.变异系数与标准差的联系与异同

联系:cv= S/X×1O0%;

不同 S —是有单位的绝对值

Cv —无单位的相对数。

相同都是度量资料变异程度的统计

指标。平均数不等、单位不同的样本

间变

第四章概率分布

1.概率随机事件发生的可能性大小

的数量描述取值: O≤P(A)≤1

随机事件的概率: O

2.小概率事件实际不可能性原理

小概率标准一般为0.05,P(A)≤0.05

的事件称为小概率事件

3.研究随机变量时要回答两个问题:

(1)变量的取值 (或范围)

(2)取某值(或范围)时的相应概率

变量分为连续型随机变量和间断性

随机变量两种。适用中对连续型变量

只关心其在某一范围时的概率(∵某

一点的概率为0,且无实际意义)

4.正态分布是连续型随机变量的分

布,无论是在理论研究中还是在实际

应用中,均占有重要的地位。这是因

为:

a、生物现象中有许多变量是服从

或近似服从正态分布

b、许多统计分析方法都是以正态分

布为基础的

c、有不少随机变量的分布在一定条件

下以正态分布为其极限分布

5、连续型随机变量X的概率分布密度

函数f(X)决定于两个参数,μ与δ,

记为X ~ N(u. δ)

在正态分布中:

①当X=μ时曲线最高,

②正态分布曲线以X=μ为对称轴,是

一对称的分布。

③正态分布取值范围 -∞,+∞

④μ决定了曲线的位置,δ决定了曲

线的“胖”“瘦”

⑤曲线与横轴所夹面积为1

6、标准正态分布:

标准化 X~ N(μ. δ)时用公式μ= X-

μ/δ将X转换为标准化变量u,记作

u ~ N(O·1)。上述转换称为标准化。

7、在标准正态分布中:

P(-1≤u<1)=0.6826

P(-2≤u≤2)=0.9545

P(-3≤u≤3)=0.9973

P(-1.96≤u≤1.96)=0.95

P(-2.58≤u≤2.58)=0.99

P(∣u∣≥1.96)=0.05

P(∣u∣≥ 2.58)=0.0l

即uo.05=1.96(两尾概率)

即uo.01=2.58

题例已知某人群体高为170*8(厘

米),问100个人中体高在162-178厘

米范围的人大约有 C左右(4选1)。

A、50

B、60

C、70

D、80

8、样本平均数的抽样分布:

(1)若随机变量X服从正态分布N (u.,

δ),则由该总体抽得样本的平均数X

也服从正态分布。

即 x ~ N (u. δ)

(2)若随机变量X服从平均数为u,方

差是δ,的分布(不是正态分布),由

此总体取得的平均数X分布,当n相

当大时逼近正态分布N(u,δ)。这就

是中心极限定理。

两总体参数的关系是 u = u

δ =δ/ n此关系在实用中很重耍。由

上述中心极限定理得知,在实用中可

将样本均数x无看作是服从正态分布

(u . δ)的。

题例(填空或单选):已知x-N(50·4 ),

由此总体抽得n=4的样本,其平均数

x ~ N(50·2 )

9、标准误——平均数的标准差 (S-),

度量了抽样误差(或试验误差)

S-= S/ n

10、标准误与标准差(S)的联系与异点;

共同点:S与S-都是度量资料变异程度

的统计指标。

不同点:S是度量样本中各观测值的变

异程度的统计指标,它的大小说明了x

对样本的代表性。S- 则是度量x变异

程度的统计指标,它的大小反映了x

对u估计的精确性。

1I、t = x-u/S- 是一个依自由度

而变的一组曲线。

a.t的取值范围是 (-∞,+∞)。

b.t分布密度曲线以t=0为对称轴的对

称分布。

12、t分布与正态分布的区别与联系:

区别: ① 正态分布是与自由度无

关的一条曲线t分布是依自由度而变

的一组曲线。

② t分布较正态分布顶部略低而尾

部稍高。

联系:随看自由度增大t分布趋近于

标准正态分布;当n>30时二者相差很

小;当n→∞时二者重合。

13、在t分布中①当df一定时,概率

P越大临界 t值越小;概率P越小,临

t值越大。当概率P一定时,随着自由

度的增加,临界t值在减

小。当 df一∞时临界t值与标准正态

分布的临界u值相等(即tO.05=u).

14、df=1Oto.05=2.228的含意

是:df=10时0.05临界t值是2.228。

15、二项分布是离散型随机变量的分

布.一种事件的发生只有两种可能情

况:事件A发生(p)和事件A不发生(q)

且q=I-p。在n次试验中,所得到的两

种情况的各种组合的频率分布称为二

项分布。因其结果是相应二项式(p+q)

的展开式而得名。

在n次试验中事件A发生K次的概率P

n (K)=C p q C n = n! /k(n-k)!

16、二项分布各项之利为1,即(p+q) =1

例:4头母牛下犊,其结果(♂♀)与其

相应,概率如下:♂♀概率均为1/2,

即P=q=1/2,以下母犊记为1,下公的

记为0:则有5种可能:

X 0 1 2 3 4

P 1/16 4/16 6/16 4/16 1/16

P (0 ♀)=P (4♂)=(1/2)(1/2)= 1/16

P (1 ♀)= C(1/2)(1/2) =4(1/2)

= 4/16

P (2 ♀)= C (1/2)(1/2)=6(1/2)

=6/16

P (3 ♀)= C (1/2)(1/2)=4 (1/2)

=4/16

P(4 ♀)= C (1/2)(1/2)=1(1/2)

=1/16 各项和为1

17、二项分布决定于两个参数n、ρ,

记为Х~Β(n. ρ)。

u =nρδ= nρq

若事件A发生的频率以K/ n表示,则

u =nρδ= ρq/n

18. 波松分布——是稀有事件的分

布,其特征是:u=δ =λ。

19.波松分布是一偏态分布,随着λ的

增大而趋向于对称。当λ=20时波松分

布与正态分布接近;λ=50时,二者基

本一致。在实用中当λ=20时就可用正

态分布来近似的处理波松分布问题。

利用波松分布的特征u=δ =λ来粗略

的判断某一资料是否服从波松分布。

例:由一样本算得x=0.5 S =0.496,

问此资料可能服从什么分布?

由于X与S,很相近,所以该资料可

能服从波松分布。

第五章t检验

1、试验结果为什么必须经过显著性

检验才能得出可靠的结论?

因为试验的目的在于了解处理效

应是否存在,而试验结果(差)中不仅

有处理效应,还有误差的干扰,所以

说试验结果只是一个表面效应。需将

表面效应与误差作一权衡比较,然后

对处理效应是否存在作出推断,作出

有一定概率保证的结论。(简单回答就

是因为误差的不可避免性)

2、显著性检验为什么以样本均数

(X)作为检验的对象。

3、因为 (1) X是样本的代表值,

Σ(X- X )最小,说明X的代表性最

强。(2)X是总体平均数u的无偏估计。

(3) X服从或逼近正态分布N(u . δ )

3、显著性检验的基本思想?

从试验的表面效应与误差的权衡比较

中间接地推断处理效应是否存在。

4、统计推断为什么不是绝对正确而有

犯错误的可能?

因统计结论(即显著性检验)是在表

面效应与误差的权衡比较中推断出来

的,而不是证明得出的结论。

5、显著性检验的步骤:

第一步,对样本所在总体作假设:如:Ho:u=uo或Ho:ul=p2

或Ho:ul=u2=……=uk

同时设一备择假设,以备假设被否定以后接受。

第二步:在假设是正确的前提下,计算假设成立的概率(即试验结果属于误差的概率)。

第三步:根据小概率实际不可能性原理否定或接受假设。

6、显著水平——用以确定否定或接受假设的概率标准。一般常用的概率标准是α=0.05与α=0.01,

7、对于一些试验条件不易控制,误差较大的试验可将α值放宽到0.1,最宽可放到0.25,

8、I类错误:当统计判断为差异显著(即达0·05)时,该处理效应存在的可靠性为95%。同时还有5%的可能性将误差错判为真差,这一错误称为I类错误。

Ⅱ类错误:在差异不显著时,将真差错判为误差。犯Ⅱ类错误的概率是不知道的,只知其概率随两总体均数差(ul-u2)的增大而减小。

9、对两类错误的处理

(1) I类错误的实质是将无效——→有效,危害严重所以在选定显著水平时,着力控制I类错误,一般以α

=0.05,为显著水平,即将犯I类错误的概率控制在0·05以下。对于一般生物试验能有 95%的可靠性就可以了。(2) Ⅱ类错误的实质是将有效一-→无效,危害性小。主要在实际应用中注意犯Ⅱ类错误的可能性。

10、当差异不显著时,如何判断结论是正确的,还是可能犯了Ⅱ类错误?

结合有关技术资料作综合判断,这时有两种可能:

(1)统计结论与技术资料二者一致,说明结论正确,即确实处理无效;

(2)若统计结论(无效)与技术资料(应有效)矛盾,说明该试验有可能犯了Ⅱ类错误,试验使差异未达显著标准

11、减小犯Ⅱ类错误的有效方法是什么? 增大样本容量,重新试验。12、增大样本容量的作用:增大样本容量有两个方面的积极作用;

(l)n→大,df→大 to·05→小

(2)n→大 S- = S/ n →小 t→大

从两个万面促使t>to.05使差达显著标准

13.t*的含意,表示此t值达0·05显著,即说明处理有效的可靠性为95%, 14.当假设的目的在于判断ul 是否等于u2时,而不考虑谁大谁小时,用两尾检验;若己知新技术措施较原技术好,目的在于判断u1>u2是否达显著标准时用一尾检验。

一尾检验的t =两尾检验的t ,显然一尾检验的标准低于两尾检验,所以应用中需说明是用一尾检验。15、检验的结果的显著或极显著,只表示下结论(处理有效)的可靠性的高低是95%或99%,于差异的大小和试验因素的重要性无关。

16、t检验中的各种惜况的计算公式必须掌握会用

(1)单个样本均数与总体均数差的检验,t的计算,df=n-l (2)两个样本均数差的检验

t值公式 df=(nl-1)+(n2-1)

当n1=n2时df=2(n-l)

配对t检验 t值公式 df=n-1

n是对子数

17.在nl=n2不变时两大样本含量相等

(即等数分组)时精确度高。因为

n1=n2,时 1/ n1+1/ n2最小。

18.因为配对设计的自由度为非配对

设计的自由度的一半,只有当配对设

计因S 的减小而使计算的t的绝对值

增大的程度超过因自由度减小使0.05

临界t值to.05值增大的程度,配对

才是有利的。

19.正态总体平均数u的区间估计

区间估计——在一定概率保证下指

出总体参数的可能范围。

u的95%区间为:P(X-to.o5S ≤u≤

X+to.o5S )=95%.

其中to.o5依自由度查表,若

是大样本则用to.o5=1.96(需记住)

S = S/ n ,要搞清题中给的是S还是

S

第六章方差分析

1.若用t检验对3个及3个以上样

本均数X作两两比较,会增大犯

I类错误的概率,3个上处理的试

验当用方差分析。

2.试验单位——在试验中能接受不

同处理的独立的试验载体。在饲

喂试验中,单圈为一试验单位,

群饲者以群为单位(其它试验要

依上述定义判断)。

3.重复处理中所设的试验单位在

两个或两个以上为有垂复。

4.方差分析是将度量资料总变异的

总方差剖分为不同变异原因形成

的各个方差的数学方法。方差的

剖分是通过分子平方和、分母自

由度的分别剖分实现的。

5. k个处理、n个重复的单因子试验

的方差分析必须会作。其平方和与自

由度的剖分式为:

SS =SS +SSe Kn-1=(k-l)+k(n-1)

6. F*表示处理间存在显著差异,但并

未告知是所有处理间都有显著差异。

也未告知哪两个处理有显著差异,所

以当F显著时,需作X的多重比较,

才可判断出哪两个X之间有显著差异。

7. 常用多重比较的几种方法的检验

尺度:

LSD法≤新复极差法≤q检验法

当k=2时,取等号,k≥3时取小于

8. 生物试验中常用新复极差法

1.A、B二因子无重复试验资料的平方

和与自由度的剖分:(交叉分组)

SS =SSA+SSB+SSe

df= a-1+b-1+(a-1)(b-l) (a、b

分别为A、B因子的水平数)

10. 二因子(A、B)(交叉分组)有重复

资料的平方和与自由度的剖分式为:

SS =SSA+SSB+SSA*B+SSe

df =a-1+b-1+(a-l)(b-1)+ab(n-1)

n是重复数

11. 二级系数分组资料试验目的侧

重于一级因素;其平方和与自由度剖

分式为:

SS =SSA+SSB(A)+SSe

df =a-1+a(b-l)+ab(n-1)

相应均方: MSA MSB(A) MSe

FA=MSA/MSB(A)

FB(A)=MSB(A)/MSe

12. 将三角形表表示的平均数多重比

较结果以字母标记

X X-15 X-19 字母标记

25 10* 6* a

19 4 bc

15 c

第七章 X 检验

t检验与方差分析是对数量性状资

料的检验,X 是对质量性状资料的有

关检验

1. X 检验是通过对观察次数与某种假

定的理论次数的比较来确定二者的符

合程度。依检验目的不同分为两种

(1)适合性检验-一一理论值与观察

值差的显著性检验

(2)(2)独立性检验一一检验两类因

子的关系相互独立

互不独立

2. 适合性检验:假设为观察值与理论

值相符。理论值T是公认的或己知的

比率,如性别的1:1,盂德尔遗传分离

定律3:1等。

3. 独立性检验:假设为:两因子相互

独立,如注射疫苗与否(一个因于)与

发病多少(一个因子)若二者确实无关

说明疫苗无效,反之则说明疫苗有效。

理论值是从假设(两因子相互独立)

出发由样本数计算得来的,自由度。

df=(r-1)(c-1) (r为行数,C为

列数)

4. 独立性检验与适合性检验的区

别:(除目的不同外)

(1)适合性检验,按某因子的属性

单向分组

独立性检验,按两向分组构成

2X2,2Xc,cXr联列表。

(2)理论值的来源不同:适合性检

验中理论值是已知的或公认的比率。

独立性检验中的理论值则是从假设出

发由样本资料计算来的。

(3)自由度计算不同,适合性检验

中,是组数减1。

独立性检验中,df

=(c-1)(r-l).

第八章

1、变量间的关系

完全相关关系(或完全的确定性

关系)一一函数关系。

无关系

相关关系:有关系,但不是完全相

关,是统计学研究的对象。

2、研究变量间关系的方法

回归分析简单回归(两个变异)

直线回归曲线回归

复回归(三个以上变异)

相关分析简单相关——直线相关

分析

复相关

3、直线回归分析:是由自变量估计依

变量的统计方法作回归分析,首先要

确定自变量与依变量,依两变量间的

关系有两种情况

变量间的关系

单方向依存关系,因是自变量,

果是依变量,如母子关系,母是自变

量,子是依变量。

平行关系,(即无严格的依存关系)

如体重与体尺,以易度量的为自变量,

难度量的为依变量。

这样取得回归方程后,就可以易

度量的变量去估计难以厘量的变量。

4、直线回归分忻就是建立回归万程:

王=a+bx

a一回归截距,b一一回归系数,

b是β的估计值。回归分析的具体过

程:

(1)计算

b= =

自变量的平方和

(2)由a=y –b 计算a,即可建立

回归方程。

(3)此方程必经检验是显著才有意

义。

5、b=2.5公斤/厘米的含意是,自变量

每增减1厘米,依变量随之增减2.5

公斤;二者作同大同小的变化。若b为

负值,则自变量与依变量作相反变化。

6、由于直线回归与直线相关的显著性

检验是等价的,所以可用相关表对相

关系数Y先作检验。若相关显著再作

回归分析。y若不显著,则不必再作回

归分忻。

7、直线相关分析,就是计算相关系数

r。

r= =

分子可正可负,,的取值是-l

相关系数r的符号 (正或负)说明两

变量关系的性质。r的取值说明了相关

的程度。

8、r 称为决定系数。实际上r 较r度

量相关程度更合理。因为:

Σ(y –y)=r Σ(y-y) + (1- r) Σ

(y-y)

相关平方和非相关千万

由上式可知相关部分是总变异的r

倍。

9、在实用中,应将r 与r结合起来使

用,以r 说明变量间的相关程度而以

r说明其相关性质。

10、由回归标准误Sb=S / S S 可

知自变量x的取值范围大(SSx=Σ(x-

x) 就大),Sb就小。所以在取样时X

可取范围大些。

11、直线回归与直线相关分析应注意

事项:

(1)相关与回归分析具样本所在总

体的特异性,无通用性;

(2)相关与回归分析是用数学的方

法来研究生物,要考虑生物本身的客

观实际情况,如截距a有无实际意义、

回归直线能否外延、自变量与依变量

的确定;

(4)用单因素x对y预测时,耍求X

必须是影响y的主要因素或重耍

因素。所以通常要求|r| ≥0.7

才能用X预测y,这样y的变异

将有49%以上由x引起。

12、关系数与回归系数的关系: r= b

b byx ——是y对x的回归系数 (x-

自变量)

bxy ——是x对y的回归系数 (y-

自变量)

13、直线回归、直线相关显著性检验

的关系(1)直线回归中,回归关系的F

检验与回归系数b的t检验是等价的。

(2)直线相关中,相关关系的F检验

与相关系数r的t检验是等价的。相

关系数的相关表检验是最简单的,直

线相关与直线回归的显著性检验也是等价的。所以实践中相关表检验最方便。

14、直线回归分析中,回归自由度等于自变量的个数。离回归自由度 (即误差自由度)为(n-2)

15、回归显著性检验的假设是Ho:β=O ;相关显著性检验的假设是:p=O 第八章非参数检验

1、 非参数检验是一种与总体分布状

况无关的检验方法。

2、 非参数检验的效率一般低于参数

检验,所以实用中能用参数检验的不用非参数检验。

3、 常用非参数检验的方法有: (1)

符号检验; (2)秩和检验; (3)等积相关分析。 第九章试验设计

1.试验设计的基本原则

试验设计的基本要求满足显著性检验的需要 差的无偏估计

估计误差与降低误差

要做到这一点必须遵循三个原则 (1)设置重复:重复一一 指一个处理中所设的试验单位数在两个或两个以上。其作用有两个: ①估计误差

②降低误差 ∵S = S/ n

注意:对照组应和试验组相同,等

数分组 (精确度高); 重复数的多少与因素的个数及水平、设计方法等有关。

(2)随机化 试验动物的分组,各组所受处理的确定,以及可能引起系统误差的措施均应采用随机化的方法确定。随机化的作用使试验材料 (如动物)的微小差异均衡地分配于各组,使其相互抵消,从而对差作出无偏估计(即消除系统误差)。

(3)局部控制 局部控制的作用为, ①排除系统误差;

②降低随机误差 。如下图所示:

重复

随机化 局部控制

差的无偏估计 估计误差 降低误差 统计推断 提高精确度 2.注意事项 (1)正确确定试验单位。在饲喂试验中,群饲动物一群为一个试验单位。

(2)对照组的设置 比较是试验的基本方法,有对照才有比较。任何试验都要有对照。常用的对照形式有:

① 巳空白对照试验的目的在于了解某因素是否有效,需以空白组作对照:

② 相互对照 某因素的作用己确定,需进一步确定其适当用量时,可设几个不同用量(即水平)作相互对照;③ 标淮对照 以标准值、正常值或在标准条件下进行的观察为对照。 (3)唯一差异的原则:'进行比较的各组间只存在唯一差异,即试验条件的不同。这样各组才具可比性。

3.完全随机没计 (1)用随机方法将试验动物分组,不考虑其它因素。适用于试验动物比较整齐的情况;

(2)试验结果的统计分析 ①两个组 ——用非配对t 检验

②两个以上组 ——用方差分析 (3)优缺点: ①优点:设计简单,处

理数、重复数不受限制; ②缺点:限制条件少,所以精确度差。

4.随机单位组设计(配对设计是处理数为2的随机单位组设计)

(1) 设置单位组的原则 单位组内的

差异小于单位组间的差异 (2) 统计处理 配对设计——配对

t 检验 df=n-l(n 是对比数) 处理数为三个或三个以上 用二因

子无重复方差分析 df=(a-l)(b-1) a 为处理数, b 为单位组数 (3)优点

①处理数、重复数不受限制:

②排除了一种系统误差 (单位组间的差异),即进行了局部控制,精确度较完全随机设计高; ③统计方法简便。 (4)设置单位组的利弊

利:设置单位组可排除其影响,降低了误差。

弊:随着单位组的提出,自由度也随之提出,从而减小了误差自由度。 所以若单位组的F>1.5,设置单位组有利;若单位组的F<1.5,以不设单位组有利。

5.拉丁方设计

(1) 特点:直行数=横行数=处理数=

重复数

(2)统计分析:三因子无重复方差分析 (3)优缺点,①优点:从两个万向排除了两个系统误差精确度较随机单位组精确度高;②缺点:限制严,无伸缩性,不便于使用。

6.上述三种设计实际上都是单因子设计,若作二因素试验一般需作全面试验,即将各因素水平的组合全作,这样既可考虑各因素的主效应,还可考查各级交互作用。交互作用在生物试验中很重要。

7.试验规模的大小与所检对象的差与变异程度有关。难以确切得知适宜的规模。可粗略的根据误差自由度估计。 因为to.05(Fo.05)临界值随着自由度的增大而减小,且随着自由度的增大,0.05的t 值减小的速度愈来愈小,当df 达20以后,to.o5减小甚微。从这一点出发,认为试验规模以dfe=20就足够了,但在实践中这一规模有时也难以达到。实用中认为误差自由度为10(或者10左右)也可将就了。

综上所述,试验规模以dfe 为10~20为宜。

统计学计算题例题

第四章 1. 某企业1982年12月工人工资的资料如下: 要求:(1)计算平均工资;(79元) (2)用简捷法计算平均工资。 2. 某企业劳动生产率1995年比1990年增长7%,超额完成计划2%,试确定劳动生产率计划增长数。7%-2%=5% 3. 某厂按计划规定,第一季度的单位产品成本比去年同期降低8%。实际 执行结果,单位产品成本较去年同期降低4%。问该厂第一季度产品单位成本计划的完成程度如何?104.35%( (1-4%)/(1-8%)*100%=96%/92%*100%=104.35%结果表明:超额完成4.35%( 104.35%-100%)) 4. 某公社农户年收入额的分组资料如下:

要求:试确定其中位数及众数。中位数为774.3(元)众数为755.9(元) 求中位数: 先求比例:(1500-720)/(1770-720)=0.74286 分割中位数组的组距:(800-700)*0.74286=74.286 加下限700+74.286=774.286 求众数: D1=1050-480=570 D2=1050-600=450 求比例:d1/(d1+d2)=570/(570+450)=0.55882 分割众数组的组距:0.55882*(800-700)=55.882 加下限:700+55.882=755.882 5.1996年某月份某企业按工人劳动生产率高底分组的生产班组数和产量资料如下: 64.43(件/人) (55*300+65*200+75*140+85*60)/(300+200+140+60) 6.某地区家庭按人均月收入水平分组资料如下:

根据表中资料计算中位数和众数。中位数为733.33(元) 众数为711.11(元) 求中位数: 先求比例:(50-20)/(65-20)=0.6667 分割中位数组的组距:(800-600)*0.6667=66.67 加下限:600+66.67=666.67 7.某企业产值计划完成103%,比去年增长5%。试问计划规定比去年增长 多少?1.94% (上年实际完成1.03/1.05=0.981 本年实际计划比上年增长 (1-0.981)/0.981=0.019/0.981=1.937%) 8.甲、乙两单位工人的生产资料如下: 试分析:(1)哪个单位工人的生产水平高? (2)哪个单位工人的生产水平整齐? % 3.33V %7.44V /8 .1x /5.1x ====乙甲乙甲人)(件人)(件9.在 计算平均数里,从每个标志变量中减去75个单位,然后将每个差数 缩小10倍,利用这个变形后的标志变量计算加权算术平均数,其中各个变量的权数扩大7倍,结果这个平均数等于0.4个单位。试计算这个平均标志变量的实际平均数,并说明理由。79 10.某地区1998~1999年国内生产总值资料如下表:(单位:亿元)

生物统计学考试复习题库

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 122 --∑∑n n x x )(

2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 三 填空 1.如果事件A 和事件B 为独立事件,则事件A 与事件B 同时发生的概率P (AB )= P (A )?P (B )。 2.二项分布的形状是由( n )和( p )两个参数决定的。 3.正态分布曲线上,( μ )确定曲线在x 轴上的中心位置,( σ )确定曲线的展开程度。 4.样本平均数的标准误 =( )。 5.t 分布曲线与正态分布曲线相比,顶部偏( 低 ),尾部偏( 高 )。 n /σx σ

统计学简答题及答案

统计学简答题及参考答案 1.简述描述统计学的概念、研究容与目的。 概念:它是研究数据收集、整理和描述的统计学分支。 研究容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。 研究目的:描述数据的特征;找出数据的基本数量规律。 2.简述推断统计学的概念、研究容与目的。 概念:它是研究如何利用样本数据来推断总体特征的统计学分支。 研究容:参数估计和假设检验的理论与方法。 研究目的:对总体特征作出统计推断。 3.什么是总体和样本? 总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。 可分为有限总体和无限总体: ?有限总体的围能够明确确定,且元素的数目是有限的,可数的。 ?无限总体所包括的元素数目是无限的,不可数的。 总体单位数可用N表示。 样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量,记为n。 4.什么是普查?它有哪些特点? 普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它有以下的特点: 1)通常是一次性或周期性的 2)一般需要规定统一的标准调查时间 3)数据的规化程度较高 4)应用围比较狭窄。 5.什么是抽样调查?它有哪些特点? 抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。 它具有经济性好、时效性强、适应面广、准确性高等特点。 6.简述统计调查方案的概念及应包括的基本容。 答:统计调查方案就是统计调查前所制订的实施计划,它是指导整个调查过程的纲领性文件,是保证调查工作有计划、有组织、有系统地进行的计划书。 它应包括的基本容有: 〈1〉明确调查目的; 〈2〉确定调查对象和调查单位; 〈3〉设计调查项目; 〈4〉设计调查表格和问卷; 〈5〉确定调查时间; 〈6〉组织实施调查计划; 〈7〉调查报告的撰写,等等。 7.简述统计分组的概念、原则和具体方法。 答:(1)概念

统计学计算题例题及计算分析

计算分析题解答参考 1.1.某厂三个车间一季度生产情况如下: 计算一季度三个车间产量平均计划完成百分比和平均单位产品成本。 解:平均计划完成百分比=实际产量/计划产量=733/(198/0.9+315/1.05+220/1.1) =101.81% 平均单位产量成本 X=∑xf/∑f=(15*198+10*315+8*220)/733 =10.75(元/件) 1.2.某企业产品的有关资料如下: 试分别计算该企业产品98年、99年的平均单位产品成本。 解:该企业98年平均单位产品成本 x=∑xf/∑f=(25*1500+28*1020+32*980)/3500 =27.83(元/件) 该企业99年平均单位产品成本x=∑xf /∑(m/x)=101060/(24500/25+28560/28+48000/32) =28.87(元/件) 年某月甲、乙两市场三种商品价格、销售量和销售额资料如下: 1.3.1999 解:三种商品在甲市场上的平均价格x=∑xf/∑f=(105*700+120*900+137*1100)/2700 =123.04(元/件) 三种商品在乙市场上的平均价格x=∑m/∑(m/x)=317900/(126000/105+96000/120+95900/137) =117.74(元/件) 2.1.某车间有甲、乙两个生产小组,甲组平均每个工人的日产量为22件,标准差为 3.5件;乙组工人日产量资料:

试比较甲、乙两生产小组中的哪个组的日产量更有代表性? 解:∵X 甲=22件 σ甲=3.5件 ∴V 甲=σ甲/ X 甲=3.5/22=15.91% 列表计算乙组的数据资料如下: ∵x 乙=∑xf/∑f=(11*10+14*20+17*30+20*40)/100 =17(件) σ乙= √[∑(x-x)2 f]/∑f =√900/100 =3(件) ∴V 乙=σ乙/ x 乙=3/17=17.65% 由于V 甲<V 乙,故甲生产小组的日产量更有代表性。 2.2.有甲、乙两个品种的粮食作物,经播种实验后得知甲品种的平均产量为998斤,标准差为162.7斤;乙品种实验的资料如下: 试研究两个品种的平均亩产量,确定哪一个品种具有较大稳定性,更有推广价值? 解:∵x 甲=998斤 σ甲=162.7斤 ∴V 甲=σ甲/ x 甲=162.7/998=16.30% 列表计算乙品种的数据资料如下:

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

统计学原理韩兆洲期末考试复习提纲

第一章绪论(小题) 1、统计的含义 人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。 2、统计的特点 数量性、具体性、综合性 3、统计学的若干基本概念 (1)总体与总体单位;总体的特征; 总体是指在某种共性的基础上由许多个别事物结合起来的整体。 例:制造业企业是一个总体、由所有从事制造业的企业所组成,每一个制造业企业都是一个总体单位。 特征:同质性(都是制造业)、大量性、差异性(不同的总体单位间,除了某方面必须有共性之外,其他方面的差异性,如员工人数等等) (2)总体的分类:有限总体与无限总体 总体单位有限为有限总体,总体单位无限称为无限总体 (3)标志、变异与变量 标志:指说明总体单位特征的名称,由标志名称+标志值构成。 变异:可变的品质标志 变量:离散变量、连续变量,(指的是标志,不是标志值) 例:中华人民共和国人口普查 总体:具有中华人民共和国国籍的所有公民 总体单位:每一位公民

标志名称标志值 国籍:中国(不变标志) 姓名:张三(品质标志) 性别:男(品质标志) 民族:汉(品质标志) 婚姻状况:已婚(品质标志) 数量标志: 家庭成员数:4人(离散变量) 年龄:50(连续变量) 身高:172cm (连续变量) 体重:72.5kg(连续变量) 收入:2000元/月(连续变量) (4)连续型变量与离散型变量联系和区别 离散变量:以整数出现 连续变量:可做无限分割的变量 在某些特殊场合,连续变量可做离散化处理。(当人口按年龄分组)(5)指标与标志 指标:是说明总体数量特征的概念。由指标名称+指标值组成。例:工业普查 总体:工业企业 总体单位:每一个工业企业 指标名称指标值

统计学简答题整理

统计学简答题整理 第一章P11 1.获取直接统计数据的渠道主要有哪些?及区别在于? 普查、抽样调查 普查是为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。花费的时间、人力、财力和物力都较大,间隔的时间较长。而两次普查之间的年份以抽样调查方法获得连续的统计数据。 抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法。存在着由样本推断总体产生的抽样误差,但统计方法可以估计出误差的大小进一步控制误差;节省人力、财力、物力,又能保证实效性 2.简要说明抽样误差和非抽样误差。 非抽样误差是由于调查过程中各有关环节工作失误造成的。(它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差,还有一种人为干扰造成的误差即有意瞒报或低报数据等)。非抽样误差在普查、抽样调查中都有可能发生,但可以避免。 抽样误差是利用样本推断总体时产生的误差。(由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的。但可计量、可控制)。抽样误差与样本量的平方根成反比关系。 第二章P51

1.统计的计量尺度 ①列名尺度(定类尺度):是按照某一品质标志将总体分组之后,对属性相同的单位进行计量的方法。各组之间的关系是并列的,没有大小、高低、先后之别。 ②顺序尺度(定序尺度):是按照某一品质标志将总体分组,对等级相同的单位进行计量的方法。各组之间的关系是有顺序的,可以进行排序。 ③间隔尺度(也称定距尺度):是按某一数量标志将总体分组,对相同数量或相同数量范围的单位或其标志值进行计量的方法。其特点是不仅可以进行排序,还可以计算不同数值之间的绝对差距。 ④比例尺度(也称定比尺度):是类似于间隔尺度,又高于间隔尺度的计量方法。其特点是不仅可计算数值的绝对差异,还可以计算数值的相对差异。 2.简述统计分组的概念和作用。 概念:统计分组是根据统计研究目的,选择一定的分组标志,将总体划分为若干组的统计方法。其目的是使组与组有明显差别,同一组中具有相对的同质性。(例:人口按性别、年龄、民族、职业分组;企业按规模分为大型、中型和小型。) 作用:1.划分社会经济现象的类型 2.反映总体的内部结构 3.分析现象之间的依存关系 3.简述众数、中位数和均值的特点与应用场合。 众数是总体中出现次数最多的标志值。反映了标志值分布的集中趋势,是一种由位置决定的平均数。可以没有众数也可有两个。

统计学练习题——计算题

统计学练习题——计算题 1、某企业工人按日产量分组如下: 单位:(件) 试计算7、8月份平均每人日产量,并简要说明8月份比7月份平均每人日产量变化的原因。 7月份平均每人日产量为:37360 13320 == = ∑∑f Xf X (件) 8月份平均每人日产量为:44360 15840 == = ∑∑ f Xf X (件) 根据计算结果得知8月份比7月份平均每人日产量多7件。其原因是不同组日产量水平的工人所占比重发生变化所致。7月份工人日产量在40件以上的工人只占全部工人数的40%,而8月份这部分工人所占比重则为66.67%。

2、某纺织厂生产某种棉布,经测定两年中各级产品的产量资料如下: 解: 2009年棉布的平均等级= 250 10 3 40 2 200 1? + ? + ? =1.24(级) 2010年棉布的平均等级= 300 6 3 24 2 270 1? + ? + ? =1.12(级) 可见该厂棉布产品质量2010年比2009年有所提高,其平均等级由1.24级上升为1.12级。质量提高的原因是棉布一级品由80%上升为90%,同时二级品和三级品分别由16%及4%下降为8%及2%。

试比较和分析哪个企业的单位成本高,为什么? 解: 甲企业的平均单位产品成本=1.0×10%+1.1×20%+1.2×70%=1.16(元) 乙企业的平均单位产品成本=1.2×30%+1.1×30%+1.0×40%=1.09(元) 可见甲企业的单位产品成本较高,其原因是甲企业生产的3批产品中,单位成本较高(1.2元)的产品数量占70%,而乙企业只占30%。

统计学复习提纲

第一章绪论 第一节统计的产生和发展 一、统计的产生:源于人类的计数与统计实践活动。 二、统计的发展 1、英国的政治算术学派(17世纪)【“有实无名”的统计学】 创始人:英国的威廉·配第(政治经济学之父) 代表作:《政治算术》——统计学诞生的标志; 文中针对英、法、荷兰的国情,利用数字、重量、尺度的方法,并配以朴素的图表(现代统计学广为采用的方法和内容)进行三国国力的比较,但没有使用“统计学”一词。 2、德国的国势学派(又称记述学派)(18世纪)【“有名无实”的统计学】 代表人物:康令、阿亨瓦尔 康令在大学开设“国势学”课程,以文字技术和比较为主,反映各国的国情国力;阿亨瓦尔继承和发展了康令的思想,并于1749年首次使用“统计学”代替“国势学”,认为统计学是关于各国基本制度的学问,但缺乏数字和内容。 3、数理统计学派(19世纪) 代表人物:凯特勒(比利时)(古典统计学的完成者,近代统计学的先驱者) 代表作:《社会物理学》——他将概率论引进统计学,完成了统计学和概率论的结合。 第二节统计学的性质和特点 一、统计的三个含义:统计工作(过程)、统计资料(成果)和统计学(理论)。 二、统计学的研究对象:大量社会现象(主要是经济现象)的总体数量方面的方法论科学。 三、统计学的特点:数量性、总体性、具体性、社会性、广泛性。 第四节统计学中的几个基本概念 一、统计总体与总体单位 1、统计总体:是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。统计总体可以分为有限总体和无限总体,总体所包含的单位数有限的比如人口数、企业数,反之比如大海里的鱼资源数。 2、总体单位:是指构成总体的个别单位。 注:总体和总体单位的划分是相对的,它们随着统计研究对象和研究目的变化而相互转化。 二、统计标志与统计指标 1、统计标志:用来说明总体单位所具有的属性或特征的名称。可分为品质标志和数量标志。品质标志是说明总体单位质的特征,不能用数字来表示的,如性别、籍贯、工种等; 数量标志是说明总体单位量的特征,是可用数字来表示的,如年龄、身高、收入等。 2、统计指标:综合反映统计总体数量特征的名称,包括指标名称和指标数值两部分。 可分为数量指标和质量指标。数量指标是说明总体规模、总数量的指标,一般用绝对数表示;质量指标是说明总体结构、比例、强度等质方面的指标,一般用相对数或平均数表示。又按其作用和表现形式分为总量指标(绝对数)、相对指标(相对数)、平均指标(平均数)。 指标与标志的联系和区别: 区别:标志是说明总体单位特征的,而指标是说明统计总体特征的;指标都能用数字表示,而标志中的品质标志是用文字来描述的,不能用数值表示。指标一般是经过一定的汇总取得,而标志值一般是经过测量、观察直接取得的。标志一般不需要说明时间、地点、条件,但完整的指标必须说明时间、地点、条件等。 联系:大多数指标的数值是从总体单位的数量标志值综合而来;例如,某企业的工资总额是

统计学简答题

统计学简答题 1、统计的含义与本质是什么? (1)“统计”一词可以有三种含义:统计活动、统计数据、统计学 统计活动是对各种统计数据进行收集、整理并做出相应的推断、分析的活动,通常被划分为统计调查、统计整理、和统计分析三个阶段; 统计数据是通过统计活动获得的,用以表现研究现象特征的各种形式的数据; 统计学则是指导统计活动的理论和方法,是关于如何收集、整理和分析数据的科学。 (2)统计的本质是关于为何统计,统计什么,和如何统计的思想。 2、统计学的学科性质: 1、统计学就其研究对象而言,具有数量性、总体性和差异性的特点。统计学的研究对象是各种现象的数量方面。 2、统计学就其学科范畴而言,具有方法性、层次性和通用性的特点。 3、统计学就其研究方式而言,具有描述性和推断性的特点。 3、总体、样本、个体三者关系如何?试举例说明。 总体:就是统计研究的客观对象的全体,是由所有具有某种共同性质的事物所组成的集合体,有时也称为母体; 样本:就是从总体中抽区的一部分个体所组成集合,也称为子样;组成总体的每个个别事物就称为个体,也称为总体单位。 (1)总体与个体的关系(可变性) 总体容量随着个体数的增减可变大或变小; 随着研究目的的不同,总体中的个体可发生变化; 随着研究范围的变化,总体与个体的角色可以转换 (2)样本与总体的关系 样本是所要研究的对,而样本则是所要观测的对象,样本是总体的代表和缩影。 样本是用来推断总体的。 总体和样体的角色是可以改变的。 4、理解标志、指标、变量三者的含义?标志与指标的联系与区别? 标志是用以描述或体现个性特征的名称; 统计指标简称指标,是反映现象总体数量特征的概念及其数值; 从狭义上看,变量是指可变的数量标志;从广义上来看,变量不仅指可变的数量标志,也包括可变品质标志,因此,可变标志就是变量。 (1)标志与指标的区别:指标和标志说明的对象不同,指标说明总体的特征,标志则说明个体的特征;指标与标志的表现形式不同,指标是用数值来表现的,而标志则既能用文字来表现品质标志,也能用数字来表现数量标志。 (2)标志与指标的联系:标志是计算统计指标的依据,即统计指标数值是根据个体的标志综合表现而来的;由于总体与个体的确定是相对的,可以换位的,因而指标与标志的确定也是相对的、可以换位的;指标与标志同属于变量的范畴。 5、什么是统计指标体系?有哪些表现形式? 同一总体多个反面数量特征的、一系列相互联系的统计指标所形成的体系称为统计指标体系表现形式: 数学等式关系:若干统计指标之间可以构成一个等式关系 相互补充关系:各个指标相互配合,相互补充,从不同方面开说明现象的数量特征 相关关系:各个指标之间的存在着一定的相关关系 原因、条件和结果关系:若干指标中有的是原因,有的是条件有的则为结果

应用统计学练习题(含答案)

应用统计学练习题 第一章绪论 一、填空题 1.统计工作与统计学的关系是__统计实践____和___统计理论__的关系。 2.总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是__总体_的组成单位。 3.统计单体具有3个基本特征,即__同质性_、__变异性_、和__大量性__。 4.要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是__每一件产品__。 5.样本是从__总体__中抽出来的,作为代表_这一总体_的部分单位组成的集合体。 6.标志是说明单体单位特征的名称,按表现形式不同分为__数量标志_和_品质标志_两种。 7. 8.统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。 9.指标与标志的主要区别在于: (1)指标是说明__总体__特征的,而标志则是说明__总体单位__特征的。 (2)标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。 10.一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。 二、单项选择题 1.统计总体的同质性是指(A)。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志或数量标志 D.总体各单位具有若干互不相同的品质标志属性或数量标志值 2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D)。

A.全部工业企业 B.800家工业企业 C.每一件产品 D.800家工业企业的全部工业产品 3.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为(A)。 A.200家公司的全部职工 B.200家公司 C.200家公司职工的全部工资 D.200家公司每个职工的工资 4.一个统计总体( D)。 A.只能有一个标志 B.可以有多个标志 C.只能有一个指标 D.可以有多个指标 5.以产品等级来反映某种产品的质量,则该产品等级是(C)。 A.数量标志 B.数量指标 C.品质标志 D.质量指标 6.某工人月工资为1550元,工资是( B )。 A.品质标志 B.数量标志 C.变量值 D.指标 7.某班4名学生金融考试成绩分别为70分、80分、86分和95分,这4个数字是( D)。 A.标志 B.指标值 C.指标 D.变量值 8.工业企业的职工人数、职工工资是(D)。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 9.统计工作的成果是(C)。 A.统计学 B.统计工作 C.统计资料 D.统计分析和预测 10.统计学自身的发展,沿着两个不同的方向,形成(C)。 A.描述统计学与理论统计学 B.理论统计学与推断统计学 C.理论统计学与应用统计学 D.描述统计学与推断统计学

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

统计学复习提纲

统计学基础复习提纲 复习内容: 第一章:统计数据;第二章;数据搜集;第四章:数据分布特征的测度;第五章:抽样与参数估计;第六章:假设检验;第七章:相关与回归分析;第八章:时间序列分析和预测:第九章:指数。 重点内容: 第一章统计和数据 (1)统计的概念和应用(2)统计数据类型:分类数据、顺序数据、数值型数据;观测数据和实验数据;截面和时间序列数据。 (3)统计中的基本概念:总体与样本;参数与统计量;变量。 第二章数据搜集 (1)数据来源:直接来源和间接来源(2)调查设计:调查方案设计和调查问卷设计 (3)统计数据质量 第四章数据分布特征的测度 (1)集中趋势的测度:平均数;中位数和分位数;众数 (2)离散程度的度量:极差和四分位差;平均差;方程和标准差;离散系数 (3)偏态与峰态度量:偏态系数;峰态系数 第五、六章参数估计与假设检验 (1)参数估计的基本原理:点估计与区间估计(2)总体均值的区间估计和总体比率的区间估计(3)样本容量的确定(4)假设检验的基本原理:原假设与备择假设;两类错误与显著性水平;检验统计量与拒绝域。(5)总体均值的检验:大样本检验方法;小样本检验方法。第七章相关与回归分析 (1)变量间关系度量:相关关系的描述和测度;散点图与离散系数。 (2)一元线性回归:一元线性回归模型;参数的最小二乘估计;回归方程的拟合优度;显著性检验。(3)利用回归房产进行估计和预测 第八章时间序列分析与预测 (1)时间序列的分解和描述:图形描述;增长率分析 (2)预测方法的选择和估计 (3)平稳序列的预测:移动平均法;指数平滑法 (4)趋势序列的预测:线性趋势预测;非线性趋势预测

统计学简答题

1、描述统计与推断统计有何区别和联 系? 描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的方法。 联系:描述统计学和推断统计学是现代统计学的两个组成部分呢,相辅相成、缺一不可,描述统计学是现代统计学的基础和前提,推断统计学是现代统计学的核心和关键。 2、统计数据的类型有哪些?(P5-6) 按照计量尺度不同,可分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法可以分为观测数据和实验数据;按照被描述的现象与时间的关系可分为截面数据和时间序列数据。 3、简述数据误差来源?(P33-38) 统计数据的误差来源分为抽样误差和非抽样误差。抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差。非抽样误差是相对抽样误差而言的,是指除抽样误差之外的由于其他原因引起的样本观察结果与总体真值之间的差异。 4、衡量数据离散程度的指标有哪些 (P96-104) 衡量数据离散程度的指标有:1.异众比率,用于测度分类数据的离散程度,衡量众数对一组数据的代表程度;2.四分位差,用于测量顺序数据的离散程度,衡量中位数对一组数据的代表程度;3.方差和标准差,用于测度数据离散程度的最常用测度值,衡量均值对一组数据的代表程度。 5、为什么说正态分布是客观现象中最主 要的分布?(P142) 正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。 6、有人说,标准化与中心化的两个变量的 协方差就是它们的相关系数,你认为正 确吗?请说明理由? 7、请你说明小概率原理的含义?(P213, 最后一段) 一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但在多次重复试验中几乎是必然发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 8、评价估计量的标准有哪些?并解释它 们的含义(P179-180) 一般地说,一个好的估计量应具备三个标准:无偏性、有效性和一致性。 无偏性是指估计量分布的数学期望等于被估计的总体参数。有效性是指对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。一致性是指随着样本量的增大,点估计量的值越来越接近于被估总体的参数。 9、假设检验的理论基础和推理方法是什 么?(P210-213) 进行假设检验的基本原理就是小概率原理。小概率原理是说概率很小的事件(称为“小概率事件”)在一次试验中几乎是不可能发生的。 根据小概率原理进行假设检验的方法就是概率意义下的反证法,其思想是:为了检验原假设 H是否正确,我们首先假定“0H 正确”,然后来看在 H是正确的假定下能导出什么结果。如果导出一个与小概率原理相矛盾的结果,则说明“ H正确”的假定是错误的,即原假设 H不正确,于是我们应作出否定原假设 H的决策;如果没有导出与小概率原理相矛盾的结果,则说明“ H正确”的假定没有错误,即不能认为原假设 H是不正确的,于是我们应作出不否定原假设 H的决策。 10.假设检验的一般步骤?(P212-213) 假设检验的一般步骤:1.根据所研究问

统计学计算题例题学习资料

统计学计算题例题

第四章 1. 某企业1982年12月工人工资的资料如下: 要求:(1)计算平均工资;(79元) (2)用简捷法计算平均工资。 2. 某企业劳动生产率1995年比1990年增长7%,超额完成计划2%,试确定劳动生产率计划增长数。 7%-2%=5% 3. 某厂按计划规定,第一季度的单位产品成本比去年同期降低8%。实际 执行结果,单位产品成本较去年同期降低4%。问该厂第一季度产品单位成本计划的完成程度如何?104.35%( (1-4%)/(1-8%)*100%=96%/92%*100%=104.35%结果表明:超额完成4.35%(104.35%-100%)) 4. 某公社农户年收入额的分组资料如下:

要求:试确定其中位数及众数。中位数为774.3(元)众数为755.9(元) 求中位数: 先求比例:(1500-720)/(1770-720)=0.74286 分割中位数组的组距:(800-700)*0.74286=74.286 加下限700+74.286=774.286 求众数: D1=1050-480=570 D2=1050-600=450 求比例:d1/(d1+d2)=570/(570+450)=0.55882 分割众数组的组距:0.55882*(800-700)=55.882 加下限:700+55.882=755.882 5.1996年某月份某企业按工人劳动生产率高底分组的生产班组数和产量资料如 下: 率。64.43(件/人)

(55*300+65*200+75*140+85*60)/(300+200+140+60) 6.某地区家庭按人均月收入水平分组资料如下: 根据表中资料计算中位数和众数。中位数为733.33(元) 众数为711.11(元) 求中位数: 先求比例:(50-20)/(65-20)=0.6667 分割中位数组的组距:(800-600)*0.6667=66.67 加下限:600+66.67=666.67 7.某企业产值计划完成 103%,比去年增长5%。试问计划规定比去年增长 多少?1.94% (上年实际完成1.03/1.05=0.981 本年实际计划比上年增长 (1-0.981)/0.981=0.019/0.981=1.937%) 8.甲、乙两单位工人的生产资料如下:

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

统计学复习提纲(整理)

统计学复习提纲(学生用) 一、单选题 1.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。这里的参数是( C ) A.1000个消费者 B.所有在网上购物的消费者 C.所有在网上购物的消费者的平均花费 D.1000个消费者的平均花费 2.为了调查某学校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种抽样方法属于( D ) A.简单随机抽样 B.整群抽样 C.系统抽样 D.分层抽样 3.某班学生平均成绩是80分,标准差10分。如果已知该班学生的考试分数为对称分布,可以判断考试分数在70-90分之间的学生大约占( C )一个标准差范围 A. 95% B.89% C.68% D.99% 4.已知总体的均值为50,标准差为8,从该总体中随机抽取容量为64的样本,则样本均值的期望(等于总体均值)和抽样分布的标准差分别为( B ) A. 50,8 B. 50,1 C. 50,4 D. 8,8 5.根据某班学生考试成绩的一个样本,用95%的置信水平构造的该班学生考试分数的置信区间为75-85分。全班学生的平均分数( B&D )【有争议,两个中任选一个都对】A.肯定在这一区间内 B.有95%的可能在这一区间内 C.有5%的可能在这一区间内 D. 或者在区间内,或者不在。 6.一项研究发现,2000年新购买小汽车的人中有40%是女性,在2005年所做的一项调查中,随机抽取120个新车主中有57人为女性,检验2005年薪车主中女性的比

例是否显著增加,建立的原假设和备择假设为( C ) A. H 0: π=40%,H 1: π≠40% B. H 0: π≥40%,H 1: π<40% C. H 0: π≤40%,H 1: π>40% D. H 0: π<40%,H 1: π≥40% 7.在回归分析中,因变量的预测区间估计是指( B )。 A. 对于自变量x 的一个给定量x 0,求出因变量y 的平均值的区间 B. 对于自变量x 的一个给定量x 0,求出因变量y 的个别值的区间 C. 对于自变量y 的一个给定量y 0,求出自变量x 的平均值的区间 D. 对于自变量y 的一个给定量y 0,求出自变量x 的个别值的区间 8.在多元线性回归分析中,如果F 检验表明线性关系显著,则意味着( A ) A. 至少有一个自变量与因变量之间的线性关系显著 B. 所有自变量与因变量之间的线性关系显著 C. 至少有一个自变量与因变量之间的线性关系不显著 D. 所有自变量与因变量之间的线性关系不显著 9.如果时间序列的逐期观察值按一定的增长率增长(即增长的增长)或衰落,则适合的预测模型是( D ) A.移动平均模型 B.指数平滑模型 C.线性模型 D.指数模型 10.设p 为商品价格,q 为销售量,则指数∑∑0010 q p q p 的实际意义是综合反映了( C ) A. 商品销售额的变动程度 B.商品价格变动对销售额的影响 [D. 商品价格和销售量的变动对销售额的影响 11. 根据所使用的计量尺度,统计数据分为( A ) A.分类数据,顺序数据和数值型数据 B.观测数据和试验数据

相关文档