文档视界 最新最全的文档下载
当前位置:文档视界 › 生物统计学第六章

生物统计学第六章

生物统计学第六章
生物统计学第六章

第六章参数估计

6.1以每天每千克体重52 mol 5-羟色胺处理家兔 14天后,对血液中血清素含量的影响如下表[9]:

y/(g · L-1)s/(g · L-1)n

对照组 4.200.3512

建立对照组和5-羟色胺处理组平均数差的0.95置信限。

答:程序如下:

options nodate;

data common;

alpha=0.05;

input n1 m1 s1 n2 m2 s2;

dfa=n1-1; dfb=n2-1;

vara=s1**2; varb=s2**2;

if vara>varb then F=vara/varb;

else F=varb/vara;

if vara>varb then Futailp=1-probf(F,dfa,dfb);

else Futailp=1-probf(F,dfb,dfa);

df=n1+n2-2;

t=tinv(1-alpha/2,df);

d=abs(m1-m2);

lcldmseq=d-t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1 /n2));

ucldmseq=d+t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1 /n2));

k=vara/n1/(vara/n1+varb/n2);

df0=1/(k**2/dfa+(1-K)**2/dfb);

t0=tinv(1-alpha/2,df0);

lcldmsun=d-t0*sqrt(vara/n1+varb/n2);

ucldmsun=d+t0*sqrt(vara/n1+varb/n2);

cards;

12 4.20 0.35 9 8.49 0.37

;

proc print;

id f;

var Futailp alpha lcldmseq ucldmseq lcldmsun ucldmsun;

title1 'Confidence Limits on the Difference of Means';

title2 'for Non-Primal Data';

run;

结果见下表:

Confidence Limits on the Difference of Means

for Non-Primal Data

F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN

1.11755 0.42066 0.05 3.95907 4.62093 3.95336 4.62664

首先,方差是具齐性的。在方差具齐性的情况下,平均数差的0.95置信下限为3.959 07,置信上限为4.620 93。0.95置信区间为3.959 07 ~ 4.620 93。

6.2不同年龄的雄岩羊角角基端距如下表[27]:

年龄/a y/cm s/cm n

建立平均数差的0.95置信区间,对应于H0:μ1-μ2=0,H A:μ1-μ2 ≠ 0的假设,推断两者间的差异显著性。

答:结果如下:

Confidence Limits on the Difference of Means

for Non-Primal Data

F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN

1.26433 0.34528 0.05 0.93873 4.84127 0.90910 4.87090

因为方差具齐性,所以平均数差的0.95置信区间为:0.938 73 ~ 4.841 27。置信区间内不包括0,因此两者间的差异是显著的。

6.3了解我国风险识别、风险评价和风险缓解的现状,对于应对突发事件有重要作用。以下是关于应对突发公共卫生事件能力调查(共调查了60个单位)的部分数据[28]:

6

作重点

分别计算上述三个项目的0.95置信区间。

答:程序如下:

options nodate;

data clbi;

n=60; m=35; p=m/n; alpha=0.05;

do lphi=0.0001 to p by 0.00001;

ltailp=1-probbnml(lphi,n,m-1);

if abs(ltailp-alpha/2)<0.00001 then goto lower;

end;

lower:put m n p ltailp lphi;

do uphi=p to 0.9999 by 0.00001;

utailp=probbnml(uphi,n,m);

if abs(utailp-alpha/2)<0.00001 then goto upper;

end;

upper:put m n p utailp uphi;

proc print;

id m;

var n p ltailp utailp lphi uphi;

title 'Confidence Limits for Binomial Population';

run;

结果如下:

项目(1):

Confidence Limits for Binomial Population

M N P LTAILP UTAILP LPHI UPHI

35 60 0.58333 0.024993 0.025006 0.44883 0.70931

项目(2):

Confidence Limits for Binomial Population

M N P LTAILP UTAILP LPHI UPHI

17 60 0.28333 0.024993 0.025002 0.1745 0.41443

项目(3):

Confidence Limits for Binomial Population

M N P LTAILP UTAILP LPHI UPHI

6 60 0.1 0.024996 0.025008 0.03759 0.20505

6.4乳腺癌患者有着沉重的心理负担,主要表现为:焦虑、怀疑和否认、恐惧、依赖、自私、悲观失望等。经心理护理后,在很多方面都到改善,护理前

y )见下表[29]:

和护理后的评分(s

表现心理护理前/评分心理护理后/评分样本含量(n)

计算上述各种表现平均数差的0.95置信区间。(注意方差不具齐性的情况。)答:结果见下表:

F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN

6.5紫杉烷类物质具有优良的抗癌作用,近年来已成功地开发出紫杉烷类

抗癌新药紫杉醇和多烯紫杉醇。由此也引起人们对药源植物云南红豆杉的关注,测定了紫杉烷类物质在不同类型云南红豆杉中的含量。下面给出其中的两种物质的测定结果[30]:

种类y/%s/%n

计算两种物质平均数差的0.95置信区间,并以H0:μ1-μ2=0,H A:μ1-μ2 ≠ 0的假设推断两者间的差异显著性。

答:结果见下表:

Confidence Limits on the Difference of Means

for Non-Primal Data

F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN

1.28444 0.037999 0.05 .00026156 .0021384 .00026152 .0021385

F的显著性概率P=0.037 999,P >0.025,方差具齐性。方差具齐性时的0.95置信区间为:0.000 261 56 ~ 0.002 138 4。在置信区间内不包括0,因此紫杉醇和三尖杉宁碱的含量差异显著。

6.6流行病学调查表明,高同型半胱氨酸(Homocysteine,Hcy)是导致动脉粥样硬化性血管病的一个新的独立危险因素。测定了脑梗死组和对照组的Hcy,

y )如下表[31]:

结果(s

组 别

n Hcy/(μ -1

计算两组平均数差的0.95置信区间,并解释所计算的结果。

答:结果如下:

Confidence Limits on the Difference of Means

for Non-Primal Data

F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN

2.69346 .0000020008 0.05

3.92068 6.61932 3.93589 6.60411

可以很明显看出,方差是不具齐性的。0.95置信区间为:3.935 89 ~ 6.604

11。置信区间内不包含0,因此脑梗死病人的同型半胱氨酸显著高于对照组。高同型半胱氨酸很可能是动脉粥样硬化性血管病的危险因素之一。

6.7 30名受试者同时采取两份静脉血,分别用传统的魏氏法和自动血沉仪

测定血沉[32],结果为分别:)h /mm (7266.0=魏氏法-血沉仪法y ,

)mm/h (5993.2=魏氏法-血沉仪法s 。在α = 0.05水平上,通过置信区间检验两种方法的差异显著性。

答:所用程序如下:

options nodate;

data esr;

input n mean std ;

alpha=0.05;

talpha=-tinv(alpha/2,n-1);

lclm=mean-talpha*std/sqrt(n);

uclm=mean+talpha*std/sqrt(n);

cards;

30 0.2667 2.9935

;

proc print;

id n;

var mean std alpha lclm uclm ;

title1 'Confidence Limits for Mu';

title2 'Sigma Is Unknown';

run;

结果见下表:

Confidence Limits for Mu

Sigma Is Unknown

N MEAN STD ALPHA LCLM UCLM

30 0.2667 2.9935 0.05 -0.85109 1.38449

在置信区间内包含0,因此传统魏氏法和自动血沉仪法测得的结果差异不显著。

6.8生长激素缺乏症的患儿,在用生长激素治疗前和治疗6个月后的身高和体重数据如下表[33]:

项目治疗前

s

y±治疗后

s

样本含量n

先用t检验,推断治疗前和治疗后的平均身高和平均体重在α= 0.05水平上的差异显著性,再用治疗前和治疗后的平均数差数的0.95置信区间验证。你认为这是一种很好的实验设计吗?怎样做检验的效果可能会更好?

答:1. 先做成组数据t检验:

(1)身高:

T-Test for Non-Primal Data

F FUTAILP T DF TUTAILP

1.17361 0.36536 1.51668 38.0000 0.068812

1.17361 0.36536 1.51668 37.7591 0.068838

(2)体重:

T-Test for Non-Primal Data

F FUTAILP T DF TUTAILP

3.82025 .0026673 3.05542 38.0000 .0020482

3.82025 .0026673 3.05542 28.3091 .0024304

2. 计算置信区间:

(1)身高:

Confidence Limits on the Difference of Means

for Non-Primal Data

F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN

1.17361 0.36536 0.05 -

2.0085214.0085 -2.01020 14.0102

(2)体重:

Confidence Limits on the Difference of Means

for Non-Primal Data

F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN

3.82025 .0026673 0.05 1.11356 5.48644 1.08871 5.51129

根据问题的要求,本例的t检验应为双侧检验,当t的显著性概率小于0.025时拒绝H0。检验的结果,身高治疗前后的差异不显著。从置信区间计算的结果,可以看出,身高的置信区间包含0,因此身高的差异不显著,体重的置信区间不包含0,因此体重的差异显著。统计假设检验与置信区间得到的结果是一致的。

另外,本例的实验设计是配对设计,但在处理数据时,作者按成组设计计算的,虽不能算是错误,但减低了检验效率。

6.9血小板可能是冠心病(CHD)血栓形成的关键因素。一项研究,测定了92例CHD患者血小板的一些相关指标,结果如下[34]:123456

项目

结果

(s

y )0.95置信区间

L-PLT⑥/

(109·L-1)

8.50±1.808.127 23 8.872 77注:①PLT:血小板数。

生物统计学期末考试上机考试部分 复习试卷B

云南师范大学2010~2011学年下学期期末统一考试 高级生物统计学实验(期末) 试卷 学院 专业 年级 学号 姓名 考试方式(闭卷或开卷): 闭卷 考试时量:60分钟 试卷编号(B 卷): 题号 一 二 三 四 五 总分 评卷人 得分 一、下表为某种动物在不同温度下的代谢率的变化,试比较温度对其代谢率 有无影响?并对SSR 法其进行多重比较 温度(℃) 代谢率(mlO 2/g.h ) -5 2.78 3.80 4.87 4.68 5.51 5.67 5.10 2.79 2.60 3.14 4.26 3.72 3.48 2.86 3.37 3.32 4.35 4.59 4.66 4.83 5.16 -5 -5 -5 -5 -5 -5 .00 .00 .00 .00 .00 .00 .00 5.0 5.0 5.0 5.0 5.0 5.0 5.0

ANOVA 数据 7.1972 3.598 5.684 .012 11.39718.633 18.593 20 Between Groups Within Groups Total Sum of Squares df Mean Square F Sig. 经但因素方差分析的:f=5.684, p=0.012,差异显著,说明多有作用, 数据 Duncan a 7 3.2643 7 4.32577 4.6300 1.000.484 温度231Sig. N 12Subset for alpha = .05 Means for groups in homogeneous subsets are displayed. Uses H armonic Mean Sample Size = 7.000. a. 二、为调查红绿色盲是否与性别有关,某单位调查结果如下: 色盲 非色盲 男 32 168 女 13 232 问红绿色盲是否与性别有关? 三、试用交互误差图比较不同季节某种动物的胃长(cm )的变化?并绘制出其在 95%置信带 季节 胃长(cm )

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() x N(0,1)B.11 - x ~N(0,1)C.91 - x ~N(0,1)D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为 ( )。 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 12. 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F 14. 15.已知随机变量x服从N (8,4),P(x < 4.71)(填数字) 四.综合分析题(共60分)

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

高级生物统计学基础习题详解

高级生物统计学基础习题 计算题 1、某小麦品种的常年平均亩产量为μ=210公斤, 现从外地引种一新品种, 在6 个试验点试种, 得平均亩产是X=224公斤,其标准差为S=4.63公斤, 试问该新品种的产量是否与原来的品种有显著差异?(α=0.05) 答: (1)假设H0:μ=μO;对H A: μ≠μO (2)S y=S/√n= 4.63/√6=1.891 T=(x-μ)/ S y=7.41 (3)按自由度V=5查两尾表得: t0.05=2.571. 现实得∣t∣ >t0.01,故P<0.05 (4)推断: H Aμ≠μ,即新品种产量与原品种产量有显著差异。 2.有一水稻品种的比较试验, 参试品种有4个, 对照品种一个(CK), 随机区组设计, 设置三次重复, 小区面积0.03亩, 试验结果如下: 进行方差分析 变异来 源 平方和df 均方F值p值 区组8.8573 2 4.4287 2.7702 0.1219 品种81.8307 4 20.4577 12.7967 0.0015 误差12.7893 8 1.5987 总和103.4773 14 通过方差分析表可以看出,区组间差异不显著,而品种间差异显著。 SSR多重比较 品种均值5%显著 水平1%极显著水平 C 29.9333 a A B 29.1667 ab A A 27.7667 ab A D 27.3667 b A CK 23.2000 c B 3.有一杂交水稻品种, 田间随机抽样调查10株主穗的穗粒数, 得以下数据: 株号 1 2 3 4 5 6 7 8 9 10 穗粒数110 112 128 131 125 104 117 121 115 126 试描述这组数据的主要特征特性.

生物统计学考试题及答案

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专 业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已 知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。

A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 2、态分布不具有下列哪种特征( )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( )。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ,则x 在区间]96.1,[σμ+-∞的概率为( )。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、 方差分析时,进行数据转换的目的是( )。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对 三、简答题;(每小题6分,共30分 ) 1、方差分析有哪些步骤? 2、统计假设是?统计假设分类及含义? 3、卡方检验主要用于哪些方面? 4、显著性检验的基本步骤? 5、平均数有哪些?各用于什么情况? 四、计算题;(共4题、50分) 1、进行大豆等位酶Aph 的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。( 99 .52 05.0,2=χ, 81 .7205.0,3=χ)(10分) 野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布 物 种 等位基因型 1 2 3 野生大豆 29 68 96

生物统计学答案 第一章 统计数据的收集与整理

第一章 统计数据的收集与整理 1.1 算术平均数是怎样计算的?为什么要计算平均数? 答:算数平均数由下式计算:,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点, 或是说是样本数据的代表。 1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。 1.4 完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 1.5 下表是我国青年男子体重(kg )。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。 66 69 64 65 64 66 68 65 62 64 69 61 61 68 66 57 66 69 66 65 70 64 58 67 66 66 67 66 66 62 66 66 64 62 62 65 64 65 66 72 60 66 65 61 61 66 67 62 65 65 61 64 62 64 65 62 65 68 68 65 67 68 62 63 70 65 64 65 62 66 62 63 68 65 68 57 67 66 68 63 64 66 68 64 63 60 64 69 65 66 67 67 67 65 67 67 66 68 64 67 59 66 65 63 56 66 63 63 66 67 63 70 67 70 62 64 72 69 67 67 66 68 64 65 71 61 63 61 64 64 67 69 70 66 64 65 64 63 70 64 62 69 70 68 65 63 65 66 64 68 69 65 63 67 63 70 65 68 67 69 66 65 67 66 74 64 69 65 64 65 65 68 67 65 65 66 67 72 65 67 62 67 71 69 65 65 75 62 69 68 68 65 63 66 66 65 62 61 68 65 64 67 66 64 60 61 68 67 63 59 65 60 64 63 69 62 71 69 60 63 59 67 61 68 69 66 64 69 65 68 67 64 64 66 69 73 68 60 60 63 38 62 67 65 65 69 65 67 65 72 66 67 64 61 64 66 63 63 66 66 66 63 65 63 67 68 66 62 63 61 66 61 63 68 65 66 69 64 66 70 69 70 63 64 65 64 67 67 65 66 62 61 65 65 60 63 65 62 66 64 答:首先建立一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat 。所用的SAS 程序和计算结果如下: proc format; value hfmt 56-57='56-57' 58-59='58-59' 60-61='60-61' 62-63='62-63' 64-65='64-65' 66-67='66-67' 68-69='68-69' 70-71='70-71' 72-73='72-73' 74-75='74-75'; run; n y y n i i ∑== 1

高级生物统计学基础习题

计算题 1、某小麦品种的常年平均亩产量为μ=210公斤, 现从外地引种一新品种, 在6 个试验点试种, 得平均亩产是X=224公斤,其标准差为S=4.63公斤, 试问该新品种的产量是否与原来的品种有显著差异?(α=0.05) 2.有一水稻品种的比较试验, 参试品种有4个, 对照品种一个(CK), 随机区组设计, 设置三次重复, 小区面积0.03亩, 试验结果如下: 进行方差分析 3.有一杂交水稻品种, 田间随机抽样调查10株主穗的穗粒数, 得以下数据: 株号 1 2 3 4 5 6 7 8 9 10 穗粒数110 112 128 131 125 104 117 121 115 126 试描述这组数据的主要特征特性. 4、有一水稻品种和栽插密度的两因子试验, 参试品种4个(a=4), 栽插密度3个(b=3), 设 5、有一晚稻品种的联合区域试验, 参试品种6个, 对照品种一个(CK), 共7个品种随机区组试验, 设置三次重复, 小区面积0.04亩, 试验结果如下: 各品种的小区平均产量(公斤)为: XA=19.4 XB=20.8 XC=12.5 XD=15.8 XE=20.4 XF=16.8 X(CK)=17.6 该试验的目的是对参试品种与指定的对照品种(CK)进行比较, 请继续进行多重比较, 采用LSDα法测验(α=0.05) 6、田间随机调查10株紧凑型玉米品种"掖单13号"的株高(CM)和果穗籽粒重(克),得以下数据: 株序号 1 2 3 4 5 6 7 8 9 10 株高191 192 189 185 201 193 198 211 210 215 穗重169 167 156 141 144 150 154 156 138 157 试问该两个性状中哪一个的变异程度大? 7、有一杂交玉米的品比试验, 参试品种6个, 对照品种一个, 共7个品种, 随机区组设

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

2017福师《生物统计学》答案

一、单选题(共 32 道试题,共 64 分。) V 1. 最小二乘法是指各实测点到回归直线的 A. 垂直距离的平方和最小 B. 垂直距离最小 C. 纵向距离的平方和最小 D. 纵向距离最小 2. 被观察到对象中的()对象称为() A. 部分,总体 B. 所有,样本 C. 所有,总体 D. 部分,样本 3. 必须排除______因素导致“结果出现”的可能,才能确定“结果出现”是处理因素导致的。只有确定了______,才能确定吃药后出现的病愈是药导致的。 A. 非处理因素,不吃药就不可能出现病愈 B. 处理因素,不吃药就不可能出现病愈 C. 非处理因素,吃药后确实出现了病愈 D. 处理因素,吃药后确实出现了病愈 4. 张三观察到李四服药后病好了。由于张三的观察是“个案”,因此不能确定______。 A. 确实进行了观察 B. 李四病好了 C. 病好的原因 D. 观察结果是可靠的 5. 四个样本率作比较,χ2>χ20.05,ν可认为

A. 各总体率不同或不全相同 B. 各总体率均不相同 C. 各样本率均不相同 D. 各样本率不同或不全相同 6. 下列哪种说法是错误的 A. 计算相对数尤其是率时应有足够的观察单位或观察次数 B. 分析大样本数据时可以构成比代替率 C. 应分别将分子和分母合计求合计率或平均率 D. 样本率或构成比的比较应作假设检验 7. 总体指的是()的()对象 A. 要研究,部分 B. 观察到,所有 C. 观察到,部分 D. 要研究,所有 8. 以下叙述中,除了______外,其余都是正确的。 A. 在比较未知参数是否不等于已知参数时,若p(X>x)<α/2,则x为小概率事件。 B. 在比较未知参数是否等于已知参数时,若p(X=x)<α,则x为小概率事件。 C. 在比较未知参数是否大于已知参数时,若p(X>x)<α,则x为小概率事件。 D. 在比较未知参数是否小于已知参数时,若p(X

生物统计学课程简介-2008

生物统计学 课程代码:81036000 课程名称:生物统计学 英文名称:Biostatistics 学分:2 开课学期:第六学期 授课对象:生物类和药学专业本科学生先修课程:高等数学 课程主任:刘建讲师硕士 课程简介:(标题黑体、五号) 生物统计学是综合性大学中生命科学和生物技术专业的主要专业课程之一。主要介绍讲述清楚生物类试验的内容与要求、明确本课程与试验研究关系,让学生学习与理解试验设计基本原理与基本方法,教学中力求深入浅出地把描述统计与推断统计中一些基本概念与原理讲解的清晰易懂。对于试验设计及统计分析常见方法的介绍要条理清晰、层次分明,具有可操作性。统计分析对试验设计的反馈作用对于解决实际问题具有非常重要的指导价值,尽可能在案例教学中让学生熟练掌握,达到举一反三的目的。通过让学生做一些习题,上电子计算机做练习,帮助学生进一步加深对所学内容的理解,巩固所学的知识与技能。通过本课程的学习,使学生掌握基础的生物统计学的基本理论、基础知识,并能得到一些基本技能的训练,为进一步的学习和工作打下扎实的基础。 实践教学环节:(标题黑体、五号) 本课程含有16学时的上机实验课,通过这些实验使学生掌握生物统计学的基本理论和方法,能够设计一定复杂程度的试验方案,解决毕业论文和今后工作、学习中遇到的一定复杂程度的生物学问题。

课程考核:(标题黑体、五号) 为必考课程,考试形式:闭卷 指定教材:(标题黑体、五号) 《生物统计学》(第二版),杜荣骞.北京.高等教育出版社2003 参考书目:(标题黑体、五号) 【1】生物统计学李春喜、王文林、北京.科学出版社1997。 【2】SPSS for Windows统计分析卢纹岱、北京.电子工业出版社2004 第三版。

关于生物统计学基本概念及公式

是以概率理论为基础,研究生命科学中随机现象规律性的应用数学科学。涉及到医学科学研究的设计、资料搜集、归纳、分析与解释的一门应用性基础学科、 二、科学研究的基本程序 1、提出一个欲待研究的问题: 2、科学研究设计:专业设计、统计学设计: 确定研究对象,拟定研究因素及其分配,如何执行随机、对照与重复的统计学原则,如何观察与度量效应,以及数据收集、整理与分析的方法,通过合理的、系统的安排,达到控制系统误差,以尽可能少的资源消耗(最小的人力、物力、财力和时间)获取准确可靠的信息资料及可信的结论,使效益最大化。 3、获取试验与观察的资料,又称为搜集资料 4、数据审核与计算机录入 5、分析资料 规律进行检测与描述。 (confidence interval)估计与统计学假设检验(hypothesis test)。统计学分析过程按变量的多寡可分为单变量分析与多重变量分析。 6、分析结果的合理解释(Explication of results): 研究中应注意的问题 1、统计学结论的正确与否取决于统计学分析数据的真实性、准确性以及研究样本对研究总体的代表性。 2、尽可能地控制系统误差是统计分析数据真实性、准确性的保证。 3、随机化抽样是确保样本数据对研究总体具有代表性的重要过程。 ,个体的许多属性(如年龄、性别、血浆胆固醇等)存在变异性,统计学上将反 ; 针对不同类型的属性,需采用不同类型的变量,因而产生不同类型的资料。 根据研究目的所确定的具有相同性质的观察单位的集合成为总体(母体)。从同一总体中通过随机化过程抽取的部分观察单位称为样本(子样)。 组与对照组的过程。 与总体的参数不等,或多个样本的统计量存在差异性称为抽样误差。 A的发生概率记为P(A)。 概率的取值在0 到1之间,若P=1或P=0的事件称为必然事件,若0

生物统计学

生物统计学习题集 生物统计学课程组编写

第一章概论 1.什么是生物统计学生物统计学的主要内容和作用是什么 2.解释并举例说明以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 3.误差与错误有何区别 4.田间试验有哪些特点保证田间试验质量的基本要求有哪些

第二章试验资料的整理与特征数的计算 1.试验指标试验因素因素水平试验处理试验小区总体样本样本容量随机样本总体准确性精确性 2.什么是次数分布表什么是次数分布图制表和绘图的基本步骤有那些制表和绘图时应注意什么 3.标准误与标准差有何联系与区别 4.算术平均数与加权平均数形式上有何不同为什么说他们的实质是一致的 5.平均数与标准差在统计分析中有什么用处他们各有哪些特征 6.试验资料分为哪几类各有何特点 7.简述计量资料整理的步骤。 8.常用的统计表和统计图有哪些 9.算术平均数有哪些基本性质 10.总体和样本差的平均数、标准差有什么共同点又有什么联系和区别 11.在对果树品种调查研究中,经观测所得的干周、冠高、冠幅、新梢生长量、萌芽率、花数、果数、座果率、单果重、产量等一系列数量资料,哪些是连续性数量,哪些是非连续性数量 -1 试根据所给资料编制次数分布表。 13.根据习题12的次数分布表,绘制直方图和多边形图,并简述其分布特征。

14.根据习题12的资料,计算平均数、标准差和变异系数。 15.根据习题12的资料,计算中位数,并与平均数进行比较。 16.试计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。 24号:19,21,20,20,18,19,22,21,21,19 金皇后:16,21,24,15,26,18,20,19,22,19

《生物统计学》期末考试试卷

《生物统计学》期末考试试卷 一 单项选择(每题3分,共21分) 1.设总体服从),(2 σμN ,其中μ未知,当检验0H :220σσ=,A H :220σσ≠时,应选 择统计量________。 A. 2 (1)n S σ- B. 2 20(1)n S σ- X X 2.设123,,X X X 是总体2 ( , )N μσ的样本,μ已知,2 σ未知,则下面不是统计量的是_____。 A. 123X X X +- B. 41i i X μ=-∑ C. 2 1X σ+ D. 4 2 1 i i X =∑ 3.设随机变量~(0,1)X N ,X 的分布函数为()x Φ,则( 2)P X >的值为_______。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4.假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布,则每升饮水中有3个大肠杆菌的概率是________。 A.63e μ μ- B.36e μ μ- C.36e μ μ- D. 316 e μ μ- 5.在假设检验中,显著性水平α的意义是_______。 A. 原假设0H 成立,经检验不能拒绝的概率 B. 原假设0H 不成立,经检验不能拒绝的概率 C. 原假设0H 成立,经检验被拒绝的概率 D. 原假设0H 不成立,经检验被拒绝的概率 6.单侧检验比双侧检验的效率高的原因是________。 A .单侧检验只检验一侧 B .单侧检验利用了另一侧是不可能的这一已知条件 C .单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7.比较身高和体重两组数据变异程度的大小应采用_____。 A .样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数

《生物统计学》教学大纲

《生物统计学》教学大纲 课程名称:生物统计学 课程类型:范围选修课-基础课 学时:56学时,3.5学分 适用对象:农学、植物保护、生物技术、生物科学、草业科学等本科专业先修课程:高等数学、线性代数、概率论与数理统计、植物学、植物生理学、遗传学等课程 一、课程性质、目的与任务以及对先开课程要求 统计学是论述收集、分析并解释数字信息的科学,生物统计学则是一门运用统计学的原理和方法,研究生物学数据资料的一般统计学。统计方法是现代生物学研究不可缺少的工具。正确的统计分析能够帮助我们正确认识事物客观存在的规律性。 概率论与数理统计等先开课程的重点是讲述没有量纲或单位抽象的数量规律,为生物学科应用这些规律打基础。 二、教学重点及难点 本课程教学的全过程可以看成是一个生物信息搜集、处理、分析,从而提炼新的生物信息的过程。教学重点是通过生物现象的数量观察、对比、归纳和分析,揭示那些困惑费解的生物学问题,从偶然性的剖析中,发现事物的必然性,指导生物科学的理论和实践。本课程的难点是概念较多、理论抽象、系统严密、实践性强、公式复杂、符号繁多、计算量大,因此,教学安排上除精讲48学时外,有针对性的安排上机操作8学时。 三、与其他课程关系 生物统计学与数学有密切关系,现代统计学用到了较多的数学知识,研究理论生物统计学的人需要有较深的数学功底,应用统计方法的人也应具备良好的数学基础。统计学又是一门应用性很强的学科,几乎生物学科所有的门类都要研究和分析数据,掌握生物学类学科专业基础课和专业课程知识有利于对统计分析的结果做出合理的解释和分析。 四、教学内容、学时分配及基本要求 绪论(1学时) 基本要求:理解什么是统计?什么是统计学;统计数据与统计学的关系,描述统计与推断统计内涵;统计方法能解决生物学科中哪些问题,了解生物 统计学的产生与发展。

生物统计学各章题目(含答案)

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现 代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变 量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). 12 2--∑∑n n x x )(

生物统计学课程设计范文

符号说明 编写中文 A1 大一 A2 大二 A3 大三 A4 大四 B1 男生 B2 女生 1、引言 1.1研究的目的意义 当代大学生的综合体质普遍下降,健康状况普遍欠佳,坚持锻炼身体的意识不强,学生身体机能各项指标偏低,下肢力量较弱,耐力指标评价较低。 为了进一步了解和改善大学生的身体状况,加强大学生对体育锻炼的重要性的认识,促进学生养成坚持锻炼身体的好习惯,以及为了深化教育改革,全面推行素质教育,树立“健康第一”的指导思想,切实加强体育锻炼工作,落实《国家大学生体质健康标准》的要求,我们就我校2011-2012学年度在校大学生的综合体质健康测试结果进行分析研究,旨在客观反映和监测大学生的综合体质状况,根据大学生的综合体质状况提出合理、适宜的体育加强锻炼方案,切实提高在校大学生的综合体质水平,并且检查体育教学对学生的健康方面的效果,有利于了解学生的健康状况,为推进更适合大学生的身体健康水平提高的体育教学改革提供依据,促进大学生体质健康发展和养成终身体育锻炼习惯提供依据;并为其他高校提高大学生健康水平提供参考依据。 2、材料与方法 河南理工大学新校区有20多个学院,2万多名学生,男生人数多于女生。不同年级的课程安排相异,学习量各不相同,学生对体育锻炼的重视程度也有所差,不同年级的学生综合体质亦有不同。在本地区进行试验研究具有代表性。 综合体质健康标准测试成绩是按照教育部,国家体育总局颁布的《学生体质健康标准》给予的,标准将每一测试项目所反映的身体素质状况按照体质健康要求分别给予不同的权重。其中身高、体重权重值为0.10,肺活量权重值为0. 20,跑步权重值为0. 30,立定跳远权重值为0. 20,坐位体前屈权重值为0. 20。以此来衡量学生的综合体质具有一定的科学性。 2.1研究对象:河南理工大学新校区2011年度在校大学生。 2.2 、样本来源

生物统计学复习要点

1、生物统计学主要包括试验设计和统计分析 2、统计学的发展经历了3个阶段:古典记录统计学,近代描述统计学和现代推断统计学 3、生物统计学是数理统计在生物学研究中的应用,它是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。 4、英国统计学家R.A.Fisher于1923年发展了显著性检验及估计理论,提出来F分布和F 检验,创立了方差和方差分析,在从事农业试验及数据分析研究时,他提出了随机区组法、拉丁方法和正交试验的方法 5、常用的统计学术语有:总体与样本,参数与统计数,变量与资料,因素与水平,处理与重复,效应与互作,准确性与精确性,误差与错误 6、总体按所含个体的数目可分为有限总体和无限总体,n小于30的样本称为小样本,n大于等于30的为大样本 7、参数也称参量,是对一个总体特征的度量。统计数也称统计量,是由样本计算所得的数值。 8、准确性反映测定值与真值符合程度的大小,而精确性则是反映多次测定值的变异程度 9、生物统计学的基本作用:1)提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征2)判断试验结果的可靠性3)提供由样本推断总体的方法4) 提供试验设计的一些重要原则 10、试验资料具有集中性和离散性两种基本特征。平均数是反映集中性的特征数,主要包括算术平均数,中位数,众数,几何平均数等;反映离散性的特征数是变异数,主要包括极差,方差,标准差和变异系数 11、资料可分为数量性状资料和质量性状资料 12、数量性状资料分为计数资料(非连续变量资料)和计量资料(连续变量资料) 13、资料的来源(资料的搜集方法)一般有两个,调查和试验 14、常用的抽样方法有随机抽样,顺序抽样,典型抽样 15、随机抽样的方法:简单随机抽样,分层随机抽样,整体抽样,双重抽样 16、计量资料的整理步骤:1,计算全距2.确定组数和组距(样本容量30--60,分组数为5--8)3,确定组限和组中值4,分组,编制次数分布表 17、常用的统计图有条形图,饼图,直方图,多边形图,散点图(会辨认) 18、算术平均数的算法:直接计算法,减去(或加上)常数法,加权平均法 19、算术平均数的重要特性:1)样本中各观测值与其平均数之差称为离均差,其总和等于零2)样本中各观测值与其平均数之差平方的总和,较各观测值与任一数值(不包括平均数)之差的平方和最小,即离均差平方和为最小 20、标准差的特性:1,标准差的大小受多个观测值的影响,如果观测值与观测值之间差异较大,其离均差也大,因而标准差也大,反之则小2,计算标准差时,如将各观测值加上或减去一个常数a,其标准差不变,将各观测值乘以或除以一个常数a,则标准差扩大或缩小了a倍3,在正态分布情况下,一个样本变量的分布情况可作如下估计:在平均数两侧的1s范围内,观测值个数约为观测值总个数的68.26%,在平均数两侧的2s范围内,观测值个数约为观测值总个数的95。45%,在平均数两侧的3s范围内,观测值个数约为观测值总个数的99,73% 21、标准差的作用:1,表示变量分布的离散程度2,利用标准差的大小,可概括地估计出变量的次数分布极各类观测值在总体中所占的比例3,估计平均数的标准误4,进行平均数的区间估计和变异系数计算 22、标准差除以样本平均数,得出的百分比就是变异系数

相关文档