文档视界 最新最全的文档下载
当前位置:文档视界 › excel中的概率统计(非常好的资料)

excel中的概率统计(非常好的资料)

excel中的概率统计(非常好的资料)
excel中的概率统计(非常好的资料)

数理统计实验

1Excel基本操作

1.1 单元格操作

1.1.1单元格的选取

Excel启动后首先将自动选取第A列第1行的单元格即A1(或a1)作为活动格,我们可以用键盘或鼠标来选取其它单元格.用鼠标选取时,只需将鼠标移至希望选取的单元格上并单击即可.被选取的单元格将以反色显示.

1.1.2选取单元格范围(矩形区域)

可以按如下两种方式选取单元格范围.

(1) 先选取范围的起始点(左上角),即用鼠标单击所需位置使其反色显示.然后按住鼠标左键不放,拖动鼠标指针至终点(右下角)位置,然后放开鼠标即可.

(2) 先选取范围的起始点(左上角),即用鼠标单击所需位置使其反色显示.然后将鼠标指针移到终点(右下角)位置,先按下Shift键不放,而后点击鼠标左键.

1.1.3选取特殊单元格

在实际中,有时要选取的单元格由若干不相连的单元格范围组成的.此类有两种情况.

第一种情况是间断的单元格选取.选取方法是先选取第一个单元格,然后按住[Ctrl]键,再依次选取其它单元格即可.

第二种情况是间断的单元格范围选取.选取方法是先选取第一个单元格范围,然后按住[Ctrl]键,用鼠标拖拉的方式选取第二个单元格范围即可.

1.1.4公式中的数值计算

要输入计算公式,可先单击待输入公式的单元格,而后键入=(等号),并接着键入公式,公式输入完毕后按Enter键即可确认..如果单击了“编辑公式”按钮或“粘贴函数”按钮,Excel将自动插入一个等号.

提示:(1) 通过先选定一个区域,再键入公式,然后按CTRL+ENTER 组合键,可以在区域内的所有单元格中输入同一公式.

(2) 可以通过另一单元格复制公式,然后在目标区域内输入同一公式.

公式是在工作表中对数据进行分析的等式.它可以对工作表数值进行加法、减法和乘法等运算.公式可以引用同一工作表中的其它单元格、同一工作簿不同工作表中的单元格,或者其它工作簿的工作表中的单元格.下面的示例中将单元格B4 中的数值加上25,再除以单元格D5、E5 和F5 中数值的和.

=(B4+25)/SUM(D5:F5)

1.1.5公式中的语法

公式语法也就是公式中元素的结构或顺序.Excel 中的公式遵守一个特定的语法:

最前面是等号(=),后面是参与计算的元素(运算数)和运算符.每个运算数可以是不改变的数值(常量数值)、单元格或区域引用、标志、名称,或工作表函数.在默认状态下,Excel 从等号(=)开始,从左到右计算公式.可以通过修改公式语法来控制计算的顺序.例如,公式=5+2*3的结果为11,将 2 乘以3(结果是6),然后再加上5.因为Excel 先计算乘法再计算加法;可以使用圆括号来改变语法,圆括号内的内容将首先被计算.公式=(5+2)*3的结果为21,即先用 5 加上2,再用其结果乘以3.

1.1.6单元格引用

一个单元格中的数值或公式可以被另一个单元格引用.含有单元格引用公式的单元格称为从属单元格,它的值依赖于被引用单元格的值.只要被引用单元格做了修改,包含引用公式的单元格也就随之修改.例如,公式“=B15*5”将单元格B15 中的数值乘以5.每当单元格B15 中的值修改时,公式都将重新计算.

公式可以引用单元格组或单元格区域,还可以引用代表单元格或单元格区域的名称或标志.

在默认状态下,Excel 使用A1 引用类型.这种类型用字母标志列(从A 到IV ,共256 列),用数字标志行(从 1 到65536).如果要引用单元格,请顺序输入列字母和行数字.例如,D50 引用了列D 和行50 交叉处的单元格.如果要引用单元格区域,请输入区域左上角单元格的引用、冒号(:)和区域右下角单元格的引用.下面是引用的示例.

1.1.7工作表函数

Excel 包含许多预定义的,或称内置的公式,它们被叫做函数.函数可以进行简单的或复杂的计算.工作表中常用的函数是“SUM”函数,它被用来对单元格区域进行加法运算.虽然也可以通过创建公式来计算单元格中数值的总和,但是“SUM”工作表函数还可以方便地计算多个单元格区域.

函数的语法以函数名称开始,后面是左圆括号、以逗号隔开的参数和右圆括号.如果函数以公式的形式出现,请在函数名称前面键入等号(=).当生成包含函数的公式时,公式选项板将会提供相关的帮助.

使用公式的步骤:

B. 如果公式以函数的形式出现,请在编辑栏中单击“编辑公式”按钮 .

C. 单击“函数”下拉列表框 右端的下拉箭头.

D. 单击选定需要添加到公式中的函数.如果函数没有出现在列表中,请单击“其它函数”查看其它函数列表.

E. 输入参数.

F. 完成输入公式后,请按 ENTER 键.

1.2 几种常见的统计函数

1.2.1

均值

Excel 计算平均数使用A VERAGE 函数,其格式如下:

A VERAGE (参数1,参数2,…,参数30)

范例:A VERAGE (12.6,13.4,11.9,12.8,13.0)=12.74

如果要计算单元格中A1到B20元素的平均数,可用 A VERAGE(A1:B20).

1.2.2 标准差

计算标准差可依据样本当作变量或总体当作变量来分别计算,根据样本计算的结果称作样本标准差,而依据总体计算的结果称作总体标准差. (1)样本标准差

Excel 计算样本标准差采用无偏估计式,STDEV 函数格式如下:

STDEV (参数1,参数2,…,参数30)

范例:STDEV (3,5,6,4,6,7,5)=1.35

如果要计算单元格中A1到B20元素的样本标准差,可用 STDEV(A1:B20).

(2)总体标准差

Excel 计算总体标准差采用有偏估计式STDEVP 函数,其格式如下:

STDEVP (参数1,参数2,…,参数30)

范例:STDEVP (3,5,6,4,6,7,5)=1.25

1.2.3 方差

方差为标准差的平方,在统计上亦分样本方差与总体方差. (1)样本方差

S 2

=

1

)(2

--∑n x x i

Excel 计算样本方差使用V AR 函数,格式如下:

V AR (参数1,参数2,…,参数30)

如果要计算单元格中A1到B20元素的样本方差,可用 V AR(A1:B20). 范例:V AR (3,5,6,4,6,7,5)=1.81 (2)总体方差

S 2

=

n

x x i

∑-2

)(

Excel 计算总体方差使用V ARP 函数,格式如下:

V ARP (参数1,参数2,…,参数30)

范例:V AR (3,5,6,4,6,7,5)=1.55

1.2.4 正态分布函数

Excel 计算正态分布时,使用NORMDIST 函数,其格式如下:

NORMDIST (变量,均值,标准差,累积)

其中:

变量(x ):为分布要计算的x 值; 均值(μ):分布的均值; 标准差(σ):分布的标准差;

累积:若为TRUE ,则为分布函数;若为FALSE ,则为概率密度函数. 范例:已知X 服从正态分布,μ=600,σ=100,求P {X ≤500}.输入公式

=NORMDIST (500,600,100,TRUE )

得到的结果为0.158655,即P {X ≤500}=0.158655.

1.2.5 正态分布函数的反函数

Excel 计算正态分布函数的反函数使用NORMINV 函数,格式如下:

NORMINV (下侧概率,均值,标准差)

范例:已知概率P =0.841345,均值μ=360,标准差σ=40,求NORMINV 函数的值.输入公式

=NORMINV (0.841345,360,40)

得到结果为400,即P {X ≤400}=0.841345. 注意:(1) NORMDIST 函数的反函数NORMINV 用于分布函数,而非概率密度函数,请务必注意;

(2) Excel 提供了计算标准正态分布函数 NORMSDIST(x),及标准正态分布的反函数 NORMSINV(概率).

范例:已知X~N(0,1), 计算(2)Φ=P {X <2}.输入公式

=NORMSDIST(2)

得到0.97725,即(2)Φ=0.97725.

范例:输入公式=NORMSINV(0.97725) ,得到数值2. 若求临界值u α(n ),则使用公式=NORMSINV(1-α).

1.2.6 t 分布

Excel 计算t 分布的值(查表值)采用TDIST 函数,格式如下:

TDIST (变量,自由度,侧数)

其中:

变量(t ):为判断分布的数值; 自由度(v ):以整数表明的自由度;

侧数:指明分布为单侧或双侧:若为1,为单侧;若为2,为双侧.

范例:设T 服从t (n-1)分布,样本数为25,求P (T >1.711). 已知t =1.711,n =25,采用单侧,则T 分布的值:

=TDIST(1.711,24,1)

得到0.05,即P (T >1.711)=0.05. 若采用双侧,则T 分布的值:

=TDIST(1.711,24,2) 得到0.1,即()

1.7110.1P T >=.

1.2.7 t 分布的反函数

Excel 使用TINV 函数得到t 分布的反函数,格式如下:

TINV (双侧概率,自由度)

范例:已知随机变量服从t (10)分布,置信度为0.05,求t 2

05.0(10).输入公式

=TINV(0.05,10)

得到2.2281,即()

2.22810.05P T >=.

若求临界值t α(n ),则使用公式=TINV(2*α, n ).

范例:已知随机变量服从t (10)分布,置信度为0.05,求t 0.05 (10).输入公式

=TINV(0.1,10) 得到1.812462,即t 0.05 (10)= 1.812462.

1.2.8

F 分布

Excel 采用FDIST 函数计算F 分布的上侧概率1()F x -,格式如下:

FDIST(变量,自由度1,自由度2)

其中:

变量(x ):判断函数的变量值;

自由度1(1n ):代表第1个样本的自由度; 自由度2(n ):代表第2个样本的自由度.

范例:设X 服从自由度1n =5,2n =15的F 分布,求P (X >2.9)的值.输入公式

=FDIST(2.9,5,15)

得到值为0.05,相当于临界值α.

1.2.9 F 分布的反函数

Excel 使用FINV 函数得到F 分布的反函数,即临界值12(,)F n n α,格式为: FINV(上侧概率,自由度1,自由度2)

范例:已知随机变量X 服从F (9,9)分布,临界值α=0.05,求其上侧0.05分位点F 0.05(9,9).输入公式

=FINV(0.05,9,9)

得到值为3.178897,即F 0.05(9,9)= 3.178897. 若求单侧百分位点F 0.025(9,9),F 0.975(9,9).可使用公式

=FINV(0.025,9,9) =FINV(0.975,9,9)

得到两个临界值4.025992和0.248386.

若求临界值F α(n 1,n 2),则使用公式=FINV(α, n 1,n 2).

1.2.10 卡方分布

Excel 使用CHIDIST 函数得到卡方分布的上侧概率1()F x -,其格式为:

CHIDIST(数值,自由度)

其中:

数值(x ):要判断分布的数值; 自由度(v ):指明自由度的数字.

范例:若X 服从自由度v =12的卡方分布,求P (X >5.226)的值.输入公式

=CHIDIST(5.226,12) 得到0.95,即1(5.226)F -=0.95或(5.226)F =0.05.

1.2.11 卡方分布的反函数

Excel 使用CHIINV 函数得到卡方分布的反函数,即临界值2

()n αχ.格式为: CHIINV (上侧概率值α,自由度n )

范例:下面的公式计算卡方分布的反函数:

=CHIINV(0.95,12) 得到值为5.226,即2

0.95(12)χ=5.226.

若求临界值2

χ(n),则使用公式=CHIINV(α, n).

1.2.12 泊松分布

计算泊松分布使用POISSON 函数,格式如下:

POISSON(变量,参数,累计)

其中:变量:表示事件发生的次数; 参数:泊松分布的参数值;

累计:若TRUE ,为泊松分布函数值;若FALSE ,则为泊松分布概率分布值. 范例:设X服从参数为4的泊松分布,计算P {X =6}及P {X ≤6}.输入公式

=POISSON(6,4,FALSE) =POISSON(6,4,TRUE) 得到概率0.104196和0.889326.

在下面的实验中,还将碰到一些其它函数,例如:计算样本容量的函数COUNT ,开平方函数SQRT ,和函数SUM ,等等.关于这些函数的具体用法,可以查看Excel 的关于函数的说明,不再赘述.

2 区间估计实验

计算置信区间的本质是输入两个公式,分别计算置信下限与置信上限.当熟悉了数据输入方法及常见统计函数后,变得十分简单.

2.1 单个正态总体均值与方差的区间估计:

2.1.1

σ2已知时μ的置信区间

置信区间为

2

2

x u x u α

α

??

-+ ?

. 例1 随机从一批苗木中抽取16株,测得其高度(单位:m )为:1.14 1.10 1.13 1.15 1.20 1.12 1.17 1.19 1.15 1.12 1.14 1.20 1.23 1.11 1.14 1.16.设苗高服从正态分布,求总体均值μ的0.95的置信区间.已知σ =0.01(米). 步骤:

(1)在一个矩形区域内输入观测数据,例如在矩形区域B3:G5内输入样本数据. (2)计算置信下限和置信上限.可以在数据区域B3:G5以外的任意两个单元格内分别输入如下两个表达式:

=average(b3:g5)-normsinv(1-0.5*α)*σ/sqrt(count(b3:g5)) =average(b3:g5)+normsinv(1-0.5*α)*σ/sqrt(count(b3:g5)) 上述第一个表达式计算置信下限,第二个表达式计算置信上限.其中,显著性水平α和标准差σ是具体的数值而不是符号.本例中,α =0.05, 0.01σ=,上述两个公式应实际输入为

=average(b3:g5)-normsinv(0.975)*0.01/sqrt(count(b3:g5)) =average(b3:g5)+normsinv(0.975)*0.01/sqrt(count(b3:g5))

计算结果为(1.148225, 1.158025).

2.1.2

σ2未知时μ的置信区间

置信区间为

2

2

((x t n x t n αα??

--+- ?

. 例2 同例1,但σ未知.

输入公式为:

=average(b3:g5)-tinv(0.05,count(b:3:g5)-1)*stdev(b3:g5)/sqrt(count(b3:g5)) =average(b3:g5)-tinv(0.05,count(b:3:g5)-1)*stdev(b3:g5)/sqrt(count(b3:g5)) 计算结果为(1.133695, 1.172555).

2.1.3

μ未知时σ2的置信区间:

置信区间为 2

2

2

2

122(1)(1),(1)(1)n n n n s

s ααχχ-??

?

-- ?-- ?

??

. 例3 从一批火箭推力装置中随机抽取10个进行试验,它们的燃烧时间

(单位:s)如下:

50.7 54.9 54.3 44.8 42.2 69.8 53.4 66.1 48.1 34.5 试求总体方差2

σ的0.9的置信区间(设总体为正态).

操作步骤:

(1)在单元格B3:C7分别输入样本数据;

(2)在单元格C9中输入样本数或输入公式=COUNT(B3:C7); (3)在单元格C10中输入置信水平0.1.

(4)计算样本方差:在单元格C11中输入公式=V AR(B3:C7) (5)计算两个查表值:在单元格C12中输入公式=CHIINV(C10/2,C9-1),在单元格C13中输入公式=CHIINV(1-C10/2,C9-1)

(6)计算置信区间下限:在单元格C14中输入公式=(C9-1)*C11/C12 (7)计算置信区间上限:在单元格C15中输入公式=(C9-1)*C11/C13.

当然,读者可以在输入数据后,直接输入如下两个表达式计算两个置信限:=(count(b3:c7)-1)*var(b3:c7)/chiinv(0.1/2, count(b3:c7)-1)

=(count(b3:c7)-1)*var(b3:c7)/chiinv(1-0.1/2, count(b3:c7)-1)

2.2 两正态总体均值差与方差比的区间估计

2.2.1当σ12 = σ22 = σ2但未知时μ1-μ2的置信区间

置信区间为(

)

12

2

(2) x y t n n S

α

?

-±+-

?

例4在甲,乙两地随机抽取同一品种小麦籽粒的样本,其容量分别为5和7,分析其蛋白质含量为

甲:12.6 13.4 11.9 12.8

13.0

乙:13.1 13.4 12.8 13.5 13.3 12.7 12.4

蛋白质含量符合正态等方差条件,试估计甲,乙两地小麦蛋白质含量差μ

1-μ

所在的范

围.(取α=0.05)

实验步骤:

(1)在A2:A6输入甲组数据,在B2:B8输入乙组数据;

(2)在单元格B11输入公式=A VERAGE(A2:A6),在单元格B12中输入公式=A VERAGE(B2:B8),分别计算出甲组和乙组样本均值.

(3)分别在单元格C11和C12分别输入公式=V AR(A2:A6),=V AR(B2:B8),计算出两组样本的方差.

(4)在单元格D11和D12分别输入公式=COUNT(A2:A6),=COUNT(B2:B8),计算各样本的容量大小.

(5)将显著性水平0.05输入到单元格E11中.

(6)分别在单元格B13和B14输入

=B11-B12-TINV(0.025,10)*SQRT((4*C11+6*C12)/10)*SQRT(1/ 5+1/7)

=B11-B12+TINV(0.025,10)*SQRT((4*C11+6*C12)/10)*SQRT(1/ 5+1/7)

计算出置信区间的下限和上限.

2.2.2

μ1和μ2未知时方差比σ2

1/σ22的置信区间

置信区间为 2

2

112

22122

1212211,(1,1)(1,1)s

s s F n n s F n n αα-

??

?

?---- ???

例5 有两个化验员A 、B ,他们独立地对某种聚合物的含氯量用相同的方法各作了10次测定.其测定值的方差分别是S A =0.5419,S B =0.6065.设σ2A

和σ

2B

分别是A 、B

所测量的数据总体(设为正态分布)的方差.求方差比σ2A

2B

的 0.95置信区间.

操作步骤:

(1)在单元格B2,B3输入样本数,C2,C3输入样本方差,D2输入置信度. (2)在B4和B5利用公式输入

=C2/(C3*FINV(1-D2/2,B2-1,B3-1))

=C2/(C3*FINV(D2/2,B2-1,B3-1))

计算出A 组和B 组的方差比的置信区间上限和下限.

2.3 练习题

1. 已知某树种的树高服从正态分布,随机抽取了该树种的60株林木组成样本.样本中各林木的树高资料如下(单位:m)

22.3, 21.2, 19.2, 16.6, 23.1, 23.9, 24.8, 26.4, 26.6, 24.8, 23.9, 23.2, 23.3, 21.4, 19.8, 18.3,

20.0, 21.5, 18.7, 22.4, 26.6, 23.9, 24.8, 18.8, 27.1, 20.6, 25.0, 22.5, 23.5, 23.9, 25.3, 23.5,

22.6, 21.5, 20.6, 25.8, 24.0, 23.5, 22.6, 21.8, 20.8, 19.5, 20.9, 22.1, 22.7, 23.6, 24.5, 23.6,

21.0, 21.3, 22.4,18.7, 21.3, 15.4, 22.9, 17.8, 21.7, 19.1, 20.3, 19.8

试以0.95的可靠性,对于该林地上全部林木的平均高进行估计.

2. 从一批灯泡中随机抽取10个进行测试,测得它们的寿命(单位:100h)为:

50.7,54.9,54.3,44.8,42.2,69.8,53.4,66.1,48.1,34.5.

试求总体方差的0.9的置信区间(设总体为正态).

3. 已知某种玉米的产量服从正态分布,现有种植该玉米的两个实验区,各分为10个小区,各小区的面积相同,在这两个实验区中,除第一实验区施以磷肥外,其它条件相同,两实验区的玉米产量(kg)如下:

第一实验区:62 57 65 60 63 58 57 60 60 58

第二实验区:56 59 56 57 60 58 57 55 57 55

试求出施以磷肥的玉米产量均值和未施以磷肥的玉米产量均值之差的范围(α=0.05)

3假设检验实验

实验内容:单个总体均值的假设检验;两个总体均值差的假设检验;两个正态总体方差齐性的假设检验;拟合优度检验.

实验目的与要求:(1)理解假设检验的统计思想,掌握假设检验的计算步骤;(2)掌握运用Excel进行假设检验的方法和操作步骤;(3)能够利用试验结果的信息,对所关心的事物作出合理的推断.

3.1 单个正态总体均值μ的检验

3.1.1 2已知时μ的U检验

例1 外地一良种作物,其1000m2产量(单位:kg)服从N(800, 502),引入本地试种,收获时任取5块地,其1000m2产量分别是800,850,780,900,820(kg),假定引种后1000m2产量X也服从正态分布,试问:

=800kg 有无显著变化.

(1)若方差未变,本地平均产量μ与原产地的平均产量μ

=800kg高.

(2)本地平均产量μ是否比原产地的平均产量μ

=800kg低.

(3)本地平均产量μ是否比原产地的平均产量μ

操作步骤:

(1)先建一个如下图所示的工作表:

(2)计算样本均值(平均产量),在单元格D5输入公式=A VERAGE(A3:E3);

(3)在单元格D6输入样本数5;

(4)在单元格D8输入U检验值计算公式=(D5-800)/(50/SQRT(D6);

(5)在单元格D9输入U检验的临界值=NORMSINV(0.975);

(6)根据算出的数值作出推论.本例中,U的检验值1.341641小于临界值1.959961,故接受原假设,即平均产量与原产地无显著差异.

(7)注:在例1中,问题(2)要计算U检验的右侧临界值:在单元格D10输入U检验的上侧临界值=NORMSINV(0.95).问题(3)要计算U检验的下侧临界值,在单元格D11输入U 检验下侧的临界值=NORMSINV(0.05).

3.1.2 2未知时的t检验

例2某一引擎制造商新生产某一种引擎,将生产的引擎装入汽车内进行速度测试,得到行驶速度如下:

250 238 265 242 248 258 255 236 245 261

254 256 246 242 247 256 258 259 262 263

该引擎制造商宣称引擎的平均速度高于250 km/h,请问样本数据在显著性水平为0.025时,是否和他的声明抵触?

操作步骤:

(1)先建如图所示的工作表:

(2)计算样本均值:在单元格D8输入公式=A VERAGE(A3:E6);

(3)计算标准差:在单元格D9输入公式=STDEV(A3:E6);

(4)在单元格D10输入样本数20.

(5)在单元格D11输入t检验值计算公式=(D8-250)/(D9/(SQRT(D10)),得到结果1.06087;

(6)在单元格D12输入t检验上侧临界值计算公式=TINV(0.05, D10-1).

欲检验假设

:μ>250.

H0:μ=250;H

已知t统计量的自由度为(n-1)=20-1=19,拒绝域为t>t

=2.093.由上面计算得到t

025

.0

检验统计量的值1.06087落在接收域内,故接收原假设H0.

3.2 两个正态总体参数的假设检验

μ-μ的检验

3.2.1当σ12 = σ22 = σ2但未知时

12

在此情况下,采用t检验.

例试验及观测数据同11.2中的练习题3,试判别磷肥对玉米产量有无显著影响?

欲检验假设

:μ1>μ2.

H0:μ1=μ2;H

操作步骤:

(1)

(2)选取“工具”—“数据分析”;

(3)选定“t-检验:双样本等方差假设”.

(4)选择“确定”.显示一个“t-检验:双样本等方差假设”对话框;

(5)在“变量1的区域”输入A2:A11.

(6)在“变量2的区域”输入B2:B11.

(7)在“输出区域”输入D1,表示输出结果放置于D1向右方的单元格中.

(8)在显著水平“α”框,输入0.05.

(9)在“假设平均差”窗口输入0.

(10)选择“确定”,计算结果如D1:F14显示.

得到t值为3.03,“t单尾临界”值为1.734063.由于3.03>1.73,所以拒绝原假设,接收备择假设,即认为使用磷肥对提高玉米产量有显著影响.

3.2.2σ2

1与σ2

已知时

12

μ-μ的U检验

例3 某班20人进行了数学测验,第1组和第2组测验结果如下:

第1组:91 88 76 98 94 92 90 87 100 69

第2组:90 91 80 92 92 94 98 78 86 91

已知两组的总体方差分别是57与53,取α =0.05,可否认为两组学生的成绩有差异?

操作步骤:

(1)建立如图所示工作表:

(2)选取“工具”—“数据分析”;

(3)选定“z-检验:双样本平均差检验”;

(4)选择“确定”,显示一个“z-检验:双样本平均差检验”对话框;

(5)在“变量1的区域”输入A2:A11;

(6)在“变量2的区域”输入B2:B11;

(7)在“输出区域”输入D1;

(8)在显著水平“α”框,输入0.05;

(9)在“假设平均差”窗口输入0;

(10)在“变量1的方差”窗口输入57;

(11)在“变量2的方差”窗口输入53;

(12)选择“确定”,得到结果如图所示.

计算结果得到z=-0.21106(即u统计量的值),其绝对值小于“z双尾临界”值

1.959961,故接收原假设,表示无充分证据表明两组学生数学测验成绩有差异.

3.2.3 两个正态总体的方差齐性的F检验

例5 羊毛在处理前与后分别抽样分析其含脂率如下: 处理前:0.19 0.18 0.21 0.30 0.41 0.12 0.27

处理后:0.15 0.13 0.07 0.24 0.19 0.06 0.08 0.12 问处理前后含脂率的标准差是否有显著差异? 欲检验假设

H 0:σ

21=σ2

2;

H 1:σ

21≠σ2

2.

操作步骤如下:

(1)建立如图所示工作表:

(2)选取“工具”—“数据分析”; (3)选定“F-检验 双样本方差”. (4)选择“确定”,显示一个“F-检验:双样本方差”对话框; (5)在“变量1的区域”输入A2:A8. (6)在“变量2的区域”输入B2:B9. (7)在显著水平“α”框,输入0.025. (8)在“输出区域”框输入D1. (9)选择“确定”,得到结果如图所示.

计算出F 值2.35049小于“F 单尾临界”值5.118579,且P(F<=f)=0.144119>0.025,故接收原假设,表示无理由怀疑两总体方差相等.

4 拟合优度检验

拟合优度检验使用统计量

2

2

1()k

i i i i

n np np χ=-=∑, (11.1) i i n np k 其中为实测频数,为理论频数,为分组数。Excel 在计算拟合优度的卡方检

验方面,提供了CHITEST 函数,其格式如下:

CHITEST(实测频数区域,理论频数区域)

得到临界概率

{}01)p k χχ=->2

2P(,

其中χ2

为上述统计量(1.11)的值.在应用中,可根据临界概率0p ,利用函数

CHIINV )1,(0-k p 确定2

χ统计量的值.即

CHIINV )1,(0-k p ∑=-=k

i i

i i np np n 12

)(

例6 设总体X中抽取120个样本观察值,经计算整理得样本均值x =209,样本方

差s =42.77

(1)输入基本数据

建立如下图所示工作表,输入区间(A2:A10),端点值(B2:B10),实测频数的值(C2:C10).区间可以不输入,输入是为了更清晰;端点值为区间右端点的值,当右端点是+∞时,为了便于处理,可输入一个很大的数(本例取10000)代替+∞. (2)计算理论频数

由极大似然估计得参数??209, 6.539877675x s μ

σ====,假设X~N (2

?,?σμ),则 P {a

将计算的理论频数值放入D 列.

在D2输入=120*(NORMDIST(198,209,6.539877675,TRUE)) 在D3输入=120*(NORMDIST(B3,209,6.539877675,TRUE) -NORMDIST(B2,209,6.539877675,TRUE)) 类似地,可算出D4至D10的值.

应用小技巧:计算D4到D10值的简便方法:选定D3单元格,单击鼠标右键弹出

中选择"粘贴",即可得到D4到D10的值. (3)计算卡方统计量的值

本例中,估计参数2个),(2

σμ,分组数k =9. ①使用CHITEST 函数计算临界概率0p .

在单元格E12输入:=CHITEST(C2:C10,D2:D10),得到0p = 0.997499.

②根据临界概率0p ,利用函数CHIINV )1,(0-k p 确定2

χ统计量的值.

在单元格E13输入=CHIINV(E12, 8), 得到统计量的值2

χ=1.104413.

(4)结果分析

先查出临界值:在单元格E14输入=CHIINV(0.05,6),得到12.59158.由于统计量的值1.104413小于临界值12.5918,故接受原假设,认为X 服从正态分布.

练习与习题

1. 某春小麦良种千粒重μ=34克,方差σ2=1.96,现自外地引入新品种,在8个小区上种植,得其千粒重为:35.6,37.6,33.4,35.1,3

2.7,36.8,35.9,34.6,问新引入品种的千粒重与当地良种有无显著差异.

2. 为防止某种害虫而将一种农药施入土中,规定经三年后土壤中如有5ppm 以上浓度时认为有残效,现在施药区分别抽取了10个土样(施药三年后)进行分析,它们浓度分别为:

1. 8, 3.2,

2.6, 6.0, 5.4, 7.6, 2.1, 2.5, .1,

3.5

设测定值服从正态分布,问这种农药三年后是否有残效.

3. 设甲乙两种甜菜的含糖率分别服从N(μ1,7.5)和N(μ2,6),现从两种甜菜中分别抽取若干样品,测其含糖率分别为:

甲种: 24.3,17.4,23.7,20.8,21.3 (%)

乙种:20.2,16.9,16.7,18.2 (%)

问甲,乙两种甜菜含糖率的平均值有无显著变化.

4. 某化工原料在处理前后取样分析,测得其含脂率的数据如下:

处理前:0.19,0.18,0.21,0.30,0.66,0.42,0.08,0.12,0.30,0.27.

处理后:0.19,0.24,1.04,0.08,0.20,0.12,0.31,0.29,0.13,0.07.

假定处理前后的含脂率都服从正态分布,且方差不变,给定显著水平α=0.05,问处理前后含脂率的均值有无显著变化.

5. 某农场为试验磷肥能否提高水稻收获量,在同类农场中选定面积为0.30m2的试验地若干块,试验结果,未施肥的九块地收获量为:

8.6,7.9,9.3,10.7,11.4,9.8,9.5,10.1,8.5

另外八块地施了磷肥,其收获量为:

12.6,10.2,11.7,12.3,11.1,10.5,10.6,12.2

试检验施肥后水稻的收获量有无显著提高.(假定水稻收获量服从正态分部).提示:先检验方差齐性.

6. 在一个小时内电话总机每分钟收到的呼唤次数统计如下:

呼唤次数:0 123456≥7

频数:8 16 17 10 6210

试用卡方分布检验每小时电话总机收到呼唤次数是否服从泊松分布.

7. 下面是某系高等数学的成绩:

87,75,85,78,62,90,72,66,75,74,73,77,75,84,64

78,90,65,90,78,57,71,48,74,72,53,69,68,74,62

90,80,70,84,86,65,60,68,89,72,53,69,68,74,73

65,71,68,70,85,79,43,79,80,77,88,93,68,74,51

试在显著水平α=0.05小,检验这次成绩的分布是否服从正态分布.

5方差分析实验

试验内容:单因素方差分析;双因素无重复试验的方差分析;双因素等重复试验的方差分析.

试验目的与教学要求:充分理解方差分析的统计思想;充分理解平方和分解的统计思想;学会如何充分地利用试验结果的信息,对所关心的事物(因素的影响作出合理的推断.

5.1 单因素方差分析

例1 检验某种激素对羊羔增重的效应.选用3个剂量进行试验,加上对照(不用激素)在内,每次试验要用4只羊羔,若进行4次重复试验,则共需16只羊羔.一种常用的试验方法,是将16只羊羔随机分配到16个试验单元.在试验单元间的试验条件一致的情况下,经过200天的饲养后,羊羔的增重(kg)数据如下表.

试问各种处理之间有无显著差异?

操作步骤:

(1)输入数据,如下图所示: (2)选取“工具”—“数据分析”; (3)选定“单因素方差分析”; (4)选定“确定”,显示“单因子方差分析”对话框; (5)

在“输入区域”框输入数据矩阵(首坐标):(尾坐标),如上例为“A2:D6”,其中第二行“第一组,…,第四组”作为标记行; (6)在“分组方式”框选定“列”;

(7)打开“分类轴标记行在第一行上”复选框.若关闭,则数据输入域应为A3:D6. (8)指定显著水平α=0.05;

(9)选择输出选项,本例选择“输出区域”紧接在数据区域下为:“A7”; (10)选择“确定”,则得输出结果.

结果分析:F crit=3.4903是α=0.05的F 统计量临界值,F=1.305047是F 统计量的计算值,

P-value=0.318=P{F>1.30505}.

由于1.30505<3.4903,因此接受原假设,即无显著差异.

5.2 双因素无重复试验的方差分析:

例 2 将土质基本相同的一块耕地分成均等的五个地块,每块又分成均等的四个小区.有四个品种的小麦,在每一地块内随机分种在四个小区上,每小区的播种量相同,测得收获量如下表(单位:kg ).试以显著性水平α1 =0.05, α2=0.01,考察品种和地块对收获量的影响是否显著.

操作步骤:

(1)输入数据,如下图所示:

看医统学习题(计数资料)

《医学统计学习题》计数资料 5、有资料如下表: 甲、乙两个医院某传染病各型治愈率 病型 患者数治愈率(%)甲乙甲乙 普通型300 100 60.0 65.0 重型100 300 40.0 45.0 暴发型100 100 20.0 25.0 合计500 500 48.0 45.0 由于各型疾病的人数在两个医院的内部构成不同,从内部看,乙医院各型治愈率都高于甲医院,但根据栏的结果恰好相反,纠正这种矛盾现象的统计方法是: A、重新计算,多保留几位小数 B、对率进行标准化 C、对各医院分别求平均治愈率 D、增大样本含量,重新计算 6、5个样本率作比较,χ2>χ20.01,4,则在α=0.05检验水准下,可认为: A、各总体率不全等 B、各总体率均不等 C、各样本率均不等 D、各样本率不全等 7、两个独立小样本计量资料比较的假设检验,首先应考虑: A、用t检验 B、用Wilcoxon秩和检验 C、t检验或Wilcoxon秩和检验均可 D、资料符合t检验还是Wilcoxon秩和检验条件 13.对三行四列表资料作 2检验,自由度等于 A. 1 B. 2 C. 3 D. 6 E. 12 14. 根据下述资料,则 病情 病人数治愈数治愈率(%)病人数治愈数治愈率(%)轻型40 36 90 60 54 90 重型60 42 70 40 28 70 合计100 78 78 100 82 82 A. 乙疗法优于甲疗法 B. 甲疗法优于乙疗法 C. 甲疗法与乙疗法疗效相等 D. 此资料甲、乙疗法不能比较 E. 以上都不对15.在实际工作中,同质是指()。 A.被研究指标的非实验影响因素均相同。B.研究对象的测量指标无误差。 C.被研究指标的主要影响因素相同。D.研究对象之间无个体差异。E.以上都对。答案 5、有资料如下表: 甲、乙两个医院某传染病各型治愈率 病型 患者数治愈率(%)甲乙甲乙

如何使用excel进行概率统计

数理统计实验 1Excel基本操作 1.1单元格操作 1.1.1单元格的选取 Excel启动后首先将自动选取第A列第1行的单元格即A1(或a1)作为活动格,我们可以用键盘或鼠标来选取其它单元格.用鼠标选取时,只需将鼠标移至希望选取的单元格上并单击即可.被选取的单元格将以反色显示. 1.1.2选取单元格范围(矩形区域) 可以按如下两种方式选取单元格范围. (1) 先选取范围的起始点(左上角),即用鼠标单击所需位置使其反色显示.然后按住鼠标左键不放,拖动鼠标指针至终点(右下角)位置,然后放开鼠标即可. (2) 先选取范围的起始点(左上角),即用鼠标单击所需位置使其反色显示.然后将鼠标指针移到终点(右下角)位置,先按下Shift键不放,而后点击鼠标左键. 1.1.3选取特殊单元格 在实际中,有时要选取的单元格由若干不相连的单元格范围组成的.此类有两种情况. 第一种情况是间断的单元格选取.选取方法是先选取第一个单元格,然后按住[Ctrl]键,再依次选取其它单元格即可.

第二种情况是间断的单元格范围选取.选取方法是先选取第一个单元格范围,然后按住[Ctrl]键,用鼠标拖拉的方式选取第二个单元格范围即可. 1.1.4公式中的数值计算 要输入计算公式,可先单击待输入公式的单元格,而后键入=(等号),并接着键入公式,公式输入完毕后按Enter键即可确认..如果单击了“编辑公式”按钮或“粘贴函数”按钮,Excel将自动插入一个等号. 提示:(1) 通过先选定一个区域,再键入公式,然后按CTRL+ENTER 组合键,可以在区域内的所有单元格中输入同一公式. (2) 可以通过另一单元格复制公式,然后在目标区域内输入同一公式. 公式是在工作表中对数据进行分析的等式.它可以对工作表数值进行加法、减法和乘法等运算.公式可以引用同一工作表中的其它单元格、同一工作簿不同工作表中的单元格,或者其它工作簿的工作表中的单元格.下面的示例中将单元格B4 中的数值加上25,再除以单元格D5、E5 和F5 中数值的和. =(B4+25)/SUM(D5:F5) 1.1.5公式中的语法 公式语法也就是公式中元素的结构或顺序.Excel 中的公式遵守一个特定的语法:最前面是等号(=),后面是参与计算的元素(运算数)和运算符.每个运算数可以是不改变的数值(常量数值)、单元格或区域引用、标志、名称,或工作表函数.在默认状态下,Excel 从等号(=)开始,从左到右计算公式.可以通过修改公式语

计数资料

第五章计数资料的统计描述 比 ratio 相对比 比例 proportion 结构相对数 率 rate 强度相对数 第一节常用相对数 一、强度相对数——率(说明某现象发生的频率) 率=某时期内发生某现象的观察单位数 /同期可能发生某现象的观察单位总数 *比例基数 二、结构相对数——构成比 (表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布) 构成比=某一组成部分的观察单位数 /同一事物各组成部分的观察单位总数 *100% 三、相对比——比ratio (两个有关指标之比,说明两指标间的比例关系) 相对比=甲指标/乙指标(*100%) 第二节应用相对数的注意事项 1、结构相对数不能代替强度相对数 2、计算相对数应有足够数量 3、正确计算合计率(或平均率,不能简单地由各组率相加或平均而得) 4、注意资料的可比性(对比的因素,影响的因素) 5、对比不同时期资料应注意客观条件是否相同 6、样本率(或构成比)的抽样误差(假设检验) 第三节率的标准化法 一、标准化法的意义和基本思想 标准化法standarization ——标准化率standardization rate 标准化法的基本思想是:采用某影响因素的统一标准构成以消除构成不同对合计率的影响,使通过标准化后的标准化合计率具有可比性。 二、标准化率的计算 (一)标准化方法 直接标准化法——直接法 间接标准化法——间接法

标准化法计算的关键是选择同一的标准构成。 1、两组资料中任选一组资料的人口数(或人口构成)作为两者的“共同标准”——直接法 2、两组资料各部分人口之和组成的人口数(或人口构成)作为两者的“共同标准”——直接法 3、另外选用一个通用的或便于比较的标准作为两者的“共同标准”——直接法和间接法 (二)计算标准化率 步骤: 1、根据对比资料所具备的条件选用直接法或间接法 2、选定标准构成 3、选择公式计算标准化率。 (三)标准化率的计算步骤 1、直接标准化 (1)用标准人口数计算 (2)用标准人口构成比计算 2、间接标准化法 三.应用标准化法时的注意事项 1、标准化法只适用于某因素内部构成不同,并有可能影响两组总率比较的情况。对于因其他条件不同而产生的不具可比性问题标准化法不能解决 2、由于选择的标准人口不同,算出的标准化率也不同。因此,当比较几个标准化率时,应采用同一标准人口。 3、标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。 4、两样本标准化率是样本值,存在抽样误差。比较两样本的标准化率,当样本含量较小时,还应做假设检验。 第四节动态数列及其分析指标 动态数列dynamic series 是一系列按时间顺序排列起来的统计指标(可以为绝对数、相对数或平均数),用以观察和比较该事物在时间上的变化和发展趋势。 常用动态数列分析指标:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。 第五章计数资料的统计描述

统计概率经典例题(含(答案)和解析)

统计与概率经典例题(含答案及解析) 1.(本题8分)为了解学区九年级学生对数学知识的掌握情况,在一次数学检测中,从学区2000名九年级考生中随机抽取部分学生的数学成绩进行调查,并将调查结果绘制成如下图表: ⑴表中a和b所表示的数分别为:a= .,b= .; ⑵请在图中补全频数分布直方图; ⑶如果把成绩在70分以上(含70分)定为合格,那么该学区2000名九年级考生数学成绩为合格的学生约有多少名? 2.为鼓励创业,市政府制定了小型企业的优惠政策,许多小型企业应运而生,某镇统 计了该镇1﹣5月新注册小型企业的数量,并将结果绘制成如下两种不完整的统计图: (1)某镇今年1﹣5月新注册小型企业一共有家.请将折线统计图补充完整; (2)该镇今年3月新注册的小型企业中,只有2家是餐饮企业,现从3月新注册的小 型企业中随机抽取2家企业了解其经营状况,请用列表或画树状图的方法求出所抽取的 2家企业恰好都是餐饮企业的概率. 3.(12分)一个不透明的口袋装有若干个红、黄、蓝、绿四种颜色的小球,小球除颜 色外完全相同,为估计该口袋中四种颜色的小球数量,每次从口袋中随机摸出一球记下 颜色并放回,重复多次试验,汇总实验结果绘制如图不完整的条形统计图和扇形统计图.

根据以上信息解答下列问题: (1)求实验总次数,并补全条形统计图; (2)扇形统计图中,摸到黄色小球次数所在扇形的圆心角度数为多少度? (3)已知该口袋中有10个红球,请你根据实验结果估计口袋中绿球的数量.4.(本题10分)某校为了解2014年八年级学生课外书籍借阅情况,从中随机抽取了40名学生课外书籍借阅情况,将统计结果列出如下的表格,并绘制成如图所示的扇形统计图,其中科普类册数占这40名学生借阅总册数的40%. 类别科普类教辅类文艺类其他册数(本)128 80 m 48 (1)求表格中字母m的值及扇形统计图中“教辅类”所对应的圆心角a的度数; (2)该校2014年八年级有500名学生,请你估计该年级学生共借阅教辅类书籍约多少本? 5.(10分)将如图所示的版面数字分别是1,2,3,4的四张扑克牌背面朝上,洗匀后放在桌面上(“A”看做是“1”)。 (1)从中随机抽出一张牌,牌面数字是偶数的概率是;(3分) (2)从中随机抽出两张牌,两张牌面数字的和是5的概率是;(3分)(3)先从中随机抽出一张牌,将牌面数字作为十位上的数字,然后将该牌放回并重新洗匀,再随机抽取一张,将牌面数字作为个位上的数字,请用画树形图的方法求组成的

Excel数据分析统计

使用Excel可以完成很多专业软件才能完成的数据统计、分析工作,比如:直方图、相关系数、协方差、各种概率分布、抽样与动态模拟、总体均值判断,均值推断、线性、非线性回归、多元回归分析、时间序列等。本专题将教您完成几种最常用的专业数据分析工作。 注意:所有操作将通过Excel“分析数据库”工具完成,如果您没有安装这项功能,请依次选择“工具”-“加载宏”,在安装光盘中加载“分析数据库”。加载成功后,可以在“工具”下拉菜单中看到“数据分析”选项。 直方图 某班进行期中考试后,需要统计各分数段人数,并给出频数分布和累计频数表的直方图以供分析。 以往手工分析的步骤是先将各分数段的人数分别统计出来制成一张新的表格,再以此表格为基础建立数据统计直方图。使用Excel可以直接完成此任务。 [具体方法] 描述统计 某班进行期中考试后,需要统计成绩的平均值、区间,并给出班级内部学生成绩差异的量化标准,借此来作为解决班与班之间学生成绩的参差不齐的依据。要求得到标准差等统计数值。 样本数据分布区间、标准差等都是描述样本数据范围及波动大小的统计量,统计标准差需要得到样本均值,计算较为繁琐。这些都是描述样本数据的常用变量,使用Excel 数据分析中的“描述统计”即可一次完成。[具体方法] 排位与百分比排位 某班级期中考试进行后,按照要求仅公布成绩,但学生及家长要求知道排名。故欲公布成绩排名,学生可以通过成绩查询到自己的排名,并同时得到该成绩位于班级百分比排名(即该同学是排名位于前“X%”的学生)。 排序操作是Excel的基本操作, Excel“数据分析”中的“排位与百分比排位”可以使这个工作简化,直接输出报表。[具体方法]

概率及其计算

第十三章概率与统计本章知识结构图 统计 随机抽样 抽签法 随机数表法 简单随机抽样 系统抽样 分层抽样 共同特点:抽样 过程中每个个体 被抽到的可能性 (概率)相等用样本估计总体 样本频率分布 估计总体 总体密度曲线 频率分布表和频率分布直方图 茎叶图 样本数字特征 估计总体 众数、中位数、平均数 方差、标准差 变量间的相关关系 两个变量的 线性相关 散点图回归直线 正态分布 列联表(2×2)独立性分析 概率 概率的基本性质互斥事件对立事件 古典概型 几何概型 条件概率 事件的独立性 用随机模拟法求概率 常用的分布及 期望、方差 随机变量 两点分布 X~B(1,p) E(X)=p,D(X)=p(1-p) 二项分布 X~B(n,p) E(X)=np,D(X)=np(1-p) X~H(N,M,n) E(X)=n M N D(X)= nM N? ? ? ? 1- M N N-n N-1 n次独立重复试验恰好 发生k次的概率为 P n(k)=C k n p k(1-p)n-k 超几何分布 若Y=aX+b,则 E(Y)=aE(X)+b D(Y)=a2D(X) P(A+B)=P(A)+P(B) P(?A)=1-P(A) P(A B)=P(A)·P(B) P(B | A)= P(A B) P(A)

第一节 概率及其计算 考纲解读 1.了解随机事件发生的不确定性、频率的稳定性、概率的意义、频率与概率的区别。 2.了解两个互斥事件的概率的加法公式。 3.掌握古典概型及其概率计算公式。 4.了解随机数的意义,能运用模拟方法估计概率。 5.了解几何概型的意义。 命题趋势探究 1.本部分为高考必考内容,在选择题、填空题和解答题中都有渗透。 2.命题设置以两种概型的概率计算及运用互斥、对立事件的概率公式为核心内容,题型及分值稳定,难度中等或中等以下。 知识点精讲 一、必然事件、不可能事件、随机事件 在一定条件下: ①必然要发生的事件叫必然事件; ②一定不发生的事件叫不可能事件; ③可能发生也可能不发生的事件叫随机事件。 二、概率 在相同条件下,做次重复实验,事件A 发生次,测得A 发生的频率为,当很大时,A 发生的频率总是在某个常数附近摆动,随着的增加,摆动幅度越来越小,这时就把这个常数叫做A 的概率,记作。对于必然事件A ,;对于不可能事件A ,=0. 三、基本事件和基本事件空间 在一次实验中,不可能再分的事件称为基本事件,所有基本事件组成的集合称为基本事件空间。 四、两个基本概型的概率公式 1、古典概型 条件:1、基本事件空间含有限个基本事件 2、每个基本事件发生的可能性相同 ()(A) = ()A card P A card = Ω包含基本事件数基本事件总数 2、几何概型 条件:每个事件都可以看作某几何区域Ω的子集A ,A 的几何度量(长度、面积、体积或时间)记为 A μ.

Excel中地描述统计分析报告工具

Excel中的描述统计分析工具 Excel描述统计工具计算与数据的集中趋势、离中趋势、偏度、峰度等有关的描述性统计指标。 使用:工具--数据分析--描述统计—汇总统计 第一次随堂作业的有关事宜通知 1、作业完成地点:北京大学校内 2、随堂作业时间:本周五下午2:30-4:30 3、作业内容:对10年校园调查的汇总数据进行描述统计分析,完成对一个指定主题的深入分析。 4、作业的具体内容:届时参见网络平台的“作业”版块。 5、其他要求:独立完成,不得与别人讨论交流。 第三部分推断统计 第四章概率论与数理统计基础 §1 了解和认识随机事件与概率 北京市天气预报:明天白天降水概率40%,它的含义是: A 明天白天北京地区有40%的地区有降雨; B 明天白天北京地区有40%的时间要下雨;

C 明天白天北京地区下雨的强度有40%; D明天白天北京地区下雨的可能性有40%; E 北京气象局有40%的工程师认为明天会下雨。 一、必然现象与随机现象 1、必然现象:可事前预言,即在准确地重复某些条件下,它的结果总是可以肯定的。 例: 太阳每天从东方升起 在标准大气压下,水加热到100摄氏度,就必然会沸腾 在欧式几何中,三角形的内角和总是180° 在北京大学,不及格科目达到1/3,一定拿不到毕业证 事物间的这种联系是属于必然性的。通常的自然科学各学科就是专门研究和认识这种必然性的,寻求这类必然现象的因果关系,把握它们之间的数量规律。 2、随机现象:一种可能发生,也可能不发生;可能这样发生,也可能那样发生的不确定现象。在随机现象中,可能结果不止一个,且事前无法预知确切的结果。也称偶然现象。 在自然界,在生产、生活中,随机现象十分普遍,也就是说随机现象是大量存在的。 例: 高考的结果 掷骰子的结果 学生对手机品牌的选择 随机抽取的交作业名单 今天来上统计学课的学生人数 这类现象是即使在一定的相同条件下,它的结果也是不确定的。 举例来说,同一个工人在同一台机床上加工同一种零件若干个,它们的尺寸总会有一点差异。在同样条件下,进行小麦品种的人工催芽试验,各颗种子的发芽情况也不尽相同,有强弱和早晚的分别等等。 3、为什么会有随机现象 在这里,我们说的“相同条件”是指一些主要条件来说的,除了这些主要条件外,还会有许多次要条件和偶然因素又是人们无法事先一一能够掌握的。正因为这样,我们在这一类现象中,就无法用必然性的因果关系,对个别现象的结果事先做出确定的答案。事物间的这种关系是属于偶然性的,随机性的。 在同样条件下,多次进行同一试验或调查同一现象,所的结果不完全一样,而且无法准确地预测下一次所得结果,随机现象这种结果的不确定性,是由于一些次要的、偶然的因素影响所造成的。

概率计算方法全攻略

概率计算方法全攻略 在新课标实施以来,中考数学试题中加大了统计与概率部分的考查,体现了“学以致用”这一理念. 计算简单事件发生的概率是重点,现对概率计算方法阐述如下: 一.公式法 P(随机事件)= 的结果数 随机事件所有可能出现果数 随机事件可能出现的结.其中P(必然事件)=1,P (不可能事件) =0;0

概率统计的数学计算解析

概率流程图的数学计算:瀑布算法、圆桌算法、混合算法 概率流程图的数学计算:瀑布算法、圆桌算法、混合算法解析 攻击判定流程研究:瀑布算法、圆桌算法、混合算法解析 攻击判定流程几乎是所有包含战斗玩法的游戏都无法绕过的一块内容,常见的攻击判定流程有瀑布算法、圆桌算法以及混合算法三种。本文简述了这三种判定流程的特征,以实例对比分析了瀑布算法与圆桌算法各自的优点,以期为后续其他战斗数值设计内容的论述提供一定的基础。 攻击判定流程概述 自此开始正文内容的叙述——让我们直接代入一个实例: 在一款游戏中,攻击方有命中率和暴击率两个攻击属性,而防守方有闪避率、招架率和格挡率三个防御属性。于是相应的,一次攻击有可能产生6种判定结果:未命中、普通命中、闪避、招架、格挡和暴击。当采用不同的判定流程进行攻击结算时,6种判定结果出现的频率会截然不同。 1. 瀑布算法 顾名思义,在瀑布算法中,各事件的判定顺序如同瀑布一般自上而下。如果“水流”在某个位置被截断,则后面的流程都将不再继续进行。据我所知,瀑布算法是大多数游戏所采用的攻击判定算法。 上述实例若采用瀑布算法,则会以如下方式进行判定: 瀑布算法流程图 由此我们可以得出: 先判定攻方是否命中再判定是否被守方闪避再判定是否被守方招架再判断是否被守方格挡最后判定该次攻击是否为暴击 瀑布算法特征1:多次掷骰,一次掷骰只判定单个事件的发生与否 瀑布算法特征2:后置判定依赖于前置判定的通过 注:有的游戏会将命中和闪避合并在一次掷骰中判定,这意味着将攻方命中率与守方闪避率合并计算出实际击中概率后再进行掷骰判定,仍是瀑布算法

我们再代入一些具体的数值,设攻守双方角色的面板属性如下: 攻方命中率=90% 攻方暴击率=25% 守方闪避率=20% 守方招架率=15% 守方格挡率=30% 按照上述的流程判定,6种判定结果将会按如下的概率分布: 实际未命中概率=1-命中率=1-90%=10% 实际闪避概率=命中率*闪避率=90%*20%=18% 实际招架概率=命中率*(1-闪避率)*招架率=90%*(1-20%)*15%=10.8% 实际格挡概率=命中率*(1-闪避率)*(1-招架率)*格挡率 =90%*(1-20%)*(1-15%)*30%=18.36% 实际暴击概率=命中率*(1-闪避率)*(1-招架率)*(1-格挡率)*暴击率 =90%*(1-20%)*(1-15%)*(1-30%)*25%=10.71% 实际普通命中概率=命中率*(1-闪避率)*(1-招架率)*(1-格挡率)*(1-暴击率)=90%*(1-20%)*(1-15%)*(1-30%)*(1-25%)=32.13% 瀑布算法的判定结果分布 由此我们可以得出: l 瀑布算法特征3:各事件出现的概率符合经典的概率计算方法 l 瀑布算法特征4:掷骰轮次越偏后的属性衰减程度越大,但不会出现无效的属性 2.圆桌算法 将所有可能出现的事件集合抽象成一个圆桌桌面,便是圆桌算法这一称呼的由来。圆桌算法的实质,是将所有可能发生的事件状态按优先级依次放上桌面,直至所有事件被放完或

excel中的概率统计(非常好的资料)教学提纲

e x c e l中的概率统计 (非常好的资料)

数理统计实验 1Excel基本操作 1.1 单元格操作 1.1.1单元格的选取 Excel启动后首先将自动选取第A列第1行的单元格即A1(或a1)作为活动格,我们可以用键盘或鼠标来选取其它单元格.用鼠标选取时,只需将鼠标移至希望选取的单元格上并单击即可.被选取的单元格将以反色显示. 1.1.2选取单元格范围(矩形区域) 可以按如下两种方式选取单元格范围. (1) 先选取范围的起始点(左上角),即用鼠标单击所需位置使其反色显示.然后按住鼠标左键不放,拖动鼠标指针至终点(右下角)位置,然后放开鼠标即可. (2) 先选取范围的起始点(左上角),即用鼠标单击所需位置使其反色显示.然后将鼠标指针移到终点(右下角)位置,先按下Shift键不放,而后点击鼠标左键. 1.1.3选取特殊单元格 在实际中,有时要选取的单元格由若干不相连的单元格范围组成的.此类有两种情况. 第一种情况是间断的单元格选取.选取方法是先选取第一个单元格,然后按住[Ctrl]键,再依次选取其它单元格即可. 仅供学习与交流,如有侵权请联系网站删除谢谢2

第二种情况是间断的单元格范围选取.选取方法是先选取第一个单元格范围,然后按住[Ctrl]键,用鼠标拖拉的方式选取第二个单元格范围即可. 1.1.4公式中的数值计算 要输入计算公式,可先单击待输入公式的单元格,而后键入=(等号),并接着键入公式,公式输入完毕后按Enter键即可确认..如果单击了“编辑公式”按钮或“粘贴函数”按钮,Excel将自动插入一个等号.提示:(1) 通过先选定一个区域,再键入公式,然后按 CTRL+ENTER 组合键,可以在区域内的所有单元格中输入同一公式. (2) 可以通过另一单元格复制公式,然后在目标区域内输入同一公式. 公式是在工作表中对数据进行分析的等式.它可以对工作表数值进行加法、减法和乘法等运算.公式可以引用同一工作表中的其它单元格、同一工作簿不同工作表中的单元格,或者其它工作簿的工作表中的单元格.下面的示例中将单元格 B4 中的数值加上 25,再除以单元格 D5、E5 和 F5 中数值的和. =(B4+25)/SUM(D5:F5) 1.1.5公式中的语法 公式语法也就是公式中元素的结构或顺序.Excel 中的公式遵守一个特定的语法:最前面是等号(=),后面是参与计算的元素(运算数)和运算符.每个运算数可以是不改变的数值(常量数值)、单元格或区域引用、标志、名称,或工作表函数. 仅供学习与交流,如有侵权请联系网站删除谢谢3

假设检验的基本步骤

假设检验的基本步骤

————————————————————————————————作者:————————————————————————————————日期:

假设检验的基本步骤 (三)假设检验的基本步骤 统计推断 1.建立假设检验,确定检验水准 H0和H1假设都是对总体特征的检验假设,相互联系且对立。 H0总是假设样本差别来自抽样误差,无效/零假设 H1是来自非抽样误差,有单双侧之分,备择假设。 检验水准,a=0.05 检验水准的含义 2.选定检验方法,计算检验统计量 选择和计算检验统计量要注意资料类型和实验设计类型及样本量的问题, 一般计量资料用t检验和u检验; 计数资料用χ2检验和u检验。 3.确定P值,作出统计推理 P≤a,拒绝H0,接受H1 P>a,按a=0.05水准,不拒绝H0,无统计学意义或显著性差异 假设检验结论有概率性,无论使拒绝或不拒绝H0,都有可能发生错误 (四)两均数的假设检验(各种假设检验方法的适用条件及假设的特点、计算公式、自由度确定以及确定概率P值并做出推断结论) u检验适用条件 t检验适用条件 t检验和u检验 1.样本均数与总体均数比较 2.配对资料的比较/成组设计的两样本均数的比较 配对设计的情况:3点 3. 两个样本均数的比较 (1)两个大样本均数比较的u检验 (2)两个小样本均数比较的t检验 (五)假设检验的两类错误及注意事项(Ⅰ和Ⅱ类错误) 1.两类错误 拒绝正确的H0称Ⅰ型错误-弃真,用检验水准α表示,α=0.05,犯I型错误概率为0.05,理论上平均每100次抽样有5次发生此类错误; 接受错误的H0称Ⅱ型错误-存伪。用β表示,(1-β)为检验效能或把握度,意义为两总体有差异,按α水准检出差别的能力,1-β=0.9,若两总体确有差别,理论上平均每100次抽样有90次得出有差别的结论。 两者的关系:α愈大β愈小;反之α愈小β愈大。 2.假设检验中的注意事项 (1)随机化:代表性和均衡可比性 (2)选用适当的检验方法 (3)正确理解统计学意义 (4)结论不绝对 (5)单侧与双侧检验的选择 四.分类变量资料的统计描述

高中数学概率统计

第八讲 概率统计 【考点透视】 1.了解随机事件的发生存在着规律性和随机事件概率的意义. 2.了解等可能性事件的概率的意义,会用排列组合的基本公式计算一些等可能性事件的概率. 3.了解互斥事件、相互独立事件的意义,会用互斥事件的概率加法公式与相互独立事件的概率乘法公式计算一些事件的概率. 4.会计算事件在n 次独立重复试验中恰好发生k 次的概率. 5. 掌握离散型随机变量的分布列. 6.掌握离散型随机变量的期望与方差. 7.掌握抽样方法与总体分布的估计. 8.掌握正态分布与线性回归. 【例题解析】 考点1. 求等可能性事件、互斥事件和相互独立事件的概率 解此类题目常应用以下知识: (1)等可能性事件(古典概型)的概率:P (A )=)()(I card A card =n m ; 等可能事件概率的计算步骤: ① 计算一次试验的基本事件总数n ; ② 设所求事件A ,并计算事件A 包含的基本事件的个数m ; ③ 依公式()m P A n =求值; ④ 答,即给问题一个明确的答复. (2)互斥事件有一个发生的概率:P (A +B )=P (A )+P (B ); 特例:对立事件的概率:P (A )+P (A )=P (A +A )=1. (3)相互独立事件同时发生的概率:P (A ·B )=P (A )·P (B ); 特例:独立重复试验的概率:P n (k )=k n k k n p p C --)1(.其中P 为事件A 在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1项. (4)解决概率问题要注意“四个步骤,一个结合”:

① 求概率的步骤是: 第一步,确定事件性质???? ???等可能事件 互斥事件 独立事件 n 次独立重复试验 即所给的问题归结为四类事件中的某一种. 第二步,判断事件的运算?? ?和事件积事件 即是至少有一个发生,还是同时发生,分别运用相加或相乘事件. 第三步,运用公式()()()()()()()()(1) k k n k n n m P A n P A B P A P B P A B P A P B P k C p p -? =???+=+? ??=??=-??等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解 第四步,答,即给提出的问题有一个明确的答复. 例1.在五个数字12345,,,,中,若随机取出三个数字,则剩下两个数字都是奇数的概率是 (结果用数值表示). [考查目的]本题主要考查概率的概念和等可能性事件的概率求法. [解答过程]0.3提示:1 33 5 C 33.54C 10 2 P ===? 例2.一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为 . [考查目的]本题主要考查用样本分析总体的简单随机抽样方式,同时考查概率的概念和等可能性事件的概率求法. 用频率分布估计总体分布,同时考查数的区间497.5g~501.5的意义和概率的求法. [解答过程]1.20 提示:51.10020P == 例3从自动打包机包装的食盐中,随机抽取20袋,测得各袋的质量分别为(单位:g ): 492 496 494 495 498 497 501 502 504 496 497 503 506 508 507 492 496 500 501 499 根据的原理,该自动包装机包装的袋装食盐质量在497.5g~501.5g 之间的概率约为__________. [考查目的]本题主要考查用频率分布估计总体分布,同时考查数的区间497.5g~501.5的意义和概率的求法.

如何使用excel计算概率论一些题目

如何使用excel 计算概率论一些题目 简单介绍一些 1.1.1 t 分布 Excel 计算t 分布的值(查表值)采用TDIST 函数,格式如下: TDIST (变量,自由度,侧数) 其中: 变量(t ):为判断分布的数值; 自由度(v ):以整数表明的自由度; 侧数:指明分布为单侧或双侧:若为1,为单侧;若为2,为双侧. 范例:设T 服从t (n-1)分布,样本数为25,求P (T >1.711). 已知t =1.711,n =25,采用单侧,则T 分布的值: =TDIST(1.711,24,1) 得到0.05,即P (T >1.711)=0.05. 若采用双侧,则T 分布的值: =TDIST(1.711,24,2) 得到0.1,即() 1.7110.1P T >=. 1.1.2 t 分布的反函数 Excel 使用TINV 函数得到t 分布的反函数,格式如下: TINV (双侧概率,自由度) 范例:已知随机变量服从t (10)分布,置信度为0.05,求t 2 05.0(10).输入公式 =TINV(0.05,10) 得到2.2281,即() 2.22810.05P T >=. 若求临界值t α(n ),则使用公式=TINV(2*α, n ). 范例:已知随机变量服从t (10)分布,置信度为0.05,求t 0.05 (10).输入公式 =TINV(0.1,10) 得到1.812462,即t 0.05 (10)= 1.812462. 1.1.3 F 分布 Excel 采用FDIST 函数计算F 分布的上侧概率1()F x -,格式如下: FDIST(变量,自由度1,自由度2) 其中: 变量(x ):判断函数的变量值; 自由度1(1n ):代表第1个样本的自由度; 自由度2(2n ):代表第2个样本的自由度. 范例:设X 服从自由度1n =5,2n =15的F 分布,求P (X >2.9)的值.输入公式 =FDIST(2.9,5,15)

概率论与数理统计C的习题集-计算题

一、概率公式的题目 1、已知() ()()0.3,0.4, 0.5,P A P B P AB === 求 () .P B A B ? 解:() () () ()()()() () 0.70.51 0.70.60.54 P A P AB P AB P B A B P A B P A P B P AB --?= = = =+-?+- 2、已知()()()0.7,0.4,0.2,P A P B P AB === 求() .P A A B ? 解: () ()() () ()()() 0.22 0.70.29 P A A B P AB P A A B P A B P A P B P AB ??????= = = =+?+-。 3、已知随机变量(1)X P ,即X 有概率分布律{}1 (0,1,2)! e P X k k k -== =, 并记事件{}{}2,1A X B X =≥=<。 求: (1)()P A B ?; (2) ()P A B -; (3) () P B A 。解:(1)()() {}{}1 11()12,1111P A B P A B P AB P X X P X e -?=-?=-=-<≥=-==-; (2)(){}{}{}{}1()2,1210112;P A B P AB P X X P X P X P X e --==≥≥=≥=-=-==- (3)() () () {}{}{}{}{}111,201 .20122P BA P X X P X e P B A P X P X P X e P A --<<== ====<=+= 5、为了防止意外,在矿同时设两种报警系统,A B ,每种系统单独使用时,其有效的概率系统A 为0.92,系统B 为0.93,在A 失灵的条件下,B 有效的概率为0.85,求: (1)发生意外时,这两个报警系统至少有一个有效的概率;(2)B 失灵的条件下,A 有效的概率。 解:设=A “系统A 有效”,=B “系统B 有效”, ()()() 0.92,0.93,0.85P A P B P B A ===, ()()()()()()()()()()1.0.988P A B P A P B P AB P A P AB P A P A P B A ?=+-=+=+= ()()()()()()()()()()() 0.070.080.152.0.8290.07P AB P B P A P B A P B P AB P A B P B P B P B ---?= ==== 6、由长期统计资料得知,某一地区在4月份下雨(记作事件A )的概率为4 15 ,刮风(记作事件B )的概率为 715,既刮风又下雨的概率为110 ,求()()()(1);(2);(3)P A B P B A P A B ?。 解:()()()1 3 10(1)714 15 P AB P A B P B ===;

13.1 概率及其计算

第十三章概率与统计本章知识结构图

第一节 概率及其计算 考纲解读 1.了解随机事件发生的不确定性、频率的稳定性、概率的意义、频率与概率的区别。 2.了解两个互斥事件的概率的加法公式。 3.掌握古典概型及其概率计算公式。 4.了解随机数的意义,能运用模拟方法估计概率。 5.了解几何概型的意义。 命题趋势探究 1.本部分为高考必考内容,在选择题、填空题和解答题中都有渗透。 2.命题设置以两种概型的概率计算及运用互斥、对立事件的概率公式为核心内容,题型及分值稳定,难度中等或中等以下。 知识点精讲 一、必然事件、不可能事件、随机事件 在一定条件下: ①必然要发生的事件叫必然事件; ②一定不发生的事件叫不可能事件; ③可能发生也可能不发生的事件叫随机事件。 二、概率 在相同条件下,做次重复实验,事件A 发生次,测得A 发生的频率为,当很大时,A 发生的频率总是在某个常数附近摆动,随着的增加,摆动幅度越来越小,这时就把这个常数叫做A 的概率,记作。对于必然事件A ,;对于不可能事件A ,=0. 三、基本事件和基本事件空间 在一次实验中,不可能再分的事件称为基本事件,所有基本事件组成的集合称为基本事件空间。 四、两个基本概型的概率公式 1、古典概型 条件:1、基本事件空间含有限个基本事件 2、每个基本事件发生的可能性相同 ()(A) = ()A card P A card = Ω包含基本事件数基本事件总数 2、几何概型 条件:每个事件都可以看作某几何区域Ω的子集A ,A 的几何度量(长度、面积、体积或时间)记为 A μ.

()P A = A μμΩ 。 五、互斥事件的概率 1、互斥事件 在一次实验中不能同时发生的事件称为互斥事件。事件A 与事件B 互斥,则 ()()() P A B P A P B =+U 。 2、对立事件 事件A,B 互斥,且其中必有一个发生,称事件A,B 对立,记作B A =或A B =。 ()() 1P A p A =- 。 3、互斥事件与对立事件的联系 对立事件必是互斥事件,即“事件A ,B 对立”是”事件A ,B 互斥“的充分不必要条件。 题型归纳及思路提示 题型176 古典概型 思路提示 首先确定事件类型为古典概型,古典概型特征有二:有限个不同的基本事件及各基本事件发生的可能性是均等的;其次计算出基本事件的总数及事件A 所包含的基本事件数;最后计算 ()A P A = 包含基本事件数 基本事件总数。 例13.1 设平面向量(),1m a m =,()2,n b n = ,其中{}, 1.2,3,4m n ∈ (1)请列出有序数组(),m n 的所有可能结果; (2) 若“使得()m m n a a b ⊥-成立的(),m n 为事件A ,求事件A 发生的概率。 分析:两向量垂直的充要条件是两向量的数量积为0,从而可得m 与n 的关系,再从以上 (),m n 的16个有序数组中筛选出符合条件的,即得事件A 包含的基本事件个数。 解析:(1)由{}, 1.2,3,4m n ∈,有序数组(),m n 的所有可能结果为()1,1 , ()()() 1,2,1,3,1,4, ()()()() 2,1,2,2,2,3,2,4, ()()()() 3,1,3,2,3,3,3,4, ()()()()4,1,4,2,4,3,4,4 共16个。 (2)因为(),1m a m =,()2,n b n =,所以()2,1m n a b m n -=-- .又()m m n a a b ⊥-,得 ()(),12,10m m n ?--= ,即22m 10m n -+-= ,所以()21n m =- 。故事件A 包含的

常用分布概率计算的Excel应用

上机实习常用分布概率计算的Excel应用利用Excel中的统计函数工具,可以计算二项分布、泊松分布、正态分布等常用概率分布的概率值、累积(分布)概率等。这里我们主要介绍如何用Excel来计算二项分布的概率值与累积概率,其他常用分布的概率计算等处理与此类似。 §3.1 二项分布的概率计算 一、二项分布的(累积)概率值计算 用Excel来计算二项分布的概率值P n(k)、累积概率F n(k),需要用BINOMDIST函数,其格式为: BINOMDIST (number_s,trials, probability_s, cumulative) 其中 number_s:试验成功的次数k; trials:独立试验的总次数n; probability_s:一次试验中成功的概率p; cumulative:为一逻辑值,若取0或FALSE时,计算概率值P n(k);若取1 或TRUE时,则计算累积概率F n(k),。 即对二项分布B(n,p)的概率值P n(k)和累积概率F n(k),有 P n(k)=BINOMDIST(k,n,p,0);F n(k)= BINOMDIST(k,n,p,1) 现结合下列机床维修问题的概率计算来稀疏现象(小概率事件)发生次数说明计算二项分布概率的具体步骤。 例3.1某车间有各自独立运行的机床若干台,设每台机床发生故障的概率为0.01,每台机床的故障需要一名维修工来排除,试求在下列两种情形下机床发生故障而得不到及时维修的概率: (1)一人负责15台机床的维修; (2)3人共同负责80台机床的维修。 原解:(1)依题意,维修人员是否能及时维修机床,取决于同一时刻发生故障的机床数。 设X表示15台机床中同一时刻发生故障的台数,则X服从n=15,p=0.01的二项分布: X~B(15,0.01), 而 P(X= k)= C15k(0.01)k(0.99)15-k,k = 0, 1, …, 15 故所求概率为 P(X≥2)=1-P(X≤1)=1-P(X=0)-P(X=1) =1-(0.99)15-15×0.01×(0.99)14 =1-0.8600-0.1303=0.0097 (2)当3人共同负责80台机床的维修时,设Y表示80台机床中同一时刻发生故障的台数,则Y服从n=80、p=0.01的二项分布,即 Y~B(80,0.01) 此时因为 n=80≥30, p=0.01≤0.2 所以可以利用泊松近似公式:当n很大,p较小时(一般只要n≥30,p≤0.2时),对任一确定的k,有(其中 =np)

概率计算方法

概率计算方法 在新课标实施以来,中考数学试题中加大了统计与概率部分的考查,体现了“学以致用”这一理念. 计算简单事件发生的概率是重点,现对概率计算方法阐述如下: 一.公式法 P(随机事件)= 的结果数 随机事件所有可能出现果数 随机事件可能出现的结.其中P(必然事件)=1,P (不可能事件) =0;0

相关文档
相关文档 最新文档