文档视界 最新最全的文档下载
当前位置:文档视界 › 概率与统计高考常见题型解题思路及知识点总结

概率与统计高考常见题型解题思路及知识点总结

概率与统计高考常见题型解题思路及知识点总结
概率与统计高考常见题型解题思路及知识点总结

概率与统计高考常见题型

解题思路及知识点总结

一、解题思路

(一)解题思路思维导图

(二)常见题型及解题思路

1.正确读取统计图表的信息

典例1:(2017全国3卷理科3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图,根据该折线图,下列结论错误的是().

A .月接待游客量逐月增加

B .年接待游客量逐年增加

C .各年的月接待游客量高峰期大致在7,8月份

D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳 【解析】由题图可知,2014年8月到9月的月接待游客量在减少,则A 选项错误,选A.

2.古典概型概率问题 典例2:(

全国卷理科)我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德

巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是 A.

B.

C.

D.

解:不超过30的素数有2,3,5,7,11,13

,17,19,23,29,共10个,随机选取两个不同的数,共有

种方法,因为

,所以随机选取两个不同的数,其和等于30的有3种方

法,故概率为

,选C.

典例3: (2014全国2卷理科5)某地区空气质量监测资料表明,一天的空气质量为优良的概率是0.75,连续两天为优良的概率是0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是 ( ) A. 0.8 B. 0.75 C. 0.6

D. 0.45

解:设某天空气质量优良,则随后一天空气质量也优良的概率为p,则据条件概率公式得

,故选A.

3.几何概型问题

典例4:(2016全国1卷理科4)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是 ( ) A.13 B.12

C.

23 D.3

4

解:如图所示,画出时间轴:

小明到达的时间会随机地落在图中线段AB 中,而当他到达时间落在线段AC 或DB 时,才能保证他等车的时间不超过10分钟,根据几何概型,所求概率P=

101040+=1

2

.选B.

4.类似超几何分布的离散型随机变量分布列问题(古典概型求概率)

5.类似二项分布的离散型随机变量分布列问题(频率估计概率,相互独立事件概率计算)

典例5(超几何分布与二项分布辨析):某工厂为检验其所生产的产品的质量,从所生产的产品中随机抽取10件进行抽样检验,检测出有两件次品.

(1)从这10件产品中随机抽取3件,其中次品件数为X ,求X 分布列和期望;

(2)用频率估计概率,若所生产的产品按每箱100件装箱,从一箱产品中随机抽取3件,其中次品件数为Y ,求Y 分布列和期望;

(3)用频率估计概率,从所生产的产品中随机抽取3件,其中次品件数为Z ,求Z 分布列和期望.

分析:第(1)问中,抽取产品的总体N=10,所含次品件数M=2,都是明确的,所以该随机变量的分布为超几何分布。第(2)问是从一箱产品中抽取,产品的总体N=100是明确的,但其中有多少件次品M 是不明确的,有的同学根据样本可认为M=20,但违背了题目中的“用频率估计概率”这一条件,或者说没有理解这句话的含义,本质上就是概率的定义没有理解。根据概率定义,“用频率估计概率”这一条件应理解为:从这100件产品中任意抽取1件产品,该件产品是次品的概率是0.2,同时抽取3件等同于不放回抽1件3次,由于每次的概率都是0.2,因此,可以看成独立重复实验,该随机变量的分布为二项分布。第(3)问是从所生产的全部产品中抽取,而全部产品有多少件题目条件没给出,这时总体N 不明确(若总体N 明确,就属于第(2)问情况),其中所含次品件数M 自然也是不明确的。因此,类似的,在“用频率估计概率”这一条件,该随机变量的分布为二项分布。 解:(1)x 的可能取值为0,1,2,根据题意X ~H(10、2、3),所以x 分布列为:

())2,1,0(,2

10282=?==-k C C C k X P k k

,()6.01023=?=X E

(2)Y 的可能取值为0,1,2,3,根据题意Y ~B(3,0.2),所以Y 分布列为:

()())3,2,1,0(,2.012.033=-??==-k C k Y P k

k k

,()6.02.03=?=Y E

(3)Z 的可能取值为0,1,2,3,根据题意Z ~B(3,0.2),所以Z 分布列为:

()())3,2,1,0(,2.012.033=-??==-k C k Z P k

k k

,()6.02.03=?=Z E

以上分析用一个表归纳如下:

从该例以看到,当

N 保持不变,若N 越大,每次不放回抽取,抽到次品的概率与N

M

相差越小,因此,当N 很大时,超几何分布可以近似看成二项分布。

典例6:据报道,全国很多省市将英语考试作为高考改革的重点,一时间“英语考试该如何改革”引起广泛关注,为了解某地区学生和包括老师、家长在内的社会人士对高考英语改革的看法,某媒体在该地区选择了3000人进行调查,就“是否取消英语听力”问题进行了问卷调查统计,结果如下表:

已知在全体样本中随机抽取1人,抽到持“应该保留”态度的人的概率为0.06.

(1)现用分层抽样的方法在所有参与调查的人中抽取300人进行问卷访谈,问应在持“无所谓”态度的人中抽取多少人?

(2)在持“应该保留”态度的人中,用分层抽样的方法抽取6人,再平均分成两组进行深入交流,求第一组中在校学生人数 的分布列和数学期望.

解:(1)∵抽到持“应该保留”态度的人的概率为0.06,∴

,解得 ,

∴持“无所谓”态度的人数为 , ∴应在“无所谓”态度抽取

人. (2)由(1)知持“应该保留”态度的一共有180人,

∴在所抽取的6人中,在校学生人数为 ,社会人士人数为

,于是第一组在校学生人数 的可能取值为 .

即 的分布列为:

典例7(与函数结合):(2018全国1卷理科20)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为

,且各件产品是否为不合格品相互独立.

(1)记20件产品中恰有2件不合格品的概率为,求的最大值点.

(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的作为的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用. (i )若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为,求; (ii )以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验? 解:(1)20件产品中恰有2件不合格品的概率为

.因此 .令

,得

.当

时,

;当

时,

.所以的最大值点为. (2)由(1)知,

. (i )令表示余下的180件产品中的不合格品件数,依题意知,,即

.所以.

(ii )如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.由于,故应该对余下的产品作检验.

6.其他离散型随机变量分布列问题(频率估计概率,方案选择,随机变量取值意义,与其他知识结合) 典例8(与函数结合):(2107全国3卷理科18)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[)2025,,需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的

以最高气温位于各区间的频率代替最高气温位于该区间的概率.

(1)求六月份这种酸奶一天的需求量X (单位:瓶)的分布列; (2)设六月份一天销售这种酸奶的利润为Y (单位:元),当六月份这种酸奶一天的进货量n (单位:瓶)为多少时,Y 的数学期望达到最大值?

解:(1)易知需求量x 可取200,300,500,

()21612003035P X +===?;()3623003035P X ===?;()25742

5003035

P X ++===?. 则分布列为:

X 200 300 500

P

1

5

25 25

(2)①当200n ≤时:()642Y n n =-=,此时max 400Y =,当200n =时取到.

②当200300n <≤时:()()4122002200255Y n n =?+?+-?-????880026800

555

n n n -+=+=, 此时max 520Y =,当300n =时取到. ③当300500n <≤时,

()()()()12220022002300230022555Y n n n =?+-?-+?+-?-+??????????320025n -= 此时520Y <.

④当500n ≥时,易知Y 一定小于③的情况. 综上所述当300n =时,Y 取到最大值为520.

典例9(与数列结合):(2019全国1卷理科21)为了治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得1-分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得1-分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X . (1)求X 的分布列;

(2)若甲药、乙药在试验开始时都赋予4分,(0,1,

,8)i p i =表示“甲药的累计得分为i 时,最终认为甲

药比乙药更有效”的概率,则00p =,81p =,11i i i i p ap bp cp -+=++(1,2,

,7)i =,其中(1)a P X ==-,

(0)b P X ==,(1)c P X ==.假设0.5α=,0.8β=.

(i)证明:1{}i i p p +-(0,1,2,

,7)i =为等比数列;

(ii)求4p ,并根据4p 的值解释这种试验方案的合理性.

解:(1)由题意可知X 所有可能的取值为:1-,0,1

()()11P X αβ∴=-=-;()()()011P X αβαβ==+--;()()11P X αβ==-

则X 的分布列如下:

(2)

0.5α=,0.8β=

0.50.80.4a ∴=?=,0.50.80.50.20.5b =?+?=,0.50.20.1c =?=

(i )()111,2,,7i i i i p ap bp cp i -+=++=???

()110.40.50.11,2,,7i i i i p p p p i -+=++=???

整理可得:()11541,2,,7i

i i p p p i -+=+=??? ()()1141,2,,7i i i i p p p p i +-∴-=-=???

{}1i i p p +∴-()0,1,2,,7i =???是以10p p -为首项,4为公比的等比数列

(ii )由(i )知:

()110144i i i i p p p p p +-=-?=?

78714p p p ∴-=?,67614p p p -=?,……,01014p p p -=?

作和可得:()

88017801111441

4441143

p p p p p ---=?++???+===-

183

41

p ∴=

- (

)

440123

44011841441311

44441434141257

p p p p p --∴=-=?+++==?==

--+ 4p 表示最终认为甲药更有效的.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲

药更有效的概率为41

0.0039257

p =

≈,此时得出错误结论的概率非常小,说明这种实验方案合理.

7.连续型随机变量分布问题

——正态分布

典例10:(2107全国1卷理科19)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm ).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布(

)2

,N μσ

(1)假设生产状态正常,记X 表示一天内抽取的16个零件中其尺寸在()–3,3μσμσ+之外的零件数,

求()1P X …

及X 的数学期望; (2)一天内抽检零件中,如果出现了尺寸在()–3,3μσμσ+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.

(ⅰ)试说明上述监控生产过程方法的合理性;

(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:

9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 10.26

9.91

10.13

10.02

9.22

10.04

10.05

9.95

经计算得16119.9716i i x x ===∑

,0.212s ===,其中i x 为抽取的第i 个零件的尺寸,1216i =?,,,.

用样本平均数x 作为μ的估计值?μ

,用样本标准差s 作为σ的估计值?σ,利用估计值判断是否需对当天的生产过程进行检查?剔除()????3,3μσμσ-+之外的数据,用剩下的数据估计μ和σ(精确到0.01).

附:若随机变量Z 服从正态分布(

)2

,N μσ

,则()–330.9974P Z μσμσ<<+=

,160.99740.9592≈

0.09≈.

【解析】(1)由题可知尺寸落在()33μσμσ-+,

之内的概率为0.9974,落在()33μσμσ-+,之外的概率为0.0026.()()0

16160C 10.99740.99740.9592P X ==-≈,

()()11010.95920.0408P X P X =-=≈-=…,

由题可知()~160.0026X B ,

,所以()160.00260.0416E X =?=. (2)(i )尺寸落在()33μσμσ-+,

之外的概率为0.0026,由正态分布知尺寸落在()33μσμσ-+,之外为小概率事件,因此上述监控生产过程的方法合理.

(ii )39.9730.2129.334μσ-=-?=,39.9730.21210.606μσ+=+?=,

()()339.33410.606μσμσ-+=,,

,因为()9.229.33410.606?,,所以需对当天的生产过程检查. 因此剔除9.22,剔除数据之后:9.97169.22

10.0215μ?-=

=.

()

()()()()2

2222

2[9.9510.0210.1210.029.9610.029.9610.0210.0110.02σ=-+-+-+-+-+

()

()()()()2

2

2

2

2

9.9210.029.9810.0210.0410.0210.2610.029.9110.02-+-+-+-+-+

()

()()()()2

2222

1

10.1310.0210.0210.0210.0410.0210.0510.029.9510.02]0.00815

-+-+-+-+-?

所以0.09σ=≈.

8.最小二乘法求两个线性变量的回归方程问题

典例11:(2016全国3卷理科18)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.

注:年份代码1-7分别对应年份2008-2014.

(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明.

(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:

参考数据:7

i 1

=∑ y i =9.32,7

i 1

=∑ t i y i

参考公式:相关系数()()

n

i

i t

t y y --∑

回归方程y a b t =+中斜率和截距的最小二乘估计公式

分别为:()()

n

i i i 1

n

2

i

i 1

t

t y y (t

t)b ==--=

-∑∑,a=y-b t

解:(1)由折线图中的数据和附注中参考数据得

()()()7

2

i i 1

7

7

i

i i i

i

i 1

i 1

i 1

t 4,t t 0.55.

t

t y y t y

t

y

40.1749.32 2.89,2.89

所以r 0.99.

0.552 2.646

=====-==--=

-=-?=≈≈??∑∑∑∑

因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.

(2)由9.32

y 7

==1.331及(1)得()()

()

7

i

i i 1

7

2

i

i 1

t

t y y 2.89

28

t

t b ==--=

=

-∑∑≈0.103, a=y-b t ≈1.331-0.103×4≈0.92.所以,y 关于t 的回归方程为y =0.92+0.10t.

将2016年对应的t=9代入回归方程得:y =0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.

9.两个变量通过换元可转化为线性相关问题

典例12:(2015全国1卷理科19)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.

表中w i = , =1

w i .

(1)根据散点图判断,y=a+bx 与y=c+d 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出

判断即可,不必说明理由)

(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程.

(3)已知这种产品的年利润z 与x,y 的关系为z=0.2y-x.根据(2)的结果回答下列问题: ①年宣传费x=49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?

附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归线v=α+βu 的斜率和截距的最小二乘估计分别为:=

,=v -u .

解:(1)由散点图的变化趋势可以判断,y=c+d 适宜作为年销售量y 关于年宣传费x 的回归方程类型.

(2)令w= ,先建立y 关于w 的线性回归方程.由于()()

.?.()

i

i

i i

i w w y y d

w w 8

=1

8

2

=1

--1088

==

=6816

-∑∑ = -

=563-68×6.8=100.6,所以y 关于w 的线性回归方程为=100.6+68w,因此y 关于x 的回归方程为=100.6+68

.

(3)①由(2)知,当

x=49时,年销售量y

的预报值=100.6+68

49=576.6,年利润z 的预报值

=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值,=0.2(100.6+68 )-x=-x+13.6 +20.12.所以当 =13

=6.8,即x=46.24

时,取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.

10.两个分类变量是否有关的独立性检验问题

典例13:(2018全国3卷理科18)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:

(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;

(2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工 超过 不超过 ()根据()中的列联表,能否有的把握认为两种生产方式的效率有差异?附:

解:(1)第二种生产方式的效率更高.理由如下:

(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.

(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.

(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.

(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.

二、知识点总结(一)知识点思维导图

(二)常用定理、公式及其变形

1.用样本的数字特征估计总体的数字特征 (1)样本本均值:n

x x x x n

+++=

21

(2)样本标准差:n

x x x x x x s s n 2

22212

)()()(-++-+-=

= (3)频率分布直方图估算样本众数、中位数、平均数 ①众数:最高小矩形中点值; ②中位数:先确定中位数所在小组,设中位数为m ,由直线x=m 两侧小矩形面积之和等于0.5列方程求m . ③平均数:各小矩形中点值与其面积的积的和.

2.随机事件的概率及概率的意义

(1)随机事件:在条件S 下可能发生也可能不发生的事件,叫相对于条件S 的随机事件;

(2)概率定义:在相同的条件S 下重复n 次试验,观察某一事件A 是否出现,称n 次试验中事件A 出现的次数n A 为事件A 出现的频数;称事件A 出现的比例f n (A)=

n

n A 为事件A 出现的频率:对于给定的随机事

件A ,如果随着试验次数的增加,事件A 发生的频率f n (A)稳定在某个常数上,把这个常数记作P (A ),称为事件A 的概率. 3.概率的基本性质

(1)事件的包含、并事件、交事件、相等事件

(2)若A∩B 为不可能事件,即A∩B=ф,那么称事件A 与事件B 互斥;

(3)若A∩B 为不可能事件,A ∪B 为必然事件,那么称事件A 与事件B 互为对立事件;

(4)当事件A 与B 互斥时,满足加法公式:P(A ∪B)= P(A)+ P(B);若事件A 与B 为对立事件,则A ∪B 为必然事件,所以P(A ∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B) 4.古典概型及随机数的产生

(1)古典概型的使用条件:试验结果的有限性和所有结果的等可能性.

(2)公式P (A )=

总的基本事件个数

包含的基本事件数

A 5.几何概型及均匀随机数的产生

(1)几何概率模型:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型;

(2)公式:P (A )=积)

的区域长度(面积或体试验的全部结果所构成积)

的区域长度(面积或体构成事件A .

6.随机变量:如果随机试验可能出现的结果可以用一个变量X 来表示,并且X 是随着试验的结果的不同而变化,那么这样的变量叫做随机变量. 随机变量常用大写字母X 、Y 等或希腊字母 ξ、η等表示. 7.离散型随机变量的分布列:一般的,设离散型随机变量X 可能取的值为x 1,x 2,..... ,x i ,......,x n .

X 取每一个值 x i (i=1,2,......)的概率P(ξ= i )=P i ,则称表为离散型随机变量X 的概率分布,简称分布列

分布列性质:

① p i ≥0, i =1,2, … ; ② p 1 + p 2 +…+p n = 1.

9.条件概率:对任意事件A 和事件B ,在已知事件A 发生的条件下事件B 发生的概率,叫做条件概率.记作P(B|A),读作A 发生的条件下B 的概率公式:.0)(,)

()

()|(>=

A P A P A

B P A B P 10.相互独立事件:事件A(或B)是否发生对事件B(或A)发生的概率没有影响,这样的两个事件叫做相互独立事件,)()()(B P A P B A P ?=?

12.数学期望:一般地,若离散型随机变量ξ的概率分布为

则称 Eξ=x 1p 1+x 2p 2+…+x n p n 为ξ的数学期望或平均数、均值,数学期望又简称为期望.是离散型随机变量.

13.方差:D(ξ)=( 1-Eξ)2·P 1+(x 2-Eξ)2·P 2 +......+(x n -Eξ)2·P n 叫随机变量ξ的均方差,简称方差. 14.正态分布:

(1)定义:若概率密度曲线就是或近似地是函数

的图象,其中解析式中的实数0)μσ

σ>、(是参数,分别表示总体的平均数与标准差.则其分布叫正态分布(,)N μσ记作:,f( x )的图象称为正态曲线; (2)基本性质:

①曲线在x 轴的上方,与x 轴不相交;

②曲线关于直线x=对称,且在x=时位于最高点;

③当一定时,曲线的形状由确定.越大,曲线越“矮胖”;

表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中;

④正态曲线下的总面积等于1. 15.3原则:

从上表看到,正态总体在 以外取值的概率只有4.6%,在 以外取值的概率只有0.3% 由于这些概率很小,通常称这些情况发生为小概率事件.也就是说,通常认为这些情况在一次试验中几乎是不可能发生的.

),(,21)(2

2

2)(+∞-∞∈=--x e x f x σμσ

πμμμσσσσ)2,2(σμσμ+-)3,3(σμσμ+-

17.回归分析

概率统计知识点汇总

概率第一章 (一)概率的加减乘除运算 (二) 概率的计算 1. 古典概型的计算 2. 条件概率的计算 (三) 全概率公式与贝叶斯公式 (四) n 重伯努利试验 概率第二章 (一)随机变量分布函数 1. 分布函数的定义及性质 2. 学会用分布函数表示随机变量落入指定区域的概率 (二)离散型随机变量 1. 具体问题会求解离散型随机变量的分布列 分布列要满足的条件 2. 由分布列会求解分布函数 3. 由分布函数会求解分布列 4. 掌握三个常见的离散型随机变量 (三)连续型随机变量 1. 由分布函数会求解分布密度 2. 由分布密度会求解分布函数 3. 利用分布密度求解未知参数 4. 掌握三个常见的连续型随机变量 (四)随机变量函数的分布 1. 离散型随机变量的函数 2. 连续型随机变量的函数 概率第三章 二维随机向量 (一)联合分布函数的定义及性质 联合概率分布函数定义为____),(=y x F 联合分布函数的性质: ___),(____,),(),(),(=+∞+∞=-∞-∞=-∞=-∞F F y F x F 用联合概率分布函数表示二维随机向量落入指定区域的概率 ____),(2121=≤<≤

概率论与数理统计知识点总结!

《概率论与数理统计》 第一章随机事件及其概率 §1.1 随机事件 一、给出事件描述,要求用运算关系符表示事件: 二、给出事件运算关系符,要求判断其正确性: §1.2 概率 古典概型公式:P (A )= 所含样本点数 所含样本点数 ΩA 实用中经常采用“排列组合”的方法计算 补例1:将n 个球随机地放到n 个盒中去,问每个盒子恰有1个球的概率是多少?解:设A : “每个盒子恰有1个球”。求:P(A)=?Ω所含样本点数:n n n n n =???... Α所含样本点数:!1...)2()1(n n n n =??-?-?n n n A P ! )(=∴ 补例2:将3封信随机地放入4个信箱中,问信箱中信的封数的最大数分别为1、2、3的概率各是多少? 解:设A i :“信箱中信的最大封数为i”。(i =1,2,3)求:P(A i )=? Ω所含样本点数:6444 443==?? A 1所含样本点数:24234=?? 8 36424)(1== ∴A P A 2所含样本点数: 363423=??C 16 9 6436)(2== ∴A P A 3所含样本点数:443 3 =?C 16 1644)(3== ∴A P 注:由概率定义得出的几个性质: 1、0

P(A 1+A 2+...+ A n )= P(A 1) + P(A 2) +…+ P(A n ) 推论2:设A 1、 A 2、…、 A n 构成完备事件组,则 P(A 1+A 2+...+ A n )=1 推论3: P (A )=1-P (A ) 推论4:若B ?A ,则P(B -A)= P(B)-P(A) 推论5(广义加法公式): 对任意两个事件A 与B ,有P(A ∪B)=P(A)+P(B)-P(A B) 补充——对偶律: n n A A A A A A ???=???......2121 n n A A A A A A ???=??? (2121) §1.4 条件概率与乘法法则 条件概率公式:P(A/B)= )()(B P AB P (P(B)≠0)P(B/A)= ) () (A P AB P (P(A)≠0) ∴P (AB )=P (A /B )P (B )= P (B / A )P (A ) 有时须与P (A+B )=P (A )+P (B )-P (AB )中的P (AB )联系解题。 全概率与逆概率公式: 全概率公式: ∑==n i i i A B P A P B P 1 )/()()( 逆概率公式: ) () ()/(B P B A P B A P i i = ),...,2,1(n i = (注意全概率公式和逆概率公式的题型:将试验可看成分为两步做,如果要求第二步某事件的概率,就用全概率公式;如果求在第二步某事件发生条件下第一步某事件的概率,就用逆概率公式。) §1.5 独立试验概型 事件的独立性: )()()(B P A P AB P B A =?相互独立与 贝努里公式(n 重贝努里试验概率计算公式):课本P24 另两个解题中常用的结论—— 1、定理:有四对事件:A 与B 、A 与B 、A 与B 、A 与B ,如果其中有一对相互 独立,则其余三对也相互独立。 2、公式:)...(1)...(2121 n n A A A P A A A P ???-=??? 第二章 随机变量及其分布

概率论重要知识点总结

概率论重要知识点总结 概率论重要知识点总结 第一章随机事件及其概率 第一节基本概念 随机实验:将一切具有下面三个特点: (1)可重复性 (2)多结果性 (3)不确定性的试验或观察称为随机试验,简称为试验,常用表示。 随机事件:在一次试验中,可能出现也可能不出现的事情(结果)称为随机事件,简称为事不可能事件:在试验中不可能出现的事情,记为。必然事件:在试验中必然出现的事情,记为Ω。 样本点:随机试验的每个基本结果称为样本点,记作ω.样本空间:所有样本点组成的集合称为样本空间.样本空间用Ω表示.一个随机事件就是样本空间的一个子集。基本事件—单点集,复合事件—多点集一个随机事件发生,当且仅当该事件所包含的一个样本点出现。事件的关系与运算(就是集合的关系和运算)包含关系:若事件发生必然导致事件B发生,则称B 包含A,记为,则称事件A与事件B 相等,记为A=B。 事件的和:“事件A 与事件B 至少有一个发生”是一事件,称此事件为事件A 与事件B 事件的积:称事件“事件A与事件B 都发生”为A 或AB。事件的差:称事件“事件A 发生而事件B 不发生”为事件A 与事件B 的差事件,记为A-B。用交并补可以表示为互斥事件:如果A,B两事件不

能同时发生,即AB=Φ,则称事件A 与事件B 是互不相容事件或互斥事件。互斥时可记为A+B。对立事件:称事件“A不发生”为事件A 的对立事件(逆事件),记为A 。对立事件的性质:事件运算律:设A,B,C为事件,则有: (1)交换律:AB=BA,AB=BA A(BC)=(AB)C=ABC (3)分配律:A(BC)=(AB)(AC)ABAC (4)对偶律(摩根律): 第二节事件的概率 概率的公理化体系:第三节古典概率模型1、设试验E 是古典概型,其样本空间Ω个样本点组成.则定义事件A 的概率为的某个区域,它的面积为μ(A),则向区域上随机投掷一点,该点落在区域假如样本空间Ω可用一线段,或空间中某个区域表示,则事件A 的概率仍可用上式确定,只不过把μ理解为长度或体积即可.第四节条件概率条件概率:在事件B 发生的条件下,事件A 发生的概率称为条件概率,记作乘法公式: P(AB)=P(B)P(A|B)=P(A)P(B|A)全概率公式:设第五节事件的独立性两个事件的相互独立:若两事件A、B 满足P(AB)=相互独立.三个事件的相互独立:对于三个事件A、B、C,若P(AB)=相互独立三个事件的两两独立:对于三个事件A、B、C,若P(AB)=两两独立独立的性质:若A 均相互独立总结: 1.条件概率是概率论中的重要概念,其与独立性有密切的关系,在不具有独立性的场合,它将扮演主要的角色。 2.乘法公式、全概公式、贝叶斯公式在概率论的计算中经常使用,应

(最全)高中数学概率统计知识点总结

概率与统计 一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。 2、平均数:①、常规平均数:12n x x x x n ++???+= ②、加权平均数:112212n n n x x x x ωωωωωω++???+=++???+ 3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。 4、方差:2222121 [()()()]n s x x x x x x n = -+-+???+- 二、频率直方分布图下的频率 1、频率 =小长方形面积:f S y d ==?距;频率=频数/总数 2、频率之和:121n f f f ++???+=;同时 121n S S S ++???+=; 三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。 2、平均数: 112233n n x x f x f x f x f =+++???+ 112233n n x x S x S x S x S =+++???+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。 4、方差:22221122()()()n n s x x f x x f x x f =-+-+???+- 四、线性回归直线方程:???y bx a =+ 其中:1 1 2 22 1 1 ()() ?() n n i i i i i i n n i i i i x x y y x y nxy b x x x nx ====---∑∑== --∑∑ , ??a y bx =- 1、线性回归直线方程必过样本中心(,)x y ; 2、?0:b >正相关;?0:b <负相关。 3、线性回归直线方程:???y bx a =+的斜率?b 中,两个公式中分子、分母对应也相等;中间可以推导得到。 五、回归分析 1、残差:??i i i e y y =-(残差=真实值—预报值)。分析:?i e 越小越好; 2、残差平方和:21?()n i i i y y =-∑, 分析:①意义:越小越好; ②计算:222211221 ????()()()()n i i n n i y y y y y y y y =-=-+-+???+-∑ 3、拟合度(相关指数):221 2 1 ?()1() n i i i n i i y y R y y ==-∑=- -∑,分析:①.(]20,1R ∈的常数; ②.越大拟合度越高; 4、相关系数 :()() n n i i i i x x y y x y nx y r ---?∑∑= = 分析:①.[r ∈-的常数; ②.0:r >正相关;0:r <负相关 ③.[0,0.25]r ∈;相关性很弱; (0.25,0.75)r ∈;相关性一般; [0.75,1]r ∈;相关性很强; 六、独立性检验 1、2×2列联表: 2、独立性检验公式 ①.2 2() ()()()() n ad bc k a b c d a c b d -= ++++ ②.犯错误上界P 对照表 3、独立性检验步骤

最新统计概率文科题型总结

精品文档 统计和概率高考题型总结 题型一、频率分布直方图 1.对某校高三年级学生参加社区服务次数进行统计, 随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数. 根据此数据作出了频数与频率的统计表和频率分布直方图如下: (Ⅰ)求出表中,M p 及图中a 的值; (Ⅱ)若该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间[10,15) 内的人数; (Ⅲ)在所取样本中,从参加社区服务的次数不少于20次的学生中任选2人,求至多一人参加社区服务次数在区间 [25,30)内的概率. 题型二、古典概型 2.某日用品按行业质量标准分成五个等级,等级系数X 依次为1,2,3,4,5.现从一批该日用品中随机抽取20件,对其等级系数进行统计分析,得到频率分布表如下: (I )若所抽取的20件日用品中,等级系数为4的恰有3件,等级系数为5的恰有2件,求a ,b ,c 的值; (Ⅱ)在(I )的条件下,将等级系数为4的3件日用品记为x 1,x 2,x 3,等级系数为5的2件日用品记为y 1,y 2,现从x 1,x 2,x 3,y 1,y 2这5件日用品中任取两件(假定每件日用品被取出的可能性相同),写出所有可能的结果,并求这两件日用品的等级系数恰好相等的概率. 题型三、回归方程 3.某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,他们分别记录了3月1日至3月5

精品文档 (I )从3月1日至3月5日中任选2天,记发芽的种子数分别为,,求事件“,均小于25”的概率; (II )请根据3月2日至3月4日的数据,求出y 关于x 的线性回归方程???y bx a =+; (III )若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方 程是可靠的,试问(II )所得的线性回归方程是否可靠? (参考公式:回归直线方程式???y bx a =+,其中1 2 2 1 ???,n i i i n i i x y nx y b a y bx x nx ==-==--∑∑) 题型四、独立性检验 4. 为了解学生喜欢数学是否与性别有关,对50个学生进行了问卷调查得到了如下的列联表: (1(2(参考公式:2 () ()()()() n a d b c K a bc d a cb d -=+ +++,其中na b cd =+++ ) 题型五、茎叶图 5.随机抽取某中学甲、乙两班各10名同学,测量它们的身高(单位:cm ),获得身高数据的茎叶图如图所示。 甲班 乙班 2 18 1 9 9 1 0 17 0 3 6 8 9 8 8 3 2 16 2 5 8 8 15 9 (1) 根据茎叶图判断哪两个班的平均身高较高; (2) 计算甲班的样本方差; (3) 现从乙班这10名同学中随机抽取两名身高不低于173cm 的同学,求身高为176cm 的同学被抽中的概率。 题型六、分层抽样 已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19. (1) 求x 的值;

概率论知识点总结

概率论总结 目录 一、前五章总结 第一章随机事件和概率 (1) 第二章随机变量及其分布 (5) 第三章多维随机变量及其分布 (10) 第四章随机变量的数字特征 (13) 第五章极限定理 (18) 二、学习概率论这门课的心得体会 (20) 一、前五章总结 第一章随机事件和概率 第一节:1.、将一切具有下面三个特点:(1)可重复性(2)多结 果性(3)不确定性的试验或观察称为随机试验,简称为试验,常用 E表示。 在一次试验中,可能出现也可能不出现的事情(结果)称为随 机事件,简称为事件。 不可能事件:在试验中不可能出现的事情,记为Ф。 必然事件:在试验中必然出现的事情,记为S或Ω。 2、我们把随机试验的每个基本结果称为样本点,记作e 或ω. 全体 样本点的集合称为样本空间. 样本空间用S或Ω表示.

一个随机事件就是样本空间的一个子集。 基本事件—单点集,复合事件—多点集 一个随机事件发生,当且仅当该事件所包含的一个样本点出现。 事件间的关系及运算,就是集合间的关系和运算。 3、定义:事件的包含与相等 若事件A发生必然导致事件B发生,则称B包含A,记为B?A 或A?B。 若A?B且A?B则称事件A与事件B相等,记为A=B。 定义:和事件 “事件A与事件B至少有一个发生”是一事件,称此事件为事件 A与事件B的和事件。记为A∪B。用集合表示为: A∪B={e|e∈A,或e∈B}。 定义:积事件 称事件“事件A与事件B都发生”为A与B的积事件,记为A∩ B或AB,用集合表示为AB={e|e∈A且e∈B}。 定义:差事件 称“事件A发生而事件B不发生,这一事件为事件A与事件B的差 事件,记为A-B,用集合表示为 A-B={e|e∈A,e?B} 。 定义:互不相容事件或互斥事件 如果A,B两事件不能同时发生,即AB=Φ,则称事件A与事件 B是互不相容事件或互斥事件。 定义6:逆事件/对立事件 称事件“A不发生”为事件A的逆事件,记为ā。A与ā满足:A ∪ā= S,且Aā=Φ。

概率知识点总结及题型汇总-统计概率知识点总结

概率知识点总结及题型汇总 一、确定事件:包括必然事件和不可能事件 1、在一定条件下必然要发生的事件,叫做必然事件。必然事件是指一定能发生的事件,或者说发生的可能性是100%;如:从一包红球中,随便取出一个球,一定是红球。 2、在一定条件下不可能发生的事件,叫做不可能事件。不可能事件是指一定不能发生的事件,或者说发生的可能性是0,如:太阳从西边出来。这是不可能事件。 3、必然事件的概率为1,不可能事件的概率为0 二、随机事件 在一定条件下可能发生也可能不发生的事件,叫做随机事件。 一般地,随机事件发生的可能性是有大小的,不同的随机事件发生的可能性的大小有可能不同.一个随机事件发生的可能性的大小用概率来表示。 三、例题:指出下列事件中,哪些是必然事件,哪些是随机事件,哪些是不可能事件,哪些是确定事件? ①一个玻璃杯从一座高楼的第10层楼落到水泥地面上会摔破; ②明天太阳从西方升起;③掷一枚硬币,正面朝上; ④某人买彩票,连续两次中奖;⑤今天天气不好,飞机会晚些到达. 解:必然事件是①;随机事件是③④⑤;不可能事件是②.确定事件是①② 三、概率 1、一般地,对于一个随机事件A ,把刻画其发生可能性大小的数值,称为随机事件A 发生的概率,记为P(A) . (1)一个事件在多次试验中发生的可能性,反映这个可能性大小的数值叫做这个事件发生的概率。(2)概率指的是事件发生的可能性大小的的一个数值。 2、概率的求法:一般地,如果在一次试验中,有n 种可能的结果,并且它们发生的可能性 都相等,事件 A 包含其中的m种结果,那么事件A 发生的概率为P(A) = m n . (1)一般地,所有情况的总概率之和为1。(2)在一次实验中,可能出现的结果有限多个. (3)在一次实验中,各种结果发生的可能性相等. (4)概率从数量上刻画了一个随机事件发生的可能性的大小,事件发生的可能性越大,则它的概率越接近1;反之,事件发生的可能性越小,则它的概率越接近0。 (5)一个事件的概率取值:0≤P(A)≤1 当这个事件为必然事件时,必然事件的概率为1,即P(必然事件)=1 不可能事件的概率为0,即P(不可能事件)=0 随机事件的概率:如果A为随机事件,则0<P(A)<1 (6)可能性与概率的关系 事件发生的可能性越大,它的概率越接近于1,事件发生的可能性越小,则它的概率越接近0.

最新统计概率知识点归纳总结大全

统计概率知识点归纳总结大全 1.了解随机事件的发生存在着规律性和随机事件概率的意义. 2.了解等可能性事件的概率的意义,会用排列组合的基本公式计算一些等可能性事件的概率. 3.了解互斥事件、相互独立事件的意义,会用互斥事件的概率加法公式与相互独立事件的概率乘法公式计算一些事件的概率. 4.会计算事件在n 次独立重复试验中恰好发生k 次的概率. 5. 掌握离散型随机变量的分布列. 6.掌握离散型随机变量的期望与方差. 7.掌握抽样方法与总体分布的估计. 8.掌握正态分布与线性回归. 考点1. 求等可能性事件、互斥事件和相互独立事件的概率 解此类题目常应用以下知识: (1)等可能性事件(古典概型)的概率:P (A )=) ()(I card A card =n m ; 等可能事件概率的计算步骤: (1) 计算一次试验的基本事件总数n ; (2) 设所求事件A ,并计算事件A 包含的基本事件的个数m ; (3) 依公式()m P A n =求值; (4) 答,即给问题一个明确的答复. (2)互斥事件有一个发生的概率:P (A +B )=P (A )+P (B ); 特例:对立事件的概率:P (A )+P (A )=P (A +A )=1. (3)相互独立事件同时发生的概率:P (A ·B )=P (A )·P (B ); 特例:独立重复试验的概率:P n (k )=k n k k n p p C --)1(.其中P 为事件A 在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1项.

(4)解决概率问题要注意“四个步骤,一个结合”: ① 求概率的步骤是: 第一步,确定事件性质???? ???等可能事件 互斥事件 独立事件 n 次独立重复试验 即所给的问题归结为四类事件中的某一种. 第二步,判断事件的运算?? ?和事件积事件 即是至少有一个发生,还是同时发生,分别运用相加或相乘事件. 第三步,运用公式()()()()()()()()(1) k k n k n n m P A n P A B P A P B P A B P A P B P k C p p -? =???+=+? ??=??=-??等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解 第四步,答,即给提出的问题有一个明确的答复. 考点2离散型随机变量的分布列 1.随机变量及相关概念 ①随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母ξ、η等表示. ②随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. ③随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量. 2.离散型随机变量的分布列 ①离散型随机变量的分布列的概念和性质 一般地,设离散型随机变量ξ可能取的值为1x ,2x ,……,i x ,……,ξ取每一个值i x (=i 1,2,……)的概率P (i x =ξ)=i P ,则称下表.

概率统计大题总结

概率与统计大题总结 一、 知识点汇编: 1.线性回归分析 (1)函数关系是一种确定性关系,而相关关系是一种非确定性关系.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. (2)线性回归分析:方法是画散点图,求回归直线方程,并用回归直线方程进行预报.其回归方程的截距和斜率的最小二乘估计公式分别为: 回归模型中,R 2表示解释变量对于预报变量变化的贡献率.R 2越接近于1,表示回归的效果越好.如果对某组数据可能采取几种不同的回归方程进行回归分析,也可以通过比较几个R 2,选择R 2大的模型作为这组数据的模型. 说明:r 只能用于线性模型,R 2则可用于任一种模型. 对线性回归模型来说,2 2 =R r . 3、独立性检验 (1)对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类 别,像这类变量称为分类变量. (2)假设有两个分类变量X 和Y ,它们的值域分别为{}11x ,y 和{}12y ,y 其样本频数列联表

称为 y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d a + b + c +d (3)构造随机变量()()()()()() 2 2 +++-= ++++a b c d ad bc K ,a b c d a c b d 利用K 2的大小可以确定在多大程度上可以认为“两个分类变量有关系”,这种方法称为 如:如果k >7.879,就有99.5%的把握认为“X 与Y 有关系”. 4、概率 事件的关系: ⑴事件B 包含事件A :事件A 发生,事件B 一定发生,记作B A ?; ⑵事件A 与事件B 相等:若A B B A ??,,则事件A 与B 相等,记作A=B ; ⑶并(和)事件:某事件发生,当且仅当事件A 发生或B 发生,记作B A ?(或B A +) ; ⑷并(积)事件:某事件发生,当且仅当事件A 发生且B 发生,记作B A ?(或 AB ) ; ⑸事件A 与事件B 互斥:若B A ?为不可能事件(φ=?B A ),则事件A 与互斥;

概率统计常见题型及方法总结

常见大题: 1. 全概率公式和贝叶斯公式问题 B 看做“结果”,有多个“原因或者条件 i A ”可以导致 B 这 个“结果”发生,考虑结果B 发生的概率,或者求在B 发生的条件下,源于某个原因 i A 的概率问题 全概率公式:()()() 1 B |n i i i P B P A P A ==∑ 贝叶斯公式: 1(|)()() ()()n i i i j j j P A B P A P B A P A P B A ==∑|| 一(12分)今有四个口袋,它们是甲、乙、丙、丁,每个口袋中都装有a 只红球和b 只白球。先从甲口袋中任取一只球放入乙口袋,再从乙口袋中任取一只球放入丙口袋,然后再从丙口袋中任取一只球放入丁口袋,最后从丁口袋中任取一球,问取到红球的概率为多少? 解i B 表示从第i 个口袋放入第1+i 个口袋红球,4,3,2,1=i i A 表示从第i 个口袋中任取一个球为红球,2分 则 b a a B P += )(1,2分 111++++ ++++=b a a b a b b a a b a a b a a +=2分 依次类推2分 二(10分)袋中装有m 只正品硬币,n 只次品硬币(次品硬币的两面均印有国徽),在袋中任取一只,将它投掷r 次,已知每次都出现国徽,问这只硬币是次品的概率为多少? 、解记B ={取到次品},B ={取到正品},A ={将硬币投掷r 次每次都出现国徽} 则()(),n m P B P B m n m n = = ++,()1P A B =,()1 2r P A B =―—5分 三、(10分)一批产品共100件,其中有4件次品,其余皆为正品。现在每次从中任取一件产品 进行检验,检验后放回,连续检验3次,如果发现有次品,则认为这批产品不合格。在检验时,一件正品被误判为次品的概率为0.05,而一件次品被误判为正品的概率为0.01。(1)求任取一件产品被检验为正品的概率;(2)求这批产品被检验为合格品的概率。 解设A 表示“任取一件产品被检验为正品”,B 表示“任取一件产品是正品”,则 ()96100P B = ,()4100 P B =,()|0.95P A B =,()|0.01P A B =

概率统计大题题型总结(理)学生版

统计概率大题题型总结 题型一 频率分布直方图与茎叶图 例1.(2013广东理17)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如 图所示,其中茎为十位数,叶为个位数. (Ⅰ) 根据茎叶图计算样本均值; (Ⅱ) 日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人; (Ⅲ) 从该车间12名工人中,任取2人,求恰有名优秀工人的概率. 例2.(2013新课标Ⅱ理)经销商经销某种农产品,在一个销售季度内,每售出t 该产品获利润500 元,未售出的产品,每t 亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130t 该农产品,以X (单位:t,150100≤≤X )表示下一个销售季度内的市场需求量,T (单位:元)表示下一个销售季度内销商该农产品的利润. (Ⅰ)将T 表示为X 的函数; (Ⅱ)根据直方图估计利润T 不少于57000元的概率; 1 7 9 2 0 1 5 3 0 第17题图

(Ⅲ)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若[100,110)X ∈,则取105X =,且105X =的概率等于需求量落入[100,110)的概率),求利润T 的数学期望. 变式1. 【2015高考重庆,理3】重庆市2013年各月的平均气温(o C )数据的茎叶图如下: 08912 58 200338312 则这组数据的中位数是( ) A 、19 B 、20 C 、21.5 D 、23 /频率组距0.010 0.0150.0200.0250.030100110120130140150需求量/x t

概率论知识点总结

概率论知识点总结 第一章 随机事件及其概率 第一节 基本概念 随机实验:将一切具有下面三个特点:(1)可重复性(2)多结果性(3)不确定性的试验或观察称为随机试验,简称为试验,常用 E 表示。 随机事件:在一次试验中,可能出现也可能不出现的事情(结果)称为随机事件,简称为事件。 不可能事件:在试验中不可能出现的事情,记为Ф。 必然事件:在试验中必然出现的事情,记为Ω。 样本点:随机试验的每个基本结果称为样本点,记作ω. 样本空间:所有样本点组成的集合称为样本空间. 样本空间用Ω表示. 一个随机事件就是样本空间的一个子集。基本事件—单点集,复合事件—多点集 一个随机事件发生,当且仅当该事件所包含的一个样本点出现。 事件的关系与运算(就是集合的关系和运算) 包含关系:若事件 A 发生必然导致事件B 发生,则称B 包含A ,记为A B ?或B A ?。 相等关系:若A B ?且B A ?,则称事件A 与事件B 相等,记为A =B 。 事件的和:“事件A 与事件B 至少有一个发生”是一事件,称此事件为事件A 与事件B 的和事件。记为 A ∪B 。 事件的积:称事件“事件A 与事件B 都发生”为A 与B 的积事件,记为A∩ B 或AB 。 事件的差:称事件“事件A 发生而事件B 不发生”为事件A 与事件B 的差事件,记为 A -B 。 用交并补可以表示为B A B A =-。 互斥事件:如果A ,B 两事件不能同时发生,即AB =Φ,则称事件A 与事件B 是互不相容事件或互斥事件。互斥时B A ?可记为A +B 。 对立事件:称事件“A 不发生”为事件A 的对立事件(逆事件),记为A 。对立事件的性质: Ω=?Φ=?B A B A ,。 事件运算律:设A ,B ,C 为事件,则有 (1)交换律:A ∪B=B ∪A ,AB=BA (2)结合律:A ∪(B ∪C)=(A ∪B)∪C=A ∪B ∪C A(BC)=(AB)C=ABC (3)分配律:A ∪(B∩C)=(A ∪B)∩(A ∪C) A(B ∪C)=(A∩B)∪(A∩C)= AB ∪AC (4)对偶律(摩根律):B A B A ?=? B A B A ?=? 第二节 事件的概率 概率的公理化体系: (1)非负性:P(A)≥0; (2)规范性:P(Ω)=1 (3)可数可加性: ????n A A A 21两两不相容时

概率统计知识点全面总结

知识点总结:统计与概率 I 统计 1.三大抽样 (1)基本定义: ① 总体:在统计中,所有考查对象的全体叫做全体. ② 个体:在所有考查对象中的每一个考查对象都叫做个体. ③ 样本:从总体中抽取的一部分个体叫做总体的样本. ④ 样本容量:样本中个体的数目叫做样本容量. (2)抽样方法: ①简单随机抽样:逐个不放回、等可能性、有限性。=======★适用于总体较少★ 抽签法:整体编号( 1~N )放入不透明的容器中搅拌均匀逐个抽取n 次,即可得样本容量为 n 的样本。 随机数表法:整体编号(等位数,如001、111不能是1、111) 从0~9中随机取一行一列然后初方向随机 (上、下、左、右)重复,超过范围则忽略不计直至取得以n 为样本容量的样本。 ②系统抽样:容量大.等距,等可能。=======★适用于总体多★ 用随机方法编号,若N 无法被整除,则剔除后再分组,n N k 。再用简单随机抽样法来抽取一个个体,设为l ,则编号为l ,k+l ,2k+l ……(n-1)k ,抽出容量为n 的样本。(每组编号相同)。 ③分层抽样:总体差异明显.按所占比例抽取.等可能.=======★适用于由差异明显的几部分构成的总体★ 总体有几个差异明显的部分构成,经总体分成几个部分,然后按照所占比例进行抽样.抽样比为:k =n N 3.总体分布的估计: (1)一表二图: ①频率分布表——数据详实 ②频率分布直方图——分布直观 ③频率分布折线图——便于观察总体分布趋势 ★注:总体分布的密度曲线与横轴围成的面积为1。 (2)茎叶图: ①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数.众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。

概率论和数理统计知识点总结[超详细版]

《概率论与数理统计》 第一章 概率论的基本概念 §2.样本空间、随机事件 1.事件间的关系 B A ?则称事件B 包含事件A ,指事件A 发生必然导致事件B 发生 B }x x x { ∈∈=?或A B A 称为事件A 与事件B 的和事件,指当且仅当A ,B 中至少有一个发生时,事件B A ?发生 B }x x x { ∈∈=?且A B A 称为事件A 与事件B 的积事件,指当A ,B 同时发生时,事件B A ?发生 B }x x x { ?∈=且—A B A 称为事件A 与事件B 的差事件,指当且仅当A 发生、B 不发生时,事件B A —发生 φ=?B A ,则称事件A 与B 是互不相容的,或互斥的,指事件A 与事件B 不能同时发生,基本事件是两两互不相容的 且S =?B A φ=?B A ,则称事件A 与事件B 互为逆事件,又称事件A 与事件B 互为对立事件 2.运算规则 交换律A B B A A B B A ?=??=? 结合律)()( )()(C B A C B A C B A C B A ?=???=?? 分配律 )()B (C A A C B A ???=??)( ))(()( C A B A C B A ??=?? 徳摩根律B A B A A B A ?=??=? B — §3.频率与概率 定义 在相同的条件下,进行了n 次试验,在这n 次试验中,事件A 发生的次数A n 称为事 件A 发生的频数,比值n n A 称为事件A 发生的频率 概率:设E 是随机试验,S 是它的样本空间,对于E 的每一事件A 赋予一个实数,记为P (A ),称为事件的概率 1.概率)(A P 满足下列条件: (1)非负性:对于每一个事件A 1)(0≤≤A P (2)规范性:对于必然事件S 1)S (=P

统计和概率知识点总结

数据的收集、整理与描述 1、全面调查:考察全体对象的调查方式叫做全面调查。 2、抽样调查:调查部分数据,根据部分来估计总体的调查方式称为抽样调查。 3、总体:要考察的全体对象称为总体。 4、个体:组成总体的每一个考察对象称为个体。 5、样本:被抽取的所有个体组成一个样本。 6、样本容量:样本中个体的数目称为样本容量。 7、样本平均数:样本中所有个体的平均数叫做样本平均数。 8、总体平均数:总体中所有个体的平均数叫做总体平均数,在统计中,通常用样本平均数估计总体平均数。 9、频数:一般地,我们称落在不同小组中的数据个数为该组的频数。 10、频率:频数与数据总数的比为频率。 11、组数和组距:在统计数据时,把数据按照一定的范围分成若干各组,分成组的个数称为组数,每一组两个端点的差叫做组距。 数据的分析 1、平均数:一般地,如果有n 个数 ,,,,21n x x x 那么,)(121n x x x n x +++= 叫做这n 个数的平均数,x 读作“x 拔”。 2、加权平均数:如果n 个数中,1x 出现1f 次,2x 出现2f 次,…,k x 出现k f 次 (这里n f f f k =++ 21)。那么,根据平均数的定义,这n 个数的平均数可以表示为 n f x f x f x x k k ++=2211,这样求得的平均数x 叫做加权平均数,其中k f f f ,,,21 叫做权。 3、中位数:将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数(median);如果数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数。 4、众数:一组数据中出现次数最多的数据就是这组数据的众数(mode )。 5、极差:组数据中的最大数据与最小数据的差叫做这组数据的极差(range)。 6、在一组数据,,,,21n x x x 中,各数据与它们的平均数x 的差的平方的平均数,

概率统计常见题型及方法总结

概率统计常见题型及方法 总结 Prepared on 22 November 2020

常见大题: 1. 全概率公式和贝叶斯公式问题 B 看做“结果”,有多个“原因或者条件 i A ”可以导致B 这个“结果”发生,考虑结果B 发生的概率,或者求在B 发生的条件下,源于某个原因i A 的概率问题 全概率公式: ()()() 1B |n i i i P B P A P A ==∑ 贝叶斯公式: 1(|)()() ()()n i i i j j j P A B P A P B A P A P B A ==∑|| 一(12分)今有四个口袋,它们是甲、乙、丙、丁,每个口袋中都装有a 只红球和b 只白球。先从甲口袋中任取一只球放入乙口袋,再从乙口袋中任取一只球放入丙口袋,然后再从丙口袋中任取一只球放入丁口袋,最后从丁口袋中任取一球,问取到红球的概率为多少 解 i B 表示从第i 个口袋放入第1+i 个口袋红球,4,3,2,1=i i A 表示从第i 个口袋中任取一个球为红球, 2分 则 b a a B P +=)(1, 2分

)()()()()(1111111B A P B P B A P B P A P += 111++++ ++++= b a a b a b b a a b a a b a a += 2分 依次类推 2分 b a a A P i += )( 二(10分)袋中装有m 只正品硬币,n 只次品硬币(次品硬币的两面均印有国徽),在袋中任取一只,将它投掷r 次,已知每次都出现国徽,问这只硬币是次品的概率为多少 、解 记B ={取到次品},B ={取到正品},A ={将硬币投掷r 次每次都出现国徽} 则()(),n m P B P B m n m n = = ++,()1P A B =,()1 2r P A B =―—5分 ()()1()212()()()()12 r r r n P B P A B n m n P B A n m n m P B P A B P B P A B m n m n ?+===++?+?++ 三、(10分)一批产品共100件,其中有4件次品,其余皆为正品。现在每次从中任取一件产品进行检验,检验后放回,连续检验3次,如果发现有次品,则认为这批产品不合格。在检验时,一件正品被误判为次品的概率为,而一件次品被误判为正品的概率为。(1)求任取一件产品被检验为正品的概率;(2)求这批产品被检验为合格品的概率。 解 设 A 表示“任取一件产品被检验为正品”, B 表示“任取一件产品是正品”,则 ()96100P B = ,()4100 P B =,()|0.95P A B =,()|0.01P A B = (1)由全概率公式得 ()()()()()||0.9124P A P B P A B P B P A B =+= (2)这批产品被检验为合格品的概率为 ()3 3 0.91240.7596p P A ===???? 四、在电报通讯中不断发出信号‘0’和‘1’,统计资料表明,发出‘0’和‘1’的概率分别为和,由于存在干扰,发出‘0’时,分别以概率和接收到‘0’和‘1’,以的概率收为模糊信号‘x ’;发出‘1’时,分别以概率和收到‘1’和‘0’,以概率收到模糊信号‘x ’。

高中数学概率统计知识点总结

高中数学概率统计知识 点总结 标准化工作室编码[XX968T-XX89628-XJ668-XT689N]

高中数学概率统计知识点总结 一、抽样方法 1.简单随机抽样 2.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法。 3.系统抽样:K (抽样距离)=N (总体规模)/n (样本规模) 4.分层抽样: 二、样本估计总体的方式 1、用样本的频率分布估计总体分布 (1)频率分布直方图的画法;(2)频率的算法;(3)频率分布折线图;(4)总体密度曲线;(5)茎叶图。 茎叶图又称“枝叶图”,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。 2、用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数的算法;(2)标准差、方差公式。 3、样本均值:n x x x x n +++= 21 4、.样本标准差:n x x x x x x s s n 2 22212)()()(-++-+-== 三、两个变量的线性相关 1、正相关 2、负相关 正相关:自变量增加,因变量也同时增加(即单调递增) 负相关:自变量增长,因变量减少(即单调递减) 四、概率的基本概念 (1)必然事件(2)不可能事件(3)确定事件(4)随机事件 (5)频数与频率(6)频率与概率的区别与联系 必然事件和不可能事件统称为确定事件 1他们都是统计系统各元件发生的可能性大小; 2、频率一般是大概统计数据经验值,概率是系统固有的准确值; 3频率是近似值,概率是准确值

(最全)高中数学概率统计知识点总结

概率与统计 一、普通的众数、平均数、中位数及方差 1、 众数 :一组数据中,出现次数最多的数。 2、平均数 : ①、常规平均数: x x 1 x 2 x n ②、加权平均数: x x 1 1 x 2 2 x n n n 1 2 n 3、中位数: 从大到小或者从小到大排列,最中间或最中间两个数的平均数 。 4、方差: s 2 1 [( x 1 x) 2 ( x 2 x )2 ( x n x )2 ] n 二、频率直方分布图下的频率 1、频率 =小长方形面积: f S y 距 d ;频率 =频数 / 总数 2、频率之和 : f 1 f 2 f n 1 ;同时 S 1 S 2 S n 1 ; 三、频率直方分布图下的众数、平均数、中位数及方差 1、众数: 最高小矩形底边的中点。 2、平均数: x x 1 f 1 x 2 f 2 x 3 f 3 x n f n x x 1 S 1 x 2 S 2 x 3 S 3 x n S n 3、中位数: 从左到右或者从右到左累加,面积等于 0.5 时 x 的值。 4、方差: s 2 ( x 1 x )2 f 1 ( x 2 x) 2 f 2 ( x n x) 2 f n 四、线性回归直线方程 : ? ? ? bx y a n (x i x )( y i y ) n x i y i nxy ? ? 其中: b i 1 i 1 , a? y bx n n ( x i x )2 x i 2 nx 2 i 1 i 1 1、线性回归直线方程必过样本中心 ( x , y ) ; ? ? 0 : 负相关。 2、 b 0 : 正相关; b ? 3、线性回归直线方程: y? ? bx a?的斜率 b 中,两个公式中分子、分母对应也相等;中间可以推导得到。 五、回归分析 ?i 1、残差 : ?i y i ?i 越小越好; e y (残差 =真实值—预报值)。分析: e 2、残差平方和 : n ? ) 2 ( y i , i 1 y i n ( y i y ) 2 ( y 1 y ) 2 ( y y ) 2 ( y y ) 2 分析:①意义:越小越好; ②计算: ?i ?1 2 ?2 n ?n i 1 n ?i ) 2 3、拟合度(相关指数) : R 2 1 ( y y ,分析:① . R 2 0,1 ②. 越大拟合度越高; i 1 的常数; n y)2 i ( y i 1 n n 4、相关系数 : r i ( x i x )( y i y) x i y i nx y 1 i 1 n x)2 n y) 2 n x) 2 n y )2 i 1( x i i ( y i ( x i ( y i 1 i 1 i 1 分析:① . r [ 1,1]的常数; ② . r 0: 正相关; r 0: 负相关 ③. r [0,0.25] ;相关性很弱; r (0.25,0.75) ;相关性一般; r [0.75,1] ;相关性很强; 六、独立性检验 x 1 x 2 1、2×2 列联表 : 合计 2、独立性检验公式 bc)2 y 1 a b a b ①. k 2 (a n( ad d ) y 2 c d c d b)(c d )(a c)(b 合计 a c b d n ②.犯错误上界 P 对照表 3、独立性检验步骤

相关文档
相关文档 最新文档