第六章样本及抽样分布
【基本要求】 1、理解总体、个体和样本的概念;
2、理解样本均值、样本方差和样本矩的概念并会计算;
3、理解统计量的概念,掌握几种常用统计量的分布及其结论;
4、理解分位数的概念,会计算几种重要分布的分位数。
【本章重点】样本均值、样本方差和样本矩的计算;抽样分布—— 2 分布,t分布,
F分布;分位数的理解和计算。
【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。
【学时分配】 4 学时
【授课内容】
§6.0前言
前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一
门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;
而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的
一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来
选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理
统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。
§ 6.1随机样本
1
一、总体与样本
1.总体、个体
在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。
例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是
个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每
个男大学生就是个体。
但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几
项数量指标 X ( 可以是向量 ) 和该数量指标X在总体的分布情况。在上述例子中 X 是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X 的这样或那样的数值,因而这个数量指标X 是一个随机变量(或向量),而 X 的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标 X 可能取值的全体组成的集合等同起来。
定义 1:把研究对象的全体(通常为数量指标X 可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。
我们对总体的研究,就是对相应的随机变量X 的分布的研究,所谓总体的分布也就是数量指
标 X 的分布,因此, X 的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体 X 。根据总体中所包括个体的总数,将总体分为:有限总体
和无限总体。
例 1:考察一块试验田中小麦穗的重量:
X =所有小麦穗重量的全体(无限总体);个体——每个麦穗重x
2
对应的分布: F ( x) P{ x} 重量 x的麦穗数 1 ( t ) 2 dt ~ N ( , 2 ) 0 x
x
总麦穗数 2
例 2:考察一位射手的射击情况:
X=此射手反复地无限次射下去所有射击结果全
体;每次射击结果都是一个个体(对应于靶上的一点)
1射中
个体数量化 x
0未中
1 在总体中的比例p 为命中率
0 在总体中的比例1p 为非命中率
总体 X 由无数个 0,1 构成,其分布为两点分布B(1, p)P{ X 1} p, P{ X 0} 1p
2.样本与样本空间
为了对总体的分布进行各种研究,就必需对总体进行抽样观察。
抽样——从总体中按照一定的规则抽出一部分个体的行动。
一般地,我们都是从总体中抽取一部分个体进行观察,然后根据观察所得数据来推断总体的
性质。按照一定规则从总体X 中抽取的一组个体( X1 , X 2 ,, X n ) 称为总体的一个样本,显然,样
本为一随机向量。
为了能更多更好的得到总体的信息,需要进行多次重复、独立的抽样观察(一般进行n 次),若对抽样要求①代表性:每个个体被抽到的机会一样,保证了X 1 , X 2 ,, X n的分布相同,与总体
一样。②独立性: X1 , X 2 ,, X n相互独立。那么,符合“代表性”和“独立性”要求的样本
( X 1 , X2 , , X n ) 称为简单随机样本。易知,对有限总体而言,有放回的随机样本为简单随机样本,
无放回的抽样不能保证X 1 , X 2 ,, X n的独立性;但对无限总体而言,无放回随机抽样也得到简单
随机样本,我们本书则主要研究简单随机样本。
3
对每一次观察都得到一组数据( x1 , x2 , , x n),由于抽样是随机的,所以观察值( x1, x2 ,, x n)
也是随机的。为此,给出如下定义:
定义 2: 设总体 X 的分布函数为F ( x),若X1, X2,, X n是具有同一分布函数 F ( x) 的相互独立的随机变量,则称(X 1, X 2 , , X n)为从总体X中得到的容量为n 的简单随机样本,简称样本。把它们的观察值( x1 , x2 ,, x n)称为样本值。
定义 3: 把样本 ( X1, X2,, X n)的所有可能取值构成的集合称为样本空间,显然一个样本值
( x1, x2,, x n)是样本空间的一个点。
注:样本具有双重性,在理论上是随机变量,在具体问题中是数据。
二、样本的分布:
设总体 X 的分布函数为 F (x),(X1, X2,, X n)是X的一个样本,则其联合分布函数为:
n
F * ( x1 ,x2 , , x n ) = F (x i ) 。
i 1
例 3:设总体X ~ B(1, p) , ( X1 , X 2 , X n ) 为其一个简单随机样本,则样本空间
{( x1 , x2 , ,x n ) x i 0,1 ; i 1,2, ,n } ,因为P{ X x} p x(1 p)1 x,x 0,1
所以样本的联合分布列为:
P{ X1 x1 , X 2 x2 ,L , X n x n } P{ X1 x1} P{ X 2 x2} L P{ X n x n }
p x1 (1 p)1 x1 .p x2 (1p) 1 x2 p x n (1 p)1 x n x 0,1 i 1,2, , n
i
4
§6.2抽样分布
0、引言
有了总体和样本的概念,能否直接利用样本来对总体进行推断呢?一般来说是不能的,需要
根据研究对象的不同,构造出样本的各种不同函数,然后利用这些函数对总体的性质进行统计推
断,为此,我们首先介绍数理统计的另一重要概念——统计量。
一、统计量(随机变量)
定义 1:设( X1, X2,L , X n)是来自总体 X 的一个样本,g( X1, X2,L , X n)是样本的函数,若 g 中不含任何未知参数,则称 g ( X1, X2,, X n)是一个统计量。
设 ( x1 , x2 ,L , x n ) 是对应于样本 ( X 1 , X 2 ,L , X n ) 的样本值,则称g( x1 , x2 ,L , x n )
是 g( X 1 , X 2 ,L , X n ) 的观察值。
下面列出几个常用的统计量。
1、样本均值与样本方差(随机变量)
定义 2 设(X1,X 2 , , X n)是来自总体X 的一个样本,称
1 n
X X i为样本均值。
n i 1
S2 1 n
X)2[ 1
n
2
2XX i X 2 ) 1
n
2
2nX 2 nX 2 ) ( X i ( X i ( X i
n 1 i 1 n 1 i 1 n 1 i 1
1 n
2
nX 2
n
( X i )] 为样本方差。
1 i 1
SS2 1 n ( X i X ) 2为样本标准差。
n 1 i 1
样本均值与样本方差分别刻划了样本的位置特征及样本的分散性特征。
2. 样本矩(r.v )
5
设总体 X 的分布函数为 F (x) ,则称 m k E( X k ) (假设它存在)为 总体 X 的 k 阶原点矩 ;称
k E[( X
E( X ))k ] 为总体 X 的 k 阶中心矩 。把总体的各阶中心矩和原点矩统称为总体矩。
特别
地: m 1 = E( X ) ; 2 D ( x) 是总体 X 的期望和方差。
定义 3:设 ( X 1,X 2,
, X n ) 是来自总体 X 的一个样本,则称
n
A k
1 X i k , k =1, 2, 3 ;为 样本的 k 阶原点矩 (随机变量)
n i
1
n
B k
1
( X i
X ) k , k =1,2,3 ;为 样本值的 k 阶中心矩 (随机变量)。
n i
1
特别地, A 1
X ,但 B 2 与 S 2 却不同,由 S 2 与 B 2 的计算式可知: B 2
n 1 S 2 ,
n
当 n
时, B 2 = S 2 ,所以常利用 B 2 来计算 S (标准差)。
设 ( x 1 , x 2 , , x n ) 为样本 ( X 1 , X 2 , , X n ) 的观测值,则样本矩对应观测值分别为:
1
n
x i ;
x
n i 1
s 2 = 1
n
s 21
n
1 i
( x i x )2 ; s
( x i x ) 2 ;
n 1
n 1 i 1
1
a k
n
n
n
x i k
;
b k
1
( x i x) k ; k =1, 2, 3 ;
i 1
n i 1
在不至于混淆的情况下,这些值也分别称为样本均值、样本方差、样本标准差、样本
k 阶
原点矩、样本 k 阶中心矩 。
p
m k
( n
)
k
1, 2,
【注】: A k
L ,这就是下一章要介绍的矩估计的理论根据。
统计量是我们对总体的分布函数或数字特征进行统计推断的最重要的基本概念, 所以寻求统
计量的分布成为数理统计的基本问题之一。 我们把统计量的分布称为 抽样分布 。然而要求出一个
6
统计量的精确分布是十分困难的。 而在实际问题中, 大多总体都服从正态分布: 而对于正态分布,
我们可以求出一些重要统计量的精确分布,这就是:
二、几种常用的抽样分布 :(正态分布 中的几种统计量的分布)
把 2 分布, t 分布, F 分布,统称为“统计三大分布” 。
1、正态分布
由正态分布的性质,可得如下结论:
1)定理: 设 X 1 , X 2, , X n 相互独立 , X i ~ N ( i , i 2 ) , i
1,2, , n , 是关于 X i 的任一确定的
n
n
n
线性函数 (
a i X i ) ,则 也服从正态分布,且 ~ N ( a i i ,
a i 2 i 2 ) 。
i 1
i
1
i 1
2)结论:若( X 1 , X 2 , , X n )是来自总体 X ~ N ( ,
2
) 的一个样本, X 为样本均值,则
2
① X ~ N
( , )
,由上述结论可知: X 的期望与 X 的期望相同,而 X 的方差却比 X 的方差 n
小的多,即 X 的取值将更向
集中。
② X 与 S 2 相互独立。
2、
2
分布
1)定义:设( X 1, X 2,
, X n )是来自总体 X ~ N( 0,1) 的一个样本,则称统计量:
2
n
X i 2 所服从的分布是自由度为 n 的 2
2
2
( n ) 。
分布,记作:
~
i
1
1 n 1
x
x 0
2
(n) 的概率密度函数为: 2
( x, n)
n
x 2 e 2
2 2
( n
,
2 )
x 0
其中 :
n
n 1 x
1
x
2
e dx ,
( )
2
2
7
显然,2 ( x, n) 0 ,且 2 ( x, n)dx 1 ,即符合密度函数性质。
n
X i2 ~ ( n ,
1
)
事实上, X 2
i 1 2 2
2) 2 分布的性质
I 、 2 分布的可加性:
设12~ 2 (n1 ) ,22 ~ 2 ( n2 ) ,且12与22相互独立,则:1
2+ 22~ 2 (n1 n2 )
II、若2~ 2 ( n ) ,则E (2) n , D ( 2 ) 2n ,
事实上,因为 X i ~ N(0,1) ,则: E( X i2 ) D ( X i ) 1,
D ( X i2 ) E( X i4 ) [ E( X i2 )] 2 1
x
2
x4 e 2 dx 1 3 1 2 , i 1,2, , n
2
n n n n
所以: E( 2 ) E( X i2 ) E( X i2 ) n ;D ( 2 ) D ( X i2 ) D (X i2 ) 2n
i 1 i 1 i 1 i 1
3) 结论:
设( X1, X2, , X n)为来自总体X ~ N ( , 2 ) 的一个样本,, 2为已知常数,则: I) 统计量
2 1 n
2 2 =0 时也成立)
( X i ) ~ (n) (当
2
i 1
X i n
事实上,令 Y i ,则 Y i ~ N (0,1) ,所以 2 Y i 2 ~ 2 (n)
i 1
II)样本均值 X 与样本方差 S2相互独立,且统计量
(n 1) S 2 1 n 2 2
( X i X ) ~ (n 1) 。
2 2
i 1
证明请参阅有关数理统计的课本。
8
3、 t - 分布
1) 定义 : 设X ~ N (0,1),Y ~ 2 (n),且X与Y相互独立,则称统计量:
T X
所服从的分布是自由度为n 的t分布,记为 T ~ t(n) ,t分布又称为学生氏(Student)分
Y
n
布。
n 1 )x 2 2
( 2
t 分布的概率密度函数为: t (x, n) (1) n 1 x。
( 2n )
n n
2)t 分布的特点(性质)。
I、 t (x; n) 关于 x =0对称;
II、 t( x; n) 在 x =0达最大值;
III、 t (x; n) 的 x 轴为水平渐近线;
1 x 2
IV 、 2 ;即n 时,t 分布N (0,1) ,一般地,当n >30 时,t 分布与N (0,1) lim t ( x, n) e
x 2
非常接近。
V、当n较小时, t 分布与N (0,1)有较大的差异,且对t0R 有
P |T | t0P | X | t0,其中X ~ N (0,1)。
即 t 分布的尾部比N (0,1)的尾部具有更大的概率。
VI 、若T ~ t (n),则 n 1 时,E (T ) 0; n
n 2时, D(T)
n 2
3) 结论:
I) 设(X1, X2, , X n)是来自总体X ~ N ( , 2 ) 的一个样本,则统计量:
( X )
,
T n ~ t(n 1)
s
9
2 X
~ N(0,1),又
(n 1)S 2 2
(n 2 相互独立,则
事实上,由 X ~ N( , ) 2 ~ 1),且X与S n n
X
n 与(n1) S2
相互独立,由t分布的定义,所以2
X n
( X )
n ~ t( n 1)
T
( n 1)S
2 S
2
n 1
II) 设(X1, X 2, , X m)是来自总体 X ~ N ( 1 , 12 ) 的一个样本,( Y1 ,Y2 , ,Y n ) 是来自总体
Y~N( 2, 2 ) 的一个样本,且X与Y相互独立,当 2 2 2 时,则统计量
2 12
(X Y) (12) mn(m n 2) ,
T ~ t (m n 2)
( m 1) S m2 (n 1) S n2 m n
其中, X 1 m X i, S m2 1 m ( X i X )2
m i 1 m 1 i 1
Y 1 n Y i, S n2 1 n i 1 n 1
2
n
(Y i Y) 2 i 1
2
事实上, X ~ N( 1, ),Y~N( 2 ,
n ) ,且 X 与 Y 相互独立,所以:
m
2 2
( X Y) (
12
)
~ N(0,1);
X Y~N( 12 , ) ,即:
m n 1 1
m n
又(m 1)S m2 2
(m 1) ,
(n 1)S n2
~
2
(n 1) ,且它们相互独立,由
2
分布的可加性,则
2 ~ 2
(m 1)S m2 ( n 1)S n2
~ 2 (m n 2) 。由 t 分布的定义:
2 2
(X Y) ( 1 2 )
1 1
(XY)( 12 ) mn(m n 2) ~ t (m n 2) m n
(m 1) S m2 ( n 1)S n2 2 2
m n
2
( m 1) S m (n 1) S n
m n 2
10
4、F -分布
X
1) 定义:设 X ~
2
( m) ,Y ~
2
(n) ,且 X 与 Y 相互独立,则称统计量 F
m
Y 服从自由度为 (m, n)
n
的 F 分布,记作: F ~ F (m, n) ,其中: m 为第一自由度, n 为第二自由度。
由定义,若 T ~ t ( n ) ,则 T 2 ~ F (1, n) 。
F (m, n) 的概率密度函数为:
( m 2 n )
m m
m 2 1
m f ( x; m, n)
(
)( x)
(1
x)
( m 2 ) ( 2n ) n n
n
m n 2
x 0
x 0
说明:先求出 ( X ,Y ) 的联合密度函数 f ( x, y) ,再令 U X Y,V
X
n
Y
m ,求出( U ,V )的联
合 f (u, v) ,注意到 U ,V 独立,所以 V 的边缘密度函数,也即 F 的密度函数。
2) F 分布的性质(特点)
I. 密度曲线不对称 ( 偏态 )
II. 若 F ~ F (m, n) ,则 1
~ F ( n, m)
F
III.当 n
2时, E F
n
n
2
当 n 4时, E F 2
n 2 (m 2)
, D F
n 2 (2m 2n 4) (n 2)(n 4) m(n 2)2 ( n 4)
注: (利用(
1) (
1)
)
3) 结论:
设( X 1,X 2,
, X m )是来自总体 X ~ N ( 1 , 12 ) 的一个样本,( Y 1 ,Y 2 , ,Y n ) 是来自总体
Y~N( 2,
2
2
2
S 12 1) 。
2 ) 的一个样本,且 X 与 Y 相互独立,则 F 2 2 ~ F ( m 1, n
1
S 2
11
(m 1)S 12
2
(m 1)
(n 1)S 22
2
(n 1) ,由 F 分布的定义,可得
事实上,
2
~
,
2
~
1
2
(m 1)S 2
1
2
F
1
( n 1) S 2
2
2
2
/( m 1)
2 2
2S
1
~ F (m 1, n 1)
,
/(n 1)
12S 2
2
其中, S 1
21
n
1
n
( X i X ) 2 ; S 22
(Y i Y )2 m 1 i 1 n 1 i 1
三、分位数
1. 定义:
设随机变量 X 的分布函数为 F ( x) ,对于给定的正数
(0 1) ,若有 x 满足
F ( x ) P{ X
x } ,则称 x 为 X 的(下侧) 分位数 ( 或 分位点 ) 。
2. 表示方法:
①. N (0,1) 的 分位数
1 e x
2
满足:
2
dx
。
2
由标准正态分布的对称性可知:
1
。
②.
2
( n) 分布的 分位数
2
(n) 满足 : 2
( n )
2
( x,n )dx ,由附表 6 查其值:
当 n 45 时, 2
(n)
1
(u
2n 1) 2 或 n
2n u 。
2
③. t( n) 分布的 分位数 t
t ( n )
,由附表 5 可查出其值。由于 n 30 时,
(n) 满足:
t( x,n)dx
t( n) 分布接近于 N (0,1) ,所以当 n
45时,可查 N (0,1) 分布分位数表。由 t 分布的对称性可知:
t
t 1 。
④. F (m, n) 分布的 分位数 F (m, n) 满足:
F ( m,n ) f (x; m, n)dx ,由 F (m, n) 分布性质,有:
F ( m,n) =
1
。
F 1 (n, m )
12
事实上, P{F ( m,n )
P{
11
}
P{
11
} 1
F ( m, n )
F ( m,n )
P{ 1
F 1 ( n,m )} 1
。
⑤. 分位数的其它表示法。
1)若
使 p{ X } ,则 称为 X 的上侧 分位数,显然 : 为原分布的 1- 分位数,
这是因为 P{X
} 1
。
例: 若 X ~ N (0,1) ,
满足 : P{ X
}
0.01 , 则
u 1 0.01 u 0.99 2.326
2)若
1, 2,使 P{ X
1} ,P{ X
2} ;则称
1, 2为 X 的双侧
分位数,
2
2
显然,
1为 X 的
分位数,
2为 X 的 1-
分位数。
2
2
例 : 设 F ~ F ( m,n) , 求
1 ,
2 , 使得 P{ X
1} 0.01 , P{ X 2 } 0.01
解 :
1
F 0.01 (m, n),
2
F 0.99 (m, n)
13
第六章 样本及抽样分布 【内容提要】 一、简单随机样本与统计量 1. 总体 用来表征某一随机试验的数量指标X ,其概率分布称为总体的分布。 2. 简单随机样本 在相同条件下,对总体X 进行n 次独立的重复观察,将所得结果12,,...,n X X X 称为从总体X 中抽取的容量为n 的简单随机样本,试验结束后,可得一组数值12,,...,n x x x ,称其为 12,,...,n X X X 的观察值。 注:若12,,...,n X X X 为总体X 的简单随机样本,则12,,...,n X X X 相互独立,且与总体X 同分布。 3. 统计量 设12,,...,n X X X 为总体X 的简单随机样本,12(,,...,)n T g X X X =为样本12,,...,n X X X 的实值函数,且不含任何未知参数,则称12(,,...,)n T g X X X =为一个统计量,将样本值12,,...,n x x x 代入后算出的函数值12(,,...,)n t g x x x =称为该统计量的值。 注:设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,则常用的统计量有: 4. 经验分布函数 设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,将样本值 按由小到大的顺序重新编号12,1r x x x r n ***<??<≤≤,并设12,,...,n x x x 中取到k x * 的频数为k m , 其中10k k k r m n m n ≤≤≤≤=∑且,则称1110,(),,111,k k i n k k i k x x r x x m m F x x x x k r n n x x ** ** +≤≤≤* ??==≤<≤≤-???≥? ∑∑若若其中若为
第六章 统计量及其抽样分布 练习题 一、填空题(共10题,每题2分,共计20分) 1.简单随机抽样样本均值X 的方差取决于_________和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的_________倍。 2. 设1217,,,X X X 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=,则a =____________。 3.若(5)X t ,则2X 服从_______分布。 4.已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。 5.中心极限定理是说:如果总体存在有限的方差,那么,随着_________的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于_____________。 6. 总体分布已知时,样本均值的分布为_________抽样分布;总体分布未知,大样本情况下,样本均值的分布为_________抽样分布。 7. 简单随机样本的性质满足_________和_________。 8.若(2,4)X N ,查分布表,计算概率(X 3)P ≥=_________。若(X )0.9115P a ≤=,计算a =_________。 9. 若12~(0,2),~(0,2),X N X N 1X 与2X 独立,则2212X X +()/2服从______分布。 10. 若~(16,4)X N ,则5X 服从___________分布。 二、选择题(共10题,每题1分,共计10分)
1.中心极限定理可保证在大量观察下 ( ) A . 样本平均数趋近于总体平均数的趋势 B . 样本方差趋近于总体方差的趋势 C . 样本平均数分布趋近于正态分布的趋势 D. 样本比例趋近于总体比例的趋势 2.设随机变量()(1)X t n n >,则21/Y X =服从 ( ) 。 A. 正态分布 B.卡方分布 C. t 分布 D. F 分布 3.某品牌袋装糖果重量的标准是(500±5)克。为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。下列说法中错误的是( ) A. 样本容量为10 B .抽样误差为2 C. 样本平均每袋重量是统计量 D. 498是估计值 4.设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从( ) A. (100/,25)N n B. N C. (100,25/)N n D. (100,N 5、设2(0,1),(5),X N Y χ且X 与Y 独立,则随机变量_________服从自由度为5的t 分布。 ( ) A. /X Y B. 5/Y X C. /X /
第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 §6.1 随机样本 1
一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量: X=所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2
第 4 章抽样分布自测题选择题 1.抽样分布是指() A. 一个样本各观测值的分布C. 样本统计量的分布 B. 总体中各观测值的分布D. 样本数量的分布 2.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值为() 2 A. B. x C.2 D. n 3.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的方差为() 2 A. B.x C.2 D. n 4.从均值为,方差为2 n 的样本,则()的任意一个总体中抽取大小为 A.当 n 充分大时,样本均值x 的分布近似服从正态分布 B.只有当 n<30 时,样本均值x的分布近似服从正态分布 C.样本均值 x 的分布与n无关 D. 无论 n 多大,样本均值x 的分布都是非正态分布 5.假设总体服从均匀分布,从该总体中抽取容量为 36 的样本,则样本均值的抽样分布() A. 服从非正态分布 B. 近似正态分布 C. 服从均匀分布 D. 服从 2 分布 6. 从服从正态分布的无限总体中分别抽取容量为4,16,36的样本,则当样本容量增大时,样 本均值的标准差() A. 保持不变 B. 增加 C.减小 D.无法确定 7. 某大学的一家快餐店记录了过去 5 年每天的营业额,每天营业额的均值为2500 元,标准差为 400 元。由于在某些节日的营业额偏高,所以每日营业额的分布是右偏的,假设从这5年中随机抽取100 天,并计算这100 天的平均营业额,则样本均值的抽样分布是() A. 正态分布,均值为250 元,标准差为40 元 B. 正态分布,均值为2500 元,标准差为40 元 C.右偏,均值为2500 元,标准差为400 元 D. 正态分布,均值为2500 元,标准差为400 元 8. 在一个饭店门口等待出租车的时间是左偏的,均值为12 分钟,标准差为 3 分钟。如果从饭店门口随机抽取 81 名顾客并记录他们等待出租车的时间,则样本均值的抽样分布是() A. 正态分布,均值为12 分钟,标准差为0.33 分钟 B. 正态分布,均值为12 分钟,标准差为 3 分钟 C. 左偏分布,均值为12 分钟,标准差为 3 分钟
习题六样本及抽样分布 一、填空题 1.设来自总体的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =; 2.在总体中随机地抽取一个容量为 36 的样本,则均值落在4与6之间的概率 = 0.9332 ; 3.设某厂生产的灯泡的使用寿命 (单位:小时,抽取一容量为9的样本,得到 ,则; 4.设为总体的一个样本,则 0.025 ; 5.设为总体的一个样本,且服从分布,这里, ,则1/3 ; 6.设随机变量相互独立,均服从分布且与分别是来自总体的简单随机样本,则统计量服从参数为 9 的 t 分布。 7.设是取自正态总体的简单随机样本且 ,则 0.05 , 0.01 时,统计量服从分布,其自由度为 2 ;
8.设总体 X 服从正态分布,而是来自总体的简单随机样 本,则随机变量 服从 F 分布,参数为 10,5 ; 9.设随机变量则 F(n,1 ; 10.设随机变量且,A为常数,则 0.7 二、选择题 1.设是来自总体的简单随机样本,是样本均值, 记 则服从自由度的分布的随机变量是( A ); A. B. C. D. 2.设是经验分布函数,基于来自总体的样本,而是总体的分布函数,则下列命题错误的为,对于每个给定的( B ) A.是分布函数 B.依概率收敛于 C.是一个统计量 D.其数学期望是
3.设总体服从0-1分布,是来自总体的样本,是样本均值,则下列各选项中的量不是统计量的是( B ) A. B. C. D. 4.设是正态总体的一个样本,其中已知而未知,则下列各选项中的量不是统计量的是( C )。 A. B. C. D. 5.设和分别来自两个正态总体和的样本,且相互独立,分别为两个样本的样本方差,则服从的统计量是( B ) A. B. C. D. 6.设是正态总体的一个样本,和分别为样本均值和样本方差,则下面结论不成立的有( D ) A.相互独立; B.与相互独立; C.与相互独立D.与相互独立。
第6章 样本与抽样分布 第6章的教学要求: 1.理解总体、个体、简单随机样本及其分布的概念. 2.了解直方图和条形图、经验分布函数.会求经验分布函数. 3.了解样本均值、样本方差与样本标准差、样本原点矩、众数和中位数等数字特征,并会根据数据计算这些数字特征的方法. 4.了解2χ分布、t 分布、F 分布.会查表计算上α分位数. 5.理解统计量的概念,掌握来自正态总体的抽样分布. 在概率论中,一切的分析和运算都是基于分布已知这个假设进行的.但在实际问题中,情况往往并非如此,常常是我们对所要研究的随机变量知道不多或知之甚少.这时需要经试验或观测,获得反映随机变量信息的数据,并以概率论为理论基础,对数据进行整理、分析,从而对研究对象的性质和统计规律做出合理、科学的估计和推断.这就是数理统计基本的和主要的任务. 数理统计研究统计的一般原理与方法. 本章主要介绍数理统计中的基本概念、基本分布和正态抽样分布及性质. §6.1 总体与样本 6.1.1 总体和个体 在数理统计中,概括性地说,把研究对象的全体称为总体,把总体中的每个元素称为个体. 例如,研究……学生,……总体,……个体. 但在实际中,我们说研究……学生,一般是带有“目的性”的.如:我们想研究学生的……,根据这种“目的性”,我们研究对象的全体就具体为“……”、个体则为“……”. 因此,也说——总体是研究对象的某数量指标. 记数量指标为X ,则X 是随机变量. 例如,若X 是表示学生的……数量指标,则每个个体的指标值即为X 的取值.注意到,在进行研究时,个体的指标值事先是不知道的,我们一般是通过“随机抽样”的方式来获得个体的指标值及有关情况——即总体X 的取值及其分布的.因此,数量指标X 是一个随机变量. 总体中所包含的个体的数量称为总体容量.根据总体容量的有限或无限,分为有限总体和无限总体. 6.1.2 样本和简单随机样本 通常人们以随机抽样的方式了解总体分布. 把从总体中抽取出的一部分个体称为总体的一个样本,样本中的个体称为样品,样本中所包含的个体的数目称为样本容量. 由于是通过样本来了解总体,所以样本应该具有代表性. 如何获得具有代表性的样本? 获得具有代表性的样本最常采用的方法是:在相同条件下对总体X 进行n 次重复且独立的随机观测,把n 次观测的结果按试验的次序记为12,,,n X X X .采用这种有放回抽取得到的样本12,,,n X X X 是相互独立的随机变量,且均与总体X 有相同的分布,因此它具有代表性,这个样本称为简单随机样本.样本的一次观测值记为12,,,n x x x ,称为样本的一个样本值,这里n 即是样本容量. 如果没有特别说明,在今后的讨论中所提到的样本都指简单随机样本,并简称为样本. 怎样才能获得简单随机样本呢? 对有限总体来说,采用有放回抽取方式就可以得到简单随机样本.但是有放回抽取在实际中有时使用起来不太方便.采用不放回抽取方式取得的样本则不是简单随机样本,但是当总体容量比样本容量大很多时,可以把它当作简单随机样本.对无限总体来说,抽走少量样本后不影响总体的构成或影响很小,因此常采用不放回抽取. 6.1.3 样本的联合分布
第六章样本及抽样分布 【基本要求】 1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布—— 2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】 4 学时 【授课内容】 §6.0前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一 门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性; 而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的 一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来 选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理 统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 § 6.1随机样本 1
一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是 个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每 个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几 项数量指标 X ( 可以是向量 ) 和该数量指标X在总体的分布情况。在上述例子中 X 是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X 的这样或那样的数值,因而这个数量指标X 是一个随机变量(或向量),而 X 的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标 X 可能取值的全体组成的集合等同起来。 定义 1:把研究对象的全体(通常为数量指标X 可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X 的分布的研究,所谓总体的分布也就是数量指 标 X 的分布,因此, X 的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体 X 。根据总体中所包括个体的总数,将总体分为:有限总体 和无限总体。 例 1:考察一块试验田中小麦穗的重量: X =所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2
统计学习题答案第4章抽样与抽样分布
第4章抽样与抽样分布——练习题(全免) 1. 一个具有64 n个观察值的随机样本抽自于均 = 值等于20、标准差等于16的总体。 ⑴给出x的抽样分布(重复抽样)的均值和标 准差 ⑵描述x的抽样分布的形状。你的回答依赖于 样本容量吗? ⑶计算标准正态z统计量对应于5.15 = x的值。 ⑷计算标准正态z统计量对应于23 x的值。 = 解: 已知n=64,为大样本,μ=20,σ=16, ⑴在重复抽样情况下,x的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x<16;⑵x>23;⑶x>25;⑷.x落在16和22之间;⑸x<14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100 n个观察值的随机样本选自于 = μ、16=σ的总体。试求下列概率的近似值:30 =
解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远? ⑶ 为了回答b 你必须要知道μ吗?请解释。 解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。对于每一个样本容量,构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。 解:趋向正态 6. 美国汽车联合会(AAA )是一个拥有90个俱 乐部的非营利联盟,它对其成员提供旅行、
样本及抽样分布 一、填空题 1 ?设来自总体X的一个样本观察值为:2.1, 5.4, 3.2, 9.8, 3.5,则样本均值= 4.8 ,样本方差=2.7161 2; 2. 在总体X ~ N (5,16)中随机地抽取一个容量为36的样本,则均值X落在4 与6之间的概率=0.9332 ; 3. 设某厂生产的灯泡的使用寿命X~N(1000,二2)仲位:小时),抽取一容量为 9 的样本,得到殳=940,s =100 ,则P(X ::: 940) = ___________ ; 7 4. 设X1,X2,?., X7 为总体X ~ N(0,0.52)的一个样本,则Pr X i24^ 0.025 : i=1 5. 设X1,X2,...,X6为总体X ~ N(0,1)的一个样本,且CY服从2分布,这里, Y =(X1 X2 X3)2(X4 X5 X6)2,则C=血_ ; 6?设随机变量X,Y相互独立,均服从N(0,32)分布且X1,X2,...,X9与Y,Y2,...,Y分 别是来自总体X ,Y的简单随机样本,则统计量U= X1... X9服从参数为—9 H2+...+Y2 的_L_分布。 7. 设X11X21X31X4是取自X ~ N(0,22)正态总体的简单随机样本且 ^a(X^2X2)2b(3X^4X4)2,,则a = 0.05 , 0.01 时,统计量Y 服从 2分布,其自由度为一2_; 1 9. 设随机变量X ~t(n)(n 1),Y 2,则Y~ —; X 1 10. 设随机变量X~F(n,n)且P(X∣>A) = 0.3 , A 为常数,则P(XA—)= 0.7 A
8. 设总体X服从正态分布X ~ N(0,22),而X1,X2,...,X15是来自总体的简单随机 X 2十+X2 样本,则随机变量Y X1 2... 利服从F 分布,参数为10,5 ; 2(X11 +...+X15)
抽样分布和样本分布 导读:我根据大家的需要整理了一份关于《抽样分布和样本分布》的内容,具体内容:你们知道各是什么吗?以下是有我为大家整理的,希望能帮到你。抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统... 你们知道各是什么吗?以下是有我为大家整理的,希望能帮到你。抽样分布: 从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基础。 如果从容量为的有限总体抽样,若每次抽取容量为的样本,那么一共可以得到N取n的组合个样本(所有可能的样本个数)。抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。由平均数构成的新总体的分布,称为平均数的抽样分布。随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。 样本分布: 总体是指考察的对象的全体,个体是总体中的每一个考察的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目样本分布是用来估计总体分布的。样本分布有区别于总体分布,它是从总体中按一定的分组标志选出来的部分样本容量。
实际中很多不确定现象都可以用随机变量描述,而应用中的一个十分重要的问题是找到随机变量的分布或其数字特征。例如:某进出口贸易公司进口了10万台微型计算器,按产品技术规定,使用寿命小于4000小时即为次品,且次品率大于1% 就不接受这批产品。如何得知这批产品的次品率呢?是否要测量每一台计算器呢?显然,这是不现实的,解决这个问题的好办法就是随机抽样,然后根据抽样检验得到的次品率来估计整批产品的次品率。也就是从10万台产品中按随机原则,抽取一部分(假如100件)产品组成一个样本,由样本(100件产品)次品率推断整批产品的次品率。 这里,我们把被观察对象的全体(本例中的10万台计算器)称作总体,把从总体中随机抽取的(被抽中的100台计算器)小群体称作样本,而样本中所包含的个体单位数目称为样本容量(100个)。 对于这批计算器,我们关心的是它的使用寿命(低于4000小时的比例有多少)的分布,设X表示"任一台计算器的使用寿命",它是一个随机变量,我们把随机抽中的100件产品看作是100个随机变量X1,X2......,X100,每一个计算器的使用寿命都是一个随机变量,一旦测试完毕,测试的结果就是100个观测值x1,x2,......x100, 统计抽样的任务就是根据测试结果x1,x2,......x100来估计总体X的分布情况。 我们作如下概括:设X是一个随机变量,X1,X2......,Xn是一组相互独立与X具有相同分布的随机变量,称X为总体,X1,X2......,Xn为来自总体的简单随机样本,简称样本,n为样本容量,称样本观察值为样本值,由于按随机原则取样,在试验之前,人们无法知道试验的结果,
第六章样本与抽样分布 §6.1 数理统计的基本概念 一.数理统计研究的对象 例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X表示。 (1)若规定寿命低于1000小时的产品为次品。此问题是求P(X 1000)=F(10000),求F(x)? (2)从平均寿命、使用时数长短差异来看其质量,即求E(x)?、D(x)?。 要解决二个问题
1.试验设计抽样方法。 2.数据处理或统计推断。 方法具有“从局部推断总体”的特点。 二.总体(母体)和个体 1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。 说明: (1)对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体中的分布。所以总体是个体的数量指标的全体。 (2)为研究方便将总体与一个R.V X
对应(等同)。 a.总体中不同的数量指标的全体, 即是R.V.X的全部取值。 b.R.V X的分布即是总体的分布 情况。 例:一批产品是100个灯泡,经测试其寿命是: 1000小时1100小时 1200小时 20个30个50个 X 1000 1100 1200 P 20/100 30/100
50/100 (设X表示灯泡的寿命)可知R.V.X的分布律, 就是总体寿命的分布,反之亦然。 常称总体X,若R.VX~F(x),有时也用F(x)表示一个总体。 (3)我们对每一个研究对象可能要观测两个或多个数量指标,则可用多维随机向量(X,Y,Z, …)去描述总体。 2.总体的分类 有限总体 无限总体
三.简单随机样本. 1.定义6.1 :从总体中抽得的一部分个体组成的集合称为子样(样本),取得的个体叫样品,样本中样品的个数称为样本容量(也叫样本量)。每个样品的测试值叫观察值。 取得子样的过程叫抽样。 样本的双重含义: (1)随机性: 用(X 1,X 2, ……X n) n维随机向量表 示。 X i表示第i个被抽到的个体,是随机变量。(i=1,2,…n)
第5章 样本及抽样分布 1,设总体X 服从均值为1/2的指数分布,4321,,,X X X X 是来自总体的容量为4的样本,求 (1)4321,,,X X X X 的联合概率密度;(2)}2.17.0,15.0{21<<<
第6章 统计量及其抽样分布一、思考题 1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设12n X X X ,, …,是从总体X 中抽取的容量为n 的一个样本,如果由此 样本构造一个函数12()n T X X X ,,…,,不依赖于任何未知参数,则称函数12()n T X X X ,,…,是一个统计量。 (2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。 (3)统计量是样本的一个函数。由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。 2.判断下列样本函数哪些是统计量?哪些不是统计量? 1121021210310410()/10 min() T X X X T X X X T X T X μ μσ =+++==-=-…,,…,()/答:统计量中不能含有未知参数,故1T 、2T 是统计量,3T 、4T 不是统计量。
3.什么是次序统计量? 答:设12n X X X ,, …,是从总体X 中抽取的一个样本,()i X 称为第i 个次序统计量,它是样本 12()n X X X ,,…,满足如下条件的函数:每当样本得到一组观测值12X X ,,…,n X 时,其由小到大的排序 (1)(2)()()i n X X X X ≤≤≤≤≤……中,第i 个值()i X 就作为次序统计量()i X 的观测值,而(1)(2)()n X X X ,,…,称为次序统计量,其中(1)X 和()n X 分别为最小和最大次序统计量。 4.什么是充分统计量? 答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。 5.什么是自由度? 答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。 6.简述2 χ分布、t 分布、F 分布及正态分布之间的关系。答:(1)随机变量X 1,X 2,… X n 相互独立,且都服从标准正态分布,则它们的平方和21 n i i X =∑服从自由度为n 的2 χ分布。(2)随机变量X 服从标准正态分布,Y 服从自由度为n 的2 χ分布,且X 与Y 独立,
样本及抽样分布 §6.1 基本概念 一、总体: 在统计学中, 我们把所研究的全部元素组成的集合称作母体或总体, 总体中的每一个元素称为个体。 我们只研究感兴趣的某个或者几个指标(记为X),因此
把这些指标的分布称为总体的分布,记为X~F(x)。 二、样本: 设总体X具有分布函数 F(x),若X 1, X 2 ,…,X n 是具有分布 函数F(x)的相互独立的随机向量,则称其为总体F(或总体X )的简单随机样本, 简称样本, 它们的观察值x 1,x 2 , …, x n 称为样
本观察值, 又称为X 的n 个独立的观察值。 三、统计量: 设X 1, X 2, … , X n 是来自总体X 的一个样本, g (X 1, X 2, … , X n )是一个与总体分布中未知参数无关的样本的连续函数,则称g (X 1,X 2,… ,X n )为统计量。
统计量是样本的函数,它是一个随机变量,如果x 1, x 2, … , x n 是样本观察值, 则g (x 1, x 2, … , x n )是统计量g (X 1, X 2, … , X n )的一个观察值. 四、 常用的统计量:
, ,)(x 11s ,,x 1x 1. n 1 2 i 2n 1 i 称为样本方差均值仍称为样本 它们的观察值为∑∑==--==i i x n n . B ,, 1,2,X A ,1k 2.222 21S S n n B k ≈-====当样本容量很大时时当时当3.k k k k 若总体X 的k 阶矩E(X )存在, 则当n 时, A . P 注: n i i 1 11. X X ; n ==∑样本均值2 n 2 i i 1 12. S (X ); n-1X ==-∑样本方差n k k i 1 13. k A X , k 1, 2, ; n i ===∑样本阶原点矩n k i i 1 14. k B (X ) , k 2, 3, . n k X ==-=∑样本阶中心矩
习题六 样本及抽样分布 一、填空题 1.设来自总体X 的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =22.716; 2.在总体~(5,16)X N 中随机地抽取一个容量为 36 的样本,则均值X 落在4与6之间的概率 = 0.9332 ; 3. 设某厂生产的灯泡的使用寿命2~(1000,)X N σ (单位:小时),抽取一容量为9的样本,得到940,100x s ==,则(940)P X <= ; 4.设127,,...,X X X 为总体2 ~(0,0.5)X N 的一个样本,则7 21 (4)i i P X =>=∑ 0.025 ; 5.设126,,...,X X X 为总体~(0,1)X N 的一个样本,且cY 服从2χ分布,这里, 22123456()()Y X X X X X X =+++++,则c =1/3 ; 6.设随机变量,X Y 相互独立,均服从2(0,3)N 分布且129,,...,X X X 与129,,...,Y Y Y 分 别是来自总体,X Y 的简单随机样本,则统计量U =服从参数为 9 的 t 分布。 7.设1234,,,X X X X 是取自2~(0,2)X N 正态总体的简单随机样本且 22!234(2)(34),Y a X X b X X =-+-,则a = 0.05 ,b = 0.01 时,统计量Y 服从 2χ分布,其自由度为 2 ; 8.设总体 X 服从正态分布2~(0,2)X N ,而1215,,...,X X X 是来自总体的简单随机 样本,则随机变量 22 110 22 1115...2(...) X X Y X X ++=++ 服从 F 分布,参数为 10,5 ; 9.设随机变量21 ~()(1),,X t n n Y X >=则~Y F(n,1) ; 10.设随机变量~(,)X F n n 且()0.3P X A >=,A 为常数,则1 ()P X A > = 0.7 二、选择题 1.设12,,...,n X X X 是来自总体2(,)N μσ的简单随机样本,X 是样本均值, 记22222 21 23111 111(),(),(),11n n n i i i i i i S X X S X X S X n n n μ====-=-=---∑∑∑ 2 241 1(),n i i S X n μ==-∑则服从自由度1n -的t 分布的随机变量是T =( A ); A . B C D 2.设()n F x 是经验分布函数,基于来自总体X 的样本,而()F x 是X 总体的 分布函数,则下列命题错误的为,对于每个给定的,()n x F x ( B ) A .是分布函数 B .依概率收敛于()F x C .是一个统计量 D .其数学期望是()F x
样本及抽样分布
第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。
§6.1 随机样本 一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量:
样本与抽样分布 §6.1 数理统计的基本概念 一.数理统计研究的对象 例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X表示。(1)若规定寿命低于1000小时的产品为次品。此问题是求P(X 1000)=F(10000),求F(x)? (2)从平均寿命、使用时数长短差异来看其质量,即求E(x)?、D(x)?。 要解决二个问题 1.试验设计抽样方法。 2.数据处理或统计推断。 方法具有“从局部推断总体”的特点。 二.总体(母体)和个体 1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。 说明: (1)对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他 们在整体中的分布。所以总体是个体的数量指标的全体。 (2)为研究方便将总体与一个R.V X对应(等同)。 a.总体中不同的数量指标的全体,即是R.V.X的全部取值。 b.R.V X的分布即是总体的分布情况。 例:一批产品是100个灯泡,经测试其寿命是: 1000小时1100小时1200小时 20个30个50个 X 1000 1100 1200 P 20/100 30/100 50/100 (设X表示灯泡的寿命)可知R.V.X的分布律, 就是总体寿命的分布,反之亦然。 常称总体X,若R.VX~F(x),有时也用F(x)表示一个总体。
(3)我们对每一个研究对象可能要观测两个或多个数量指标,则可用多维随机向量(X,Y,Z, …)去描述总体。 2.总体的分类 有限总体 无限总体 三.简单随机样本. 1.定义6.1 :从总体中抽得的一部分个体组成的集合称为子样(样本),取得的个体叫样品,样本中样品的个数称为样本容量(也叫样本量)。每个样品的测试值叫观察值。 取得子样的过程叫抽样。 样本的双重含义: (1)随机性: 用(X 1,X 2,……X n ) n 维随机向量表示。 X i 表示第i 个被抽到的个体,是随机变量。(i=1,2,…n ) (2)确定性: (x 1,x 2, (x) n )表示n 个实数,即是每个样品X i 观测值x i (i=1,2,…n)。 2.定义6.2: 设总体为X ,若X 1,X 2……X n 相互独立且与X 同分布,则称(X 1,X 2…X n )为来自总体X 的容量为n 的简单随机样本(简称样本)。 3.已知总体的分布写出子样的分布 (1)已知总体X ~F(x ),则样品X i ~F(x i ) i=1,2…n 样本(X 1,X 2…X n )的联合分布为: F( x 1 ,x 2 …x n )=P(X 1≤ x 1 ,X ≤ 2x 2 …X ≤ n x n ) =∏=n i 1 P(X ≤ x i ) =∏=n i 1 F(x i ) 若总体X ~f( x ),样品X i ~f(x i ) i=1,2……n
习题六样本及抽样分布 解答 公司内部档案编码:[OPPTR-OPPT28-OPPTL98-OPPNN08]
样本及抽样分布 一、填空题 1.设来自总体X 的一个样本观察值为:,,,,,则样本均值 = ,样本方差 =22.716; 2.在总体~(5,16)X N 中随机地抽取一个容量为 36 的样本,则均值X 落在4与6之间的概率 = ; 3. 设某厂生产的灯泡的使用寿命2~(1000,)X N σ (单位:小时),抽取一容量为9的样本,得到940,100x s ==,则 (940)P X <= ; 4.设127,,...,X X X 为总体2 ~(0,0.5)X N 的一个样本,则7 21 (4)i i P X =>=∑ ; 5.设126,,...,X X X 为总体~(0,1)X N 的一个样本,且cY 服从2χ分布,这里, 22123456()()Y X X X X X X =+++++,则c =1/3 ; 6.设随机变量,X Y 相互独立,均服从2(0,3)N 分布且129,,...,X X X 与 129,,...,Y Y Y 分别是来自总体,X Y 的简单随机样本,则统计量 U = 服从参数为 9 的 t 分布。 7.设1234,,,X X X X 是取自2~(0,2)X N 正态总体的简单随机样本且 22!234(2)(34),Y a X X b X X =-+-,则a = ,b = 时,统计量Y 服从2 χ分布,其自由度为 2 ;
8.设总体 X 服从正态分布2~(0,2)X N ,而1215,,...,X X X 是来自总体的简单 随机样本,则随机变量 22 110 22 1115...2(...) X X Y X X ++=++服从 F 分布,参数为 10,5 ; 9.设随机变量2 1 ~()(1),,X t n n Y X >= 则~Y F(n,1) ; 10.设随机变量~(,)X F n n 且()0.3P X A >=,A 为常数,则1()P X A >= 11若n ξξ,,1 是取自正态总体),(2 σμN 的一个样本,则∑==n i i n 1 1ξξ服 从 。 12样本),,(1n X X 的函数),,(1n X X f 称为 ,其中 ),,(1n X X f 不含未知参数。 13设总体X 服从),(2σμN ,X 和2S 分别为来自总体X 的样本容量为n 的 样本均值和方差,则 2 1 2 )(σ ∑=-n i i X X ~ , 2 2 )1(σ S n -~ 。 14 设随机变量X 和Y 相互独立且都服从正态分布)3,0(2N ,而91,,X X 和 91,,Y Y 分别是来自总体X 和Y 简单随机样本,则统计量2 92191Y Y X X U ++++= 服从 分布。t (9) 15 设随机变量X 和Y 相互独立且都服从正态分布)3,0(2N ,而91,,X X 和 91,,Y Y 分别是来自总体X 和Y 的简单随机样本,则统计量 2 9 2 12 921Y Y X X V ++++= 服从 分布。F(9,9) 二、选择题