文档视界 最新最全的文档下载
当前位置:文档视界 › I 基本概念与抽样分布1-8#

I 基本概念与抽样分布1-8#

I 基本概念与抽样分布1-8#
I 基本概念与抽样分布1-8#

应用数理统计概述

不确定性数学:1 . 概率论、数理统计),,(P F Ω 2 . 模糊数学 )}(,{x x ?M 3 . 灰色数学 ],[b a H 4 . 未确知数学 )}(],,{[x F b a

对于上述各个数学分支,各自有相应的运算法则和适用范围。

(一) 概率论:

1.),,(P F Ω: E 是一个随机试验,Ω 为E 的全体基本事件的集合 F 由Ω的一些子集为元素 所构成的集合

人们通过对某事件A 的频率)(A f 的研究,发现了概率 )(A P 和性质及运算 2.讨论的一般方法: 随机变量 → 分布 → 数学期望、方差等(宏观指标) ① 对于一维 : )(ωξξ= )(i i x ωξ= ∑

<=

<=x x i i p x P x F }{)(ξ, i i p x P ==}{ξ ;

?

-=

<=x

dt t p x P x F )(}{)(ξ, 0)(≥x p .

?

+∞

-∞

==

dx x xp p x E i i i )(1

ξ; 2)(ξξξE E D -=

② 对于n 维 : 随机变量),,,(21n ξξξ → 实数),,,(21n x x x

},{})({),,(22111

21n n n

i i i n x x x P x p x x x F <<<=<==ξξξωξω ;

(二) 数理统计:

1.基础:统计量??

??

?

=∑=数据分区间处理经验型,如:公式型,n i i

n 11ξξ 及其分布 ???经验分布(直方图)

分布

如:统计分布2

χ

2. 样本的处理:① 参数估计; ② 假设检验(参数假设检验<本科>、非参数假设检

验<分布拟合 与 两总体相等性检验>);

③ 回归分析; ④ 方差分析 与 正交试验设计.

数理统计的基本概念与抽样分布(复习)

一. 基本概念:

1. 总体

ξ

( 被研究对象的全体 );

2. 样本 (n ξξξ,,,21 ) → 观测值(样本值 或 样本点) (n x x x ,,,21 ) 定理:

→)()(~x p x F 或ξ∏

==n

i i n i i n x p x F 1

1

21)()(~

)

,,,(或

ξξξ

3.统计量 针对要解决的问题而构造的相应的样本的函数 ),,,(21n T T ξξξ = 注:统计量不含任何未知参数, ∑==n

i i

n

1

1

ξξ如:等2

1

2

*)

(1

1

ξξ--=

∑=n

i i

n S

它是公式性质的量.

二.经验分布函数与直方图:

目的:用观测值(数据)去估计和推断总体ξ的分布)()(x p x F 或 即:用数据 → 样本分布)(x F n ≈)(x F ; 直方图)(x p n ≈)(x p

1.经验分布函数: ① 定义 若n x x x ,,,21 →ξ

记 )(x n ν 为 n x x x ,,,21 中<x 的个数,则称)(x n ν为 经验频数 ; 并称+∞<<∞-=

x n

x x F n n )()(ν 为总体

ξ

的 经验分布函数(样本分布函数).

② 操作 将)()2()1(21,,,,,,n n x x x x x x → 则

??

?

?

?

?

?

>-=≤<≤==+)

()

1()()

1(1

1,,2,10)()(n k k n n x x n k x x x n k x x n x x F ν

易知:1})()({lim =<-∞

→εx F x F P n n ; )())((x F x F E n =;

1}0)()(lim

{==-+∞

<<∞-∞→x F x F Sup

P n x n (格利汶科 Гливенко)

2.直方图: 总体

ξ

的分布称为理论分布,即:)()(x p x F 或

这里是用样本(数据)构造经验分布)(x p n ≈)(x p 其中)(x p n 的图象称为直方图

① 离散型:设总体ξ的分布列 i i p x P ==}{ξ 未知,若n ξξξξ,,,21 →

令 )(x i ν 表示该抽样中事件}{i x =ξ出现的次数, 则用

n i p n

x i

i ,,2,1)

( =≈ν 事实上,

)(∞→?→?n p n

i

P

i ν

② 连续型:设总体ξ的分布密度

)(x p 未知,若n ξξξξ,,,21 →

设 ),[],[)()1(b a n ?ξξ, 将 ),[),[1+??→?i i m a a b a 个

分 令 i ν 为样本落在),[1+i i a a 中的个数,

?

+=

<≤?→?+1

)(}{1i i

a a i i P

i

dx x p a a P n

ξν ≈m

a b a P i -=}

所以 ≈

=}{i a P ξn m m i a

b m n

i

<-=-?

;1,,2,1 ν

③ 作图实例: (P.65 例1考察钢的含硅量ξ的)(x p n , 以此说明直方图的作法)

1

+i i

处理方法 :找 95.0,64.0)()1(==n x x ;确定 )955.0,635.0[),[=b a ;

确定小区间个数 16=m 以得 组距

02.0=-m

a b ; 计算 i ν ;

画出以 ),[1+i i a a 为底边,高为

的各个矩形 .

有p.67 直方图

p

注: 区间个数m 的大小应根据数据个数n 的大小而定; 当n 、m (m

( 即:缩小组距 ) 时,)(x p n 的上边缘将以光滑的曲线)(x p 为极限.

)

(x p ≈

三.常用统计分布: 1.分布2χ:

① 若n N ξξξξ,,,)1,0(~21 →,则 统计量 )(~2

1

22

n n

i i

χξ

χ

∑==

② 若n N ξξξσμξ,,,),(~212 →,则 )(~)(1

2

22

2

n n i χμξσ

χ

-=

③ 分布2χ的密度曲线为: ④ 分布2χ的实用性结论

⑴ 若 2

2

22

1,,,m χχχ 独立,且),,2,1()

(~2

2

m k n k k =χχ

)(~1

2

1

2∑∑==m

k k m

k k

n χχ

称为分布2χ的可加性

⑵ 若)(~2

2

n χχ

)()

1,0(22

∞→?→?-n N n

n

L

χ

⑶ 若)(~2

2

n χχ

)()1,0(1222

∞→?→?--

n N n L

χ 或 )()

1,12(22

∞→-?→?n n N L

χ

证明思路:

}122{)(2

x n P x F n <--=?

χ

}2{

}2

)12({2

2

2

n x n

n P n x P εχ

χ+<-=-+<

=

其中 0lim =∞

→n n ε 所以 )(21lim )(lim 2

2

x dt e

x F t

x n n n n

Φ==-

+∞

-∞

→∞→?

επ

2.t 分布:

① 若ξ、η独立,且)1,0(~N ξ,)(~2

n χη则 统计量 )(~n t n

t ηξ=

② 若),(~2

σμξN ,

)(~2

2

n χσ

η,ξ、η独立,则 )(~n t n

t η

μξ-=

x

p

③ t 分布的密度曲线为: ④ 结论 :

设 )(~n t t ,记 密度为)()(x p n t

则 ∞

→n lim )()(

x p n t )(212

2

+∞<<-∞=

-

x e

x

π

一般 )30(2)(>≈

n e

x p t π

3.F 分布:

① 若ξ、η独立,

且)(~2m χξ,~2

χηm ξ推论:若),(~n m F F ,则 ,(~1n F F

② F 分布的密度曲线为:

4.分位数(分位点): αx αλ ① 分位数的概念:(i )下侧分位点 αx 使 αξαα==<)(}{x F x P (ii )上侧分位点αλ 使αλξα=≥}{P 显然αλξα-=<1}{P ② 几种分布的常用分位数说明:(本教材利用下侧分位点作为分位数,有)

(i ) 标准正态分布 )1,0(~N U , α的分位数记为

α

u ,

即:α

αα=Φ=<)(}{u u U P (查正态表)

或 αααα=≥?-=>-

}{1}{2

1u

U P u U P

(ii )

2

χ

分布:)(~2

2

n χχ

α

的分位数记为 )(2

n αχ,

即:αχχα=<)}({2

2n P (查2

χ表) 或 α

χ

χ

χχ

αα=≥<-

}{22

12

22

2

及P

注:当n >45 时,使用 2

2

)12(2

1)(-+≈

n u n ααχ

(iii )t 分布: )(~n t t α的分位数记为 )(n t α,

αα=<)}({n t t P (查t 表)注:当n >45 时,使用 ααu n t ≈)(

x

或 αααα=≥?-=>-

)}({1)}({2

1n t

t P n t t P

(iv )F 分布:),(~n m F F α的分位数记为 ),(n m F α,

即:αα=<)},({n m F F P (查F 表) 或 αα

α=≥<-

}{2

12

F

F F F P 及

注: )

,(1),(1m n F n m F αα=-

四.抽样分布的常用结论:

1.,),

(~1

),(~1

2

2

∑==

n

k k

n

N n

N σ

μξξσμξ

,则)1,0(~N n

σ

μ

ξ-且

2. 1

,,,),(~212

11n N ξξξσμξ →设

2

,,,),(~212

22n

N ηηησμη →独立

与且}{}{21k k ηξ)

1,0(~)

()(2

22

1

21

2122

2

1N n n σ

σ

μμηξσ

σ+

---为已知,则

,若2

1

212

22

2

111)

()(n n S w

+

---==μμηξσ

σ

σ则

未知,若

)

2(~21-+n n t 2

)1()1(2

212

*2

22

*11212

22211-+-+-=

-++=

n n S n S n n n S n S n S w 其中

∑=--=

1

1

2

1

2*1

)(1

1n k k

n S

ξξ ∑=--=

2

1

2

2

2*2

)(1

1n k k

n S

ηη

3. ),,(~2

σμξN )1(~1

---=

-*

n t n S n

S

μ

ξμ

ξ则

4. ),1,0(~N ξ 独立;或与则

)(2

2*S S ξ ;

)1(~)()1(2

22

*2

--=

-=∑n S

n nS

i χξξ

),,(~2

σ

μξN 独立;或与则)(22*S S ξ

;且

)1(~)(1

)1(2

22

2

2

*2

2--=

-=

∑n S

n nS

i

χξξ

σ

σ

σ

5. 1

,,,),(~212

11n N ξξξσμξ →设

2

,,,),(~212

22n N ηηησμη → 则

)1,1(~212

1

222

*2

221

1--?

*n n F S n S n σσ

注:对于非正态总体的抽样分布,一般不易求出.但在大样本抽样的情况下,样本均值ξ

有如下的近似分布: 设总体ξ,ξD 存在,n ξξξξ,,,21 → 则

ξ

近似服从 ),(2

???

?

??

n D E N ξξ 五.顺序统计量与样本极差: 1.顺序统计量的概念:

n ξξξξ,,,21 →n x x x ,,,21 →

排序 )

()2()1(,,,n x x x , 则 ),,,(21)(n k k x x x f x =

),,,(21)(n k k f ξξξξ = 为 顺序统计量 (它不含未知参数)

)(k ξ为样本的第k 个顺序统计量, k n

k ξξ≤≤=1)

1(min 为样本的最小顺序统计量

k

n

k n ξξ≤≤=1)(max 为样本的最大顺序统计量.

2. 样本极差的概念:

n ξξξξ,,,21 →)

()2()1(,,,n ξξξ →

称 j

i n

j i n n R ξ

ξξξ-=-=≤≤,1)1()(m a x 为 样本极差

注:关于样本极差的分布,

若 ),1,0(~N ξ 那么,样本极差的分布函数、分位数、n

ER 、n

DR

在较详细的数理统计用表中,都有已编制的数值表可查.

统计量及其抽样分布练习题

第六章 统计量及其抽样分布 练习题 一、填空题(共10题,每题2分,共计20分) 1.简单随机抽样样本均值X 的方差取决于_________和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的_________倍。 2. 设1217,,,X X X 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=,则a =____________。 3.若(5)X t ,则2X 服从_______分布。 4.已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。 5.中心极限定理是说:如果总体存在有限的方差,那么,随着_________的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于_____________。 6. 总体分布已知时,样本均值的分布为_________抽样分布;总体分布未知,大样本情况下,样本均值的分布为_________抽样分布。 7. 简单随机样本的性质满足_________和_________。 8.若(2,4)X N ,查分布表,计算概率(X 3)P ≥=_________。若(X )0.9115P a ≤=,计算a =_________。 9. 若12~(0,2),~(0,2),X N X N 1X 与2X 独立,则2212X X +()/2服从______分布。 10. 若~(16,4)X N ,则5X 服从___________分布。 二、选择题(共10题,每题1分,共计10分)

1.中心极限定理可保证在大量观察下 ( ) A . 样本平均数趋近于总体平均数的趋势 B . 样本方差趋近于总体方差的趋势 C . 样本平均数分布趋近于正态分布的趋势 D. 样本比例趋近于总体比例的趋势 2.设随机变量()(1)X t n n >,则21/Y X =服从 ( ) 。 A. 正态分布 B.卡方分布 C. t 分布 D. F 分布 3.某品牌袋装糖果重量的标准是(500±5)克。为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。下列说法中错误的是( ) A. 样本容量为10 B .抽样误差为2 C. 样本平均每袋重量是统计量 D. 498是估计值 4.设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从( ) A. (100/,25)N n B. N C. (100,25/)N n D. (100,N 5、设2(0,1),(5),X N Y χ且X 与Y 独立,则随机变量_________服从自由度为5的t 分布。 ( ) A. /X Y B. 5/Y X C. /X /

抽样检验方法

抽样检验方法 1 、抽样检验的来源 2 、抽样检验的定义 3 、抽样检验的分类 4 、抽样检验和全检的区别 5 、抽样检验的基本概念 6 、计数调整型抽样方案简介 7 、一次正常抽样方案使用简介 附录一、样本大小字码表 附录二、一次正常抽样方案表 1.抽样检验的来源 二次世界大战刚开始时,美国迫切需要把平时产业转变成战时产业,造成了大量的军需品的生产和检验,但当时检查员又非常缺乏,同时军需品不可能进行全检,故不得不采取经济又适用的抽检方法,在此背景之下就产生了抽样检验标准: MIL —STD —105A 。 (1945年产生,1950年正式发布) 2.抽样检验的定义 从群体中,随机抽出一定数量的样本,经过检验、试验或测量以后,以其结果与判定基准作比较,然后利用统计方法,判定此群体是合格还是不合格的检验过程,称之为抽样检验。 3.抽样检验的分类 按抽样检验的方式可分为如下四类: 一、标准型抽样检验 是在同时考虑生产方和顾客风险的情况下,对孤立批所进行的一种抽案,以判断群体的合格与不合格为目的。 二、挑选型抽样检验 对按一定抽样方案拒收的产品,不是一退了之,而是对不合格批采取全数检验,退全检后的不良品并要求退换。 三、调整型抽样检验 根据以往交验批的信息,按一定的转换规则,对检验方案的宽严程度进行调整的一种抽样 不良品 X >C 拒收 X ≦C 允收

方案。适用于连续生产批的检验,一般分为:(1)正常检验; (2)加严检验; (3)放宽检验。 四、链式抽样检验 从检验批中抽出很小的样本,并规定样本中不允许有不合格。适用于费用高、批量小及客观条件不允许抽取较多产品的情况。 4.抽样检验和全检的区别 一、抽样检验和全检的适用场合 抽样检验并非任何场合都适用,有些可以做抽样检验,有些必须进行全检。这主要依据检验群体的性质、数量、体积大小或检验所产生的经费或者检验方式而定。但全检不一定就比抽检好。 (1) 适用于抽样检验的场合 ——属于破坏性试验,如材料强度。 ——检验群体数量非常多,如螺丝。 ——检验群体体积非常大,如原棉。 ——产品属于连续的物品,如纱绒。 (2) 适用于全数检验的场合 ——检验很快,且费用少,如灯泡点火检验。 ——产品必须全数良品,如手表、照像机等。 ——产品中只要有少许不良品,就会严重影响人身或财产安。 全,如高压气筒。 二、抽样检验与全检的优劣比较 (1) 优点 ——抽检费用远比全检少。 ——抽检数少,可较详细。 ——判断为不合格则全批退货,可加强供货商的质量管理。 (2) 缺点 ——虽然判定为合格,也难免存在一些不良品。 ——可能把不合格批误判为合格批,也可能把合格批误判为 不合格批。 5.抽样检验的基本概念 一、检验群体(N) 、检验批(Lot) 一般来说,一个生产批即为一个检验批。但若批量很大、连续生产、周期较长,且过程在受控状态下,可以将一个生产批分成若干检验批,但一个检验批不可能包含多个生产批,也不能随意组合检验批。 二、单位产品 通常将用来检验群体中的每个样品单位称为“单位产品”,对大多数产品而言,一个产品就是一个单位产品,但对流程性材料,以其包装容器为一个单位产品,对纺织品则以长度(米、匹等)为单位产品。 三、单位产品质量 质量特性可分为计量型和计数型两种。计量型特性是可通过测量仪器测试的,如轴承的尺寸、钢的含碳量等。计数型特性是离散的,如铸件的汽孔数、纺织品上的疵点数等。 四、样本(n) 从群体(检验批)中随机抽取部份的单位产品称之为样本。 五、合格判定数(C) 作为判定群体是否合格的基准不良数称为合格判定数。 六、缺点

什么是抽样抽样的基本术语及其含义是什么

24什么是抽样?抽样的基本术语及其含义是什么? 24(什么是抽样,抽样的基本术语及其含义是什么, 答:前一问见名词简释。抽样的常用基本术语有: 1(总体。它是构成事物的所有元素、也就是最基本单位的集合。 (样本。它是从总体中按照一定方式抽取出的一部分元素的集合。一个样本是总体的 2 一个子集,一个总体中可以抽取出若干个不同的样本。 3(抽样元素。它指的是构成总体的每一个最基本单位,也称“抽样分子”或“个体”。社会调查研究中最常用的抽样元素是单个的人,但也可以是家庭、学校、企业、商店等。 4(抽样单位。它是一次直接的抽样所使用的基本单位。抽样单位与抽样元素有时是同一的,有时又是不同的。 5(抽样框。它又称作抽样范围,指的是一次直接抽样时总体中所有抽样单位的名单。 6(参数值。它也称为总体值,是关于总体中某一变量的综合描述,或者总体中所有元素的某种特征的综合数量表现。在统计中最常见的参数值是某一变量的平均值。 7(统计值。它也称为样本值,是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。样本值是从样本的所有元素中计算出来的,它是相应的总体值的估计量。 8(抽样误差。它是用样本统计值去估计总体参数值时所出现的误差。这种误差是因为抽样本身的特点而引起的。由于无论采取什么样的抽样方式,所抽取的样本

有多大,都无法涵盖总体,所以抽样误差是不可避免的。但是,抽样误差的大小是可以在样本设计中事先进行控制的。 25(在社会调查中,如何确定样本规模, 答:具体每一个社会调查研究究竟应当选择多大规模的样本,主要取决于以下几点: (1)总体规模:根据抽样原理,样本规模与总体规模越接近,样本值与总体值就越一致,抽样误差就越小,样本的代表性也越强。但是当总体规模大到一定程度以后,样本规模的加大就不是那么必要了。因此,对于10 000个单位以下的总体来说,样本规模应尽可能大;而对于那些超大型的总体,则可以按照一两万个单位的总体规模来确定样本规模,以避免不必要的浪费。 (2)抽样的精确性:从理论上说,样本的精确度越高越好,但相应的样本规模也要越来越大,这就意味着调查者的时间和人财物力的消耗也要增加好几倍。而对于大多数社会调查研究来说,实际上并不要求太高的精确度。因此,调查者应当根据必要性和可能性,适当地确定样本精确度,决不能因一味追求精确度的提高而拼命扩大样本规模,否则将导致巨大的浪费。 (3)总体的异质性程度:要达到同样的精确度,在同质性较高的总体中抽样时,样本规模可以小一些;在异质性较高的总体中,样本规模则应该大一些。为了提高了样本反映总体的精确度,人们通常用分类抽样的方法将总体划分为不同的类别或层次,让这些不同类别或层次在样本中都有代表,并使得抽样误差中基本不存在类与类之间的误差成分,而只存在类内各单位之间的误差成分,其效果相当于缩小了总体的异质性程度和单位分布的不均匀状态。 (4)调查者所拥有的经费、人力、物力和时间:尽管从样本的代表性、抽样的精确性考虑,样本规模应尽可能大,但一般调查的经费、人力、物力和时间总是有限

抽样技术重点复习概念

调查:通过使用明确的概念、方法和程序,依据专门设计的调查方案知道的方式,从一个总体全部或部分单元中搜集感兴趣的指标信息,并将这些信息综合整理成数据系列的有关活动。 抽样调查:是调查应用最常见的模式,是一种非全面的调查,它是指从研究对象的全体(总体)中抽取一部分单元作为样本,根据对所抽取的样本进行调查,获得有关总体目标量的了解。这是广义的抽样调查的概念 抽样调查步骤:调查目标确定、抽样框选择、抽样方案设计、问卷设计、数据收集、数据编码和录入、审核与插补、参数估计、数据分析和调查结果的表述、数据分布、撰写调查报告 简单随机抽样:也称纯随机抽样,是从抽样框内的N个抽样单元中随机的、一个一个的抽取n个单元作为样本,在每次抽选中,所有未入样的待选单元入选样本的概率都想等,这n个被抽中的单元就构成了简单随机样本。简单随机样本也可以一次从总体(抽样框)中同时抽出,这时全部可能样本中的每一个样本被抽中的概率也需要相等。 分层抽样:是将抽样单元按某种特征或某种规划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计。 分层随机抽样:如果每层中的抽样都是独立地按照简单随机抽样进行的,那么这样的分层抽样称为分层随即抽样,所得的样本称为分层随即样本。 整群抽样:将总体中的若干个基本单元合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有基本单元全部实施调查,这样的抽样方法称为整群抽样。 多阶段抽样:采用类似整群抽样的方法,首先抽取群,但不是调查群内的所有基本单元,而是再进一步抽样,从选中的群中抽取出若干个基本单元进行调查,因为取得这些接受调查的基本单元需要两个步骤,所以将这种抽样方式成为两阶段抽样。这里,群是初级抽样单元,第二阶段抽取的是基本抽样单元。将这种方法推广,使抽样的段数增多,就称为多阶段抽样。 系统抽样:将总体中的所有单元(抽样单元)按一定顺序排列,在规定的范围内随机抽取一个单元作为初始单元,然后按事先规定好的规则确定其他样本单元,这种抽样方法称为系统抽样。 简单估计:在没有总体其他相关辅助变量信息可以利用的情况下,用样本特征直接估计总体特征,且样本特征与预估的总体特征除了写法之分外,完全同形同构,简单易记,因此有简单线性估计的名称,简称为简单估计。 比率估计:设对有两个调查变量Y 和X 的总体进行简单随机抽样,分别以y,x表示样本总值,以y,x表示样本均值,以μ// R y x y x ==为样本比率,用 μR作为总体比率R的估计称为的比率估计 回归估计:在简单随机抽样下,总体均值和总体总值Y的回归估计量定义为: ()() tr y y X x y x X ββ =+-=-- μ lr lr Y N y =其中Y,X分别为调查变量、辅助变量的样本均值,X是辅助变量的总体均值,β称为回归系数。 不等概抽样:如果总体中每个单元进入样本的可能性是不相等的,则这种随机抽样方式就称为不等概率随机抽样,简称不等概率抽样。 非抽样误差:除抽样误差以外的,由于各种原因引起的误差。 非抽样误差的分类:抽样框误差(由不完善的抽样框引起的误差);无回答误差(由于种种原因没有从被调查单元获得调查结果,造成调查数据的缺失);计量误差(所获得的调查数据与其真值之间不一致造成的误差)

(完整版)样本及抽样分布.doc

第六章样本及抽样分布 【基本要求】 1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布—— 2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】 4 学时 【授课内容】 §6.0前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一 门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性; 而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的 一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来 选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理 统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 § 6.1随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是 个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每 个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几 项数量指标 X ( 可以是向量 ) 和该数量指标X在总体的分布情况。在上述例子中 X 是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X 的这样或那样的数值,因而这个数量指标X 是一个随机变量(或向量),而 X 的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标 X 可能取值的全体组成的集合等同起来。 定义 1:把研究对象的全体(通常为数量指标X 可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X 的分布的研究,所谓总体的分布也就是数量指 标 X 的分布,因此, X 的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体 X 。根据总体中所包括个体的总数,将总体分为:有限总体 和无限总体。 例 1:考察一块试验田中小麦穗的重量: X =所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

统计学抽样与抽样分布练习题

第6章 抽样与抽样分布 练习题 6.1 从均值为200、标准差为50的总体中,抽取100=n 的简单随机样本,用样本均值x 估计总体均值。 (1) x 的数学期望是多少? (2) x 的标准差是多少? (3) x 的抽样分布是什么? (4) 样本方差2 s 的抽样分布是什么? 6.2 假定总体共有1000个单位,均值32=μ,标准差5=σ。从中抽取一个样本量为30的简单随机样本用于获得总体信息。 (1)x 的数学期望是多少? (2)x 的标准差是多少? 6.3 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。样本均值的抽样标准差x σ等于多少? 6.4 设总体均值17=μ,标准差10=σ。从该总体中抽取一个样本量为25的随机样本,其均值为25x ;同样,抽取一个样本量为100的随机样本,样本均值为100x 。 (1)描述25x 的抽样分布。 (2)描述100x 的抽样分布。 6.5 从10=σ的总体中抽取样本量为50的随机样本,求样本均值的抽样标准差: (1)重复抽样。 (2)不重复抽样,总体单位数分别为50000、5000、500。 6.6 从4.0=π的总体中,抽取一个样本量为100的简单随机样本。 (1)p 的数学期望是多少? (2)p 的标准差是多少? (3)p 的分布是什么? 6.7 假定总体比例为55.0=π,从该总体中分别抽取样本量为100、200、500和1000的样本。

(1) 分别计算样本比例的标准差p σ。 (2) 当样本量增大时,样本比例的标准差有何变化? 6.8 假定顾客在超市一次性购物的平均消费是85元,标准差是9元。从中随机抽取40个顾 客,每个顾客消费金额大于87元的概率是多少? 6.9 在校大学生每月的平均支出是448元,标准差是21元。随机抽取49名学生,样本均值 在441~446之间的概率是多少? 6.10 假设一个总体共有8个数值:54,55,59,63,64,68,69,70。从该总体中按重复 抽样方式抽取2=n 的随机样本。 (1) 计算出总体的均值和标准差。 (2) 一共有多少个可能的样本? (3) 抽出所有可能的样本,并计算出每个样本的均值。 (4) 画出样本均值的抽样分布的直方图,说明样本均值分布的特征。 (5) 计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得 到的结论是什么? 6.11 从均值为5.4=μ,方差为25.82=σ的总体中,抽取50个由5=n 个观测值组成的 随机样本,结果见Book6.11。 (1) 计算每一个样本的均值。 (2) 构造50个样本均值的相对频数分布,以此代表样本均值x 的抽样分布。 (3) 计算50个样本均值的平均值和标准差x σ。 6.12 来自一个样本的50个观察值见Book6.12。 (1) 用组距为10构建频数分布表,并画出直方图。 (2) 这组数据大概是什么分布?

I 基本概念与抽样分布1-8#

应用数理统计概述 不确定性数学:1 . 概率论、数理统计),,(P F Ω 2 . 模糊数学 )}(,{x x ?M 3 . 灰色数学 ],[b a H 4 . 未确知数学 )}(],,{[x F b a 对于上述各个数学分支,各自有相应的运算法则和适用范围。 (一) 概率论: 1.),,(P F Ω: E 是一个随机试验,Ω 为E 的全体基本事件的集合 F 由Ω的一些子集为元素 所构成的集合 人们通过对某事件A 的频率)(A f 的研究,发现了概率 )(A P 和性质及运算 2.讨论的一般方法: 随机变量 → 分布 → 数学期望、方差等(宏观指标) ① 对于一维 : )(ωξξ= )(i i x ωξ= ∑ <= <=x x i i p x P x F }{)(ξ, i i p x P ==}{ξ ; ? ∞ -= <=x dt t p x P x F )(}{)(ξ, 0)(≥x p . ? ∑ ∞ +∞ -∞ == dx x xp p x E i i i )(1 或 ξ; 2)(ξξξE E D -= ② 对于n 维 : 随机变量),,,(21n ξξξ → 实数),,,(21n x x x },{})({),,(22111 21n n n i i i n x x x P x p x x x F <<<=<==ξξξωξω ; (二) 数理统计: 1.基础:统计量?? ?? ? =∑=数据分区间处理经验型,如:公式型,n i i n 11ξξ 及其分布 ???经验分布(直方图) 分布 如:统计分布2 χ 2. 样本的处理:① 参数估计; ② 假设检验(参数假设检验<本科>、非参数假设检 验<分布拟合 与 两总体相等性检验>); ③ 回归分析; ④ 方差分析 与 正交试验设计.

本章提出了抽样的基本概念和基本术语.doc

第四章抽样讲课稿 本章提出了抽样的基本概念和基本术语,阐释了抽样在社会调查研究中的作用,介绍了不同种类的抽样方法,特别说明了每一种方法的适用范围和操作程序,并对它们做了简要评价。同时,为了更好地应用抽样方法,还简要介绍了样本规模和抽样误差问题。其中最重要的就是要联系实际认识和掌握各种抽样方法。 一、抽样的概念和基本术语 当今社会最主要和最常用的调查类型是抽样调查,它的前提条件就是抽样。因此,抽样是在许多社会调查研究的准备阶段必须完成的一项重要工作。 (一)抽样的概念 抽样指的是从组成某个总体的所有元素、也就是所有最基本单位中,按照一定的方式选择或抽取一部分元素的过程和方法,或者说是从总体中按照一定方式选择或抽取样本的过程和方法。 抽样存在的必要性缘于总体本身所具有的异质性。如果某个总体中的每一个成员在所有方面都相同,即具有百分之百的同质性,那么抽样也就没有必要了。 抽样存在的合理性是由辩证唯物主义个别与一般的理论和建立在概率论基础上的大数定律和中心极限定律决定的。这些理论与定律证明,尽管总体所包含的每一个个体都不能完全地反映总体的性质和特征,却都具有不同程度的总体的性质和特征的因素,所以一定数量个体的因素的集合,就可以等同或接近总体的性质和特征。 在社会调查研究中,抽样主要解决的是调查对象的选取问题,即如何从总体中选出一部分对象作为总体的代表的问题。关于抽样的作用,有两个相关的问题需要特别明确:第一,抽样和抽样调查不能混为一谈。抽样只是抽样调查的前提和一部分,只解决抽样调查过程中的选取调查对象这一个问题,抽样调查的其它所有问题都是靠另外的方法来解决的。 第二,抽样只是抽取样本的方法,而不是调查方法或者说资料收集方法。 (二)抽样的基本术语和抽样的基本程序 1.基本术语 在抽样中,有一些常用的基本术语: (1)总体。它是构成事物的所有元素、也就是最基本单位的集合。 (2)样本。它是从总体中按照一定方式抽取出的一部分元素的集合。 (3)抽样元素。它指的是构成总体的每一个最基本单位,也称“抽样分子”或“个体”。 (4)抽样单位。它是一次直接的抽样所使用的基本单位。抽样单位与抽样元素有时是同一的,有时又是不同的。 (5)抽样框。它又称作抽样范围,指的是一次直接抽样时总体中所有抽样单位的名单。 (6)参数值。它也称为总体值,是关于总体中某一变量的综合描述,或者总体中所有元素的某种特征的综合数量表现。在统计中最常见的参数值是某一变量的平均值。 (7)统计值。它也称为样本值,是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。 (8)抽样误差。它是用样本统计值去估计总体参数值时所出现的误差 2.基本程序 虽然不同的抽样方法具有不同的操作要求,但它们通常都要经历这样几个步骤:1.界定总体

抽样检验的基本概念和策划方案

统计抽样检验 抽样检验培训目的 掌握统计抽样检验的差不多原理和方案检索,正确操作统计抽样 检验。 一:抽样检验的差不多概念 1、 抽样检验的概念 (1)所谓抽样检验是指从交验的一批产品(批量为N )中,抽 取一个样本(由n 个单位产品组成)进行检验,从而对批产品质 量作用推断的过程。 检验 X<=Ac 允收 (2)抽样检验的目的是“通过样本推断总体”,而其期望则在于 “用尽量少的样本量来尽可能准确地判定总体(批)的质量。” 从而达到这一目的和期望,传统的“百分比抽样”是不科学的、

不合理的。通过多青年来的理论研究和实践,证明只有采纳“统计抽样检验”才能保证科学、合理地实现这一目的和期望。(3)抽样检验的步骤 a.抽样:需要研究的是如何样抽和抽多少的问题。 b.检验:是在统计抽样检验理论的指导下,采纳具有一定测量能力的设备和正确的方法进行检验。 c.推断:是用对样本的检验结果来推断总体(批)的质量水平。 其中抽样和推断状况就构成了抽样方案。即抽多少和如何样推断。 2、统计抽样检验 1)统计抽样检验的概念 (1)所谓统计抽样检验,是指抽样方案完全由统计技术所确定的抽样检验。 (2)统计抽样检验的优越性体现在能够用尽可能低的检验费用(经济性),有效地保证产品质量水平(科学性),且对产品质量检验或评估结论可靠(可靠性),而事实上施又专门简便(可用性)。 二、抽样检验方案

一个批的产品数量即批量用N表示,对那个产品批规定一个不合格品率,假如批不合格品率超过那个规定值,该批产品将被拒收,那个不合格品率就称为“该允收不合格品率”,以P1表示。抽样检验确实是从批N里抽取一小部分单位产品作为样本进行检验,用样本的质量对产品批质量进行推断。样本中所包含的单位产品数称为样本大小,或叫样本容量,用n来表示,样本中的不合格品数用d表示,样本的不合格品率为d/n。因为是抽样检验,我们无法保证样本的不合格品率d/n恰恰等于批不合格品频率D/N,因此只有用d/n与P1比较而作出同意依旧拒收的决定。对计数值抽样检验,实际作法并不是直接用d/n与P1作比较,而是规定一个合格判定数Ac和一个不合格判定数Re,若样本不合格品数d小于或等于那个合格判定数Ac,就接收该批产品;若d等于或大于不合格判定数Re,则拒收该批产品。那个抽样检验过程就称为计数型抽样检验方案。由此看出,抽样方案确实是为了决定样本大小和判定检验批是否合格而规定的一组规则。 在一个最简单的抽样方案中要确定两个参数,一个是抽取的样本大小n,一个是判定数Ac和Re,通常用(n, Ac)表示一个抽样方案,简写为(n, c);有了n和Ac之后就能够专门容易地进行抽样检验了。

抽样检验的基本概念与分类(doc 12页)(完美版)

抽样与检验 一、抽样检验基本概念 1.在质量管理中,一般有来料检验、过程检验、成品检验、出货检验四部分,每一部分中都会有抽样计划、允许水准、具体的抽样方式、统计分析等工作。 2.基本概念 (1)批 各种产品,凡是具有相同的来源,且在相同的条件下生产所得到一群相同规格的产品,可称为一个批,这样的批也可给予一个名字叫“制造批”。一个制造批中的质量变异具有一个分布,在抽样时应尽可能的使检验批的质量接近实际值,这样才可使抽验的结果正确,因此一批可能根据需要可以区分为几个检验批,但必须注意避免将几个批合并为一个检验批。 (2)检验批 在统计学中,可以称为母体或群体。 就是在各种批中,被选定用来做抽样检验的批,该批是根椐其整个批中量的大小,照抽样计划,抽出“小”批加以检验的一个群体。通常检验批要根据允许水准来判定这个检验批是否允收。 (3)批量 是指每个检验批内产品的单位数据,在统计学中也可称为“母体数”,通常以“N”表示。 (4)样本

是指从检验批中所抽出的以一个以上单位组成的产品,样本中的各个样品均须随机,而且不考虑它的品质的好坏。样本中所含的产品单位的数目称为“样本数”或“样本大小”,通常以“n”表示,它一定小于等批量数“N”。 (5)抽样检验 从双方约定的检验批中,根据批量大小,抽出不同数量的样本。将该样本以事先确定的检验方法加以检验,并将检验的结果与预先确定的要求或“品质标准”比较,以决定该批是否合格。在计数值中,是将样本中不良品的个数所抽样计划中允收不良品的个数比较,以判定该检验批是否允收。在计量值中,是将各样品检验结果加以统计分析,以平均值、离散度、综合指数的判定基准比较,以决定该检验批是否允收。 (6)合格判定数 判定一批产品是否合格或不合格的基准不良个数称为合格判定数,通常以“C”(或AC)表示。 (7)缺陷 产品单位的品质特性不合乎双方所规定的规格、图样、说明或要求等称为缺陷,通常用“d”表示。如若是买卖的关系,缺点一般可分为:(a)严重缺陷(Critical defect),凡有危及产品的使用或携带安全,或使产品的重要功能失效的缺陷; (b)主要缺陷(Major defect),凡使产品使用性能不能达到所期望之目的,或显著减低其实用性能的缺陷; (c)次要缺陷(Minor defect),实际上不影响产品的使用功能或

统计学习题答案 第4章 抽样与抽样分布

统计学习题答案第4章抽样与抽样分布

第4章抽样与抽样分布——练习题(全免) 1. 一个具有64 n个观察值的随机样本抽自于均 = 值等于20、标准差等于16的总体。 ⑴给出x的抽样分布(重复抽样)的均值和标 准差 ⑵描述x的抽样分布的形状。你的回答依赖于 样本容量吗? ⑶计算标准正态z统计量对应于5.15 = x的值。 ⑷计算标准正态z统计量对应于23 x的值。 = 解: 已知n=64,为大样本,μ=20,σ=16, ⑴在重复抽样情况下,x的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x<16;⑵x>23;⑶x>25;⑷.x落在16和22之间;⑸x<14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100 n个观察值的随机样本选自于 = μ、16=σ的总体。试求下列概率的近似值:30 =

解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远? ⑶ 为了回答b 你必须要知道μ吗?请解释。 解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。对于每一个样本容量,构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。 解:趋向正态 6. 美国汽车联合会(AAA )是一个拥有90个俱 乐部的非营利联盟,它对其成员提供旅行、

抽样调查基本概念

第四部分统计——第二十五章抽样调查 本章重点: 1.抽样调查基本概念(总体、样本、样本量、总体参数、样本统计量与抽样框),概率抽样和非概率抽样,抽样调查一般步骤,抽样调查中的误差来源(抽样误差、非抽样误差、抽样框误差、无回答误差、计量误差)等。 2.几种基本概率抽样方法:简单随机抽样、分层抽样、系统抽样、整群抽样和多阶段抽样。 3.估计量的性质(无偏性、有效性和一致性),样本量的影响因素。 知识点一、抽样调查基本概念 (一)抽样调查基本概念 1.总体:即调查对象的全体,调查总体必须是明确的而不能是模糊的。 【示例】:研究全国钢铁企业盈利状况,所有钢铁企业是总体。 样本:总体的一部分,它由从总体中按一定原则或程序抽出的部分个体所组成。 【示例】:选取了20家钢铁企业是样本。 样本量:样本中包含的入样单位的个数。 【示例】:20。 2.抽样框:供抽样所用的所有抽样单元的名单,是抽样总体的具体表现。 【示例】:工商局注册的20家企业。 3.总体参数:变量的数字特征,根据总体中所有单位的数值计算的。 【示例】:所有钢铁企业盈利总额,所有钢铁企业盈利均值。 4.样本统计量:根据样本中各单位的数值计算的,是对总体参数的估计,因此也称为估计量。 常用的样本统计量:样本均值,样本比例、样本方差等。 【示例】:20家企业盈利总额,20家企业盈利均值。 【例题·单选题】(2016年)北京市旅游管理部门要通过抽样调查了解2015年北京市常驻居民出境旅游总消费金额,该抽样调查的总体参数是2015年北京市()。 A.所有常住居民旅游总消费金额 B.被调查的常住居民出境旅游总消费金额 C.被调查的每一位常驻居民出境旅游消费金额 D.所有常住居民出境旅游总消费金额 『正确答案』D 『答案解析』本题考查抽样调查基本概念。总体参数是我们所关心变量的数字特征,它是根据总体中所有单位的数值计算的。 【例题·单选题】(2015年)在某市随机抽取2000家企业进行问卷调查,并据此调查有对外合作意向的企业,该抽样调查中的总体是()。 A.该市所有企业 B.该市有对外合作意向的企业 C.抽中的2000家企业 D.抽中的2000家企业中有对外合作意向的企业 『正确答案』A 『答案解析』本题考查抽样调查的基本概念。总体即调查对象的全体,要抽取2000家企业进行问卷调查,所以总体是该市所有企业。

抽样调查的基本知识

附件6: 抽样调查的基本知识 一、抽样调查的概念 抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。 二、抽样调查的特点 抽样调查有以下三个突出特点:按随机原则抽选样本;总体中每一个单位都有一定的概率被抽中;可以用一定的概率来保证将误差控制在规定的范围之内。 三、抽样调查的几个主要常用的名词 (一)总体。总体是指所要研究对象的全体。它是根据一定研究目的而规定的所要调查对象的全体所作成的集合,组成总体的各研究对象称之为总体单位。 (二)样本。样本是总体的一部分,它是由从总体中按一定程序抽选出来的那部分总体单位所作成的集合。 (三)抽样框。抽样框是指用以代表总体,并从中抽选样本的一个框架,其具体表现形式主要有包括总体全部单位的名册、地图等。抽样框在抽样调查中处于基础地位,是抽样调查必不可少的部分,其对于推断总体具有相当大的影响。 (四)抽样误差。在抽样调查中,通常以样本作出估计值对总体的某个特征进行估计,当二者不一致时,就会产生误差。因为由样本作出的估计值是随着抽选的样本不同而变化,即使观察完全正确,它和总体指标之间也往往存在差异,这种差异纯粹是抽样引起的,故称之为抽样误差。

(五)偏差。所谓偏差,也称为偏误,通常是指在抽样调查中除抽样误差以外,由于各种原因而引起的一些偏差。 四、几种具体的抽样方式 (一)多阶段抽样 多阶段抽样,也称为多级抽样,是指在抽取样本时,分为两个及两个以上的阶段从总体中抽取样本的一种抽样方式。其具体操作过程是:第一阶段,将总体分为若干个一级抽样单位,从中抽选若干个一级抽样单位入样;第二阶段,将入样的每个一级单位分成若干个二级抽样单位,从入样的每个一级单位中各抽选若干个二级抽样单位入样……,依此类推,直到获得最终样本。 多阶段抽样的优点在于适用于抽样调查的面特别广,没有一个包括所有总体单位的抽样框,或总体范围太大,无法直接抽取样本等情况,可以相对节省调查费用。其主要缺点是抽样时较为麻烦,而且从样本对总体的估计比较复杂。 (二)等距抽样。 等距抽样也称为系统抽样、或机械抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。 按照样本单位抽选的方式,等距抽样可分为:随机起点等距抽样、半距起点等距抽样和对称等距抽样。 对称等距抽样。当抽取间隔k确定后,在第一组随机抽取第一个样本单位,假设该单位的顺序号为a,在第二组与第一个样本对称的位置抽取第二个样本单位,它的顺序号为2k-a。在第三组与第二组样本单位对称的位置抽取第三个样本单位,它的顺序号为2k+a,以后抽出的样本单位序号依次为(4k-a),(4k

抽样检验基本知

抽样检验基本知识 一、抽样检验的由来 二次世界大战时期,美国军方采购军火时.在检验人员极度缺乏的情况下,为保证其大量购入军火的品质,专门组织一批优秀数理统计专家、依据数学统计理论,建立厂一套产品抽样检验模式。满足战时的需要。 二、抽样检验的定义 抽样检验是按预先确定的抽样方案,从交验批中抽取规定数量的样品构成一个样本,通过对样本的检验推断批合格或批不合格。 d≤Ac 批合格 d≥Re 批不合格 批产品样本不合格品数Ac 合格判定数,Re 不合格判定数 三、基本概念及用语 1.群体与样本。 群体就是提供被做为调查(或检查)的对象.或者称采取措施的对象。也常称为批,群体(批)大小常以N表示,亦称批量N。 工序间、成品、进出库检验以及购入构验等经常组以整批的形式交付检验的。不论是一件件的产品、还是散装料,一般都要组成批,而后提交检验,有些情形,中间产品由于条件的限制不允许组成批以后再提交给下一道工序进行检验、但可采用连续抽样检验(如每小时抽取1台产品进行检验的抽样方式。 样本就是指我们从群体中(或批中),抽取的部分个体。抽取的样本数量常以n表示。 2.批的组成。 构成一个批的单位产品的生产条件应尽可能相同,即是应当由原、辅料相同,牛产员工变动不大生产时期大约相同等生产条件下生产的单位产品组成批。此时.批的特性值只有随机波动.不会有较大的差别。这样做.主要是为了抽取样品的方便及抽样品更具有代表性.从而使抽样检验更为有效,如果有证据表明,不同的机器设备、不同的操作者或不同批次的原材料等条件的变化对产品质量有明显的影

响时,应当尽可能以同一机器设备、同一操作者或同—批次的原材料所生产的产品组成批,构成批的上述各种条件,通常很少能够同时满足。如果想使它们都得到满足,往往需要把批分得比较小.这样品质一致而且容易追溯。但这样做,会使检验工作量大大增加.反而不能达到抽样检验应有的经济效益、所以,除了产品品质时好时坏,波动较大.必须采用较小的批以保证批的合理外,当产品品质较稳定时〔比如生产过程处于统计控制状态〕,采用大批量是经济的、当然,在使用大批量时,应当考虑到仓库场地限制以及不合格批的返工等可能造成的困难。 3.批量(N)。 一批产品中所包含的单位产品的总数叫做批量,通常用英文大写N表示、一批塑胶料由“一干袋组成,我们说这批塑胶料的批量力1000,对于5()()对沫子来讲.一个单位产品只可能是一对而决不可能是—只,批量就是500对:一批100公斤合成纤维,如果规定每10克纤维为一个单位产品,耶么这批产品的批量为10000。 当我们从成品,半成品.零部件中抽取—部分样本加以测定分折时,决不是仅为获取抽出样品本身的情报或状况。而是要从样本的检验结果判定群体(或该批量,或该工程)的状态、以便对群体采取措施,群体与样本、数据关系如下表3—34所示: 4.取样及数据的信赖性、 进行取样及记录数据,是为了将来采取行动措施。如果取样及数据记求是不可靠的,必将导致将来采取行动措施偏差及无效。 为了取样可靠.以随机抽样为原则,也就是说取样要能反映群体的各处情况,群体中的个体.被取样的机会要均等, 随机抽样的方法有以下几种: (1)简单随机抽样法:如抽签、抓阄、查随机数值表等。(抽奖时摇奖的方法) (2)系统随机抽样法:又叫等距抽样法或机械抽样法。 (3)分层抽样法:也叫类型抽样法。它是从一个可以分成不同层(或称子体)的总体中,按规定的比例从不同层中随机抽取样品的方法。层别可以按设备分、按操作人员分、按操作方法分。

抽样调查概述

第一章抽样调查概述 第一节抽样调查的意义和特点 抽样调查是现代统计调查中最常用的基本方法之一。 一、抽样调查的概念 关于抽样调查的定义大体上可以区分成广义和狭义两种,广义的抽样调查包括非概率抽样与概率抽样,狭义概念仅指概率抽样。 狭义的抽样调查是按照一定的程序和方法,从所要研究现象的总体中根据随机原则抽取一部分单位组成样本,通过对样本的调查,获得样本资料,计算出有关的样本指标(统计量),依一整套专门的方法据以对相应的总体指标(参数)作出估计和推算,并有效控制抽样误差的一种统计方法。 随机原则。①随机并非“随意”;②随机原则不等于等概率原则;③随机原则一般要求总体中每个单元均有一个非零的概率被抽中;④ 抽样概率对总体参数的估计有影响。 随机原则是抽样调查所必须遵循的基本原则。按随机原则抽样可以保证被抽中的单元在总体中均匀分布,不致出现系统性、倾向性偏差;在随机原则下,当抽样数目达到足够多时,样本就会遵从大数定律而呈正态分布,样本单位的标志值才具有代表性,其平均值才会接近总体平均值;按随机原则抽样,才可能实现计算和控制抽样误差的目的。 二、抽样调查的阶段划分与职业规范 由上述抽样调查的概念出发,我们可以将抽样调查工作的全过程 划分成三个不同的阶段 第一阶段为抽样设计阶段。

第二阶段为调查阶段。 第三阶段为数据处理和估计推断阶段。 在抽样调查中,首先,要注意尊重并保护被调查者的隐私权,调查结果只能用于综合分析,而不应给被调查者造成不必要的麻烦和伤害。其次,要诚实地分析调查资料,不能为得出某个事先期望的结论而随意地改动资料。第三,要做一个具有职业水平的工作者,做出来的东西既要有能让普通人看懂的主要信息,也要有能让专家看出其内涵的内容。第四,当从有些调查结果得不出好的结论时,应诚实地加以说明,而不应含糊其词。最后,抽样调查必须在国家法律法规所允许的范围内进行,不做违反社会公众利益的调查。 三、抽样调查的特点 首先,按随机原则抽选调查单位是抽样调查的一大特色。 其次,可以用样本资料推断总体资料是抽样调查的又一基本特征。 其三,抽样调查的速度快、周期短、精度高。 其四,在抽样推断之前可以计算和控制抽样误差。 其五,抽样技术灵活多样。 其六,抽样调查的应用十分广泛。 最后,同其他调查方式相比,抽样调查的技术性更强。 四、抽样调查的作用 抽样调查所依据的概率原理属于数理统计学的一个重要分支,也是现代统计学的基础。抽样的方法不仅对统计推断、统计检验以及统计决策等理论的发展产生了直接的影响,而且还构成了其他应用性学科如计量经济学、

统计学习题答案_第4章__抽样与抽样分布

第4章 抽样与抽样分布——练习题(全免) 1. 一个具有64=n 个观察值的随机样本抽自于均值等于20、标准差等于16的总体。 ⑴ 给出x 的抽样分布(重复抽样)的均值和标准差 ⑵ 描述x 的抽样分布的形状。你的回答依赖于样本容量吗? ⑶ 计算标准正态z 统计量对应于5.15=x 的值。 ⑷ 计算标准正态z 统计量对应于23=x 的值。 解: 已知 n=64,为大样本,μ=20,σ=16, ⑴在重复抽样情况下,x 的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x <16; ⑵x >23; ⑶x >25; ⑷.x 落在16和22之间; ⑸x <14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100=n 个观察值的随机样本选自于30=μ、16=σ的总体。试求下列概率的近似值: 解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远? ⑶ 为了回答b 你必须要知道μ吗?请解释。 解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。对于每一个样本容量,构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。 解:趋向正态 6. 美国汽车联合会(AAA )是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、 金融、保险以及与汽车相关的各项服务。1999年5月,AAA 通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News ,1999年5月11日)。假设这个花费的标准差是15美元,并且AAA 所报道的平均每日消费是总体均值。又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。 ⑴ 描述x (样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明x 服从怎样

相关文档
相关文档 最新文档