文档视界 最新最全的文档下载
当前位置:文档视界 › 本章提出了抽样的基本概念和基本术语.doc

本章提出了抽样的基本概念和基本术语.doc

本章提出了抽样的基本概念和基本术语.doc
本章提出了抽样的基本概念和基本术语.doc

第四章抽样讲课稿

本章提出了抽样的基本概念和基本术语,阐释了抽样在社会调查研究中的作用,介绍了不同种类的抽样方法,特别说明了每一种方法的适用范围和操作程序,并对它们做了简要评价。同时,为了更好地应用抽样方法,还简要介绍了样本规模和抽样误差问题。其中最重要的就是要联系实际认识和掌握各种抽样方法。

一、抽样的概念和基本术语

当今社会最主要和最常用的调查类型是抽样调查,它的前提条件就是抽样。因此,抽样是在许多社会调查研究的准备阶段必须完成的一项重要工作。

(一)抽样的概念

抽样指的是从组成某个总体的所有元素、也就是所有最基本单位中,按照一定的方式选择或抽取一部分元素的过程和方法,或者说是从总体中按照一定方式选择或抽取样本的过程和方法。

抽样存在的必要性缘于总体本身所具有的异质性。如果某个总体中的每一个成员在所有方面都相同,即具有百分之百的同质性,那么抽样也就没有必要了。

抽样存在的合理性是由辩证唯物主义个别与一般的理论和建立在概率论基础上的大数定律和中心极限定律决定的。这些理论与定律证明,尽管总体所包含的每一个个体都不能完全地反映总体的性质和特征,却都具有不同程度的总体的性质和特征的因素,所以一定数量个体的因素的集合,就可以等同或接近总体的性质和特征。

在社会调查研究中,抽样主要解决的是调查对象的选取问题,即如何从总体中选出一部分对象作为总体的代表的问题。关于抽样的作用,有两个相关的问题需要特别明确:第一,抽样和抽样调查不能混为一谈。抽样只是抽样调查的前提和一部分,只解决抽样调查过程中的选取调查对象这一个问题,抽样调查的其它所有问题都是靠另外的方法来解决的。

第二,抽样只是抽取样本的方法,而不是调查方法或者说资料收集方法。

(二)抽样的基本术语和抽样的基本程序

1.基本术语

在抽样中,有一些常用的基本术语:

(1)总体。它是构成事物的所有元素、也就是最基本单位的集合。

(2)样本。它是从总体中按照一定方式抽取出的一部分元素的集合。

(3)抽样元素。它指的是构成总体的每一个最基本单位,也称“抽样分子”或“个体”。

(4)抽样单位。它是一次直接的抽样所使用的基本单位。抽样单位与抽样元素有时是同一的,有时又是不同的。

(5)抽样框。它又称作抽样范围,指的是一次直接抽样时总体中所有抽样单位的名单。

(6)参数值。它也称为总体值,是关于总体中某一变量的综合描述,或者总体中所有元素的某种特征的综合数量表现。在统计中最常见的参数值是某一变量的平均值。

(7)统计值。它也称为样本值,是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。

(8)抽样误差。它是用样本统计值去估计总体参数值时所出现的误差

2.基本程序

虽然不同的抽样方法具有不同的操作要求,但它们通常都要经历这样几个步骤:1.界定总体

界定总体就是在具体抽样前,明确从中抽取样本的总体的范围与界限。

2.决定抽样方法

各种不同的抽样方法都有自身的特点和适用范围。因此,我们在具体实施抽样之前,应依据调查研究的目的、界定的总体范围、要求确定样本的规模和要求量化的精确程度来决定具体采用哪种抽样方法。

3.设计抽样方案

4.制定抽样框

制定抽样框就是依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并统一编号。

5.实际抽取样本

实际抽取样本就是在上述几个步骤的基础上,严格按照所选定的抽样方法,从抽样框中抽取一个个的抽样单位,构成样本。

6.样本评估

样本评估就是对样本的质量和代表性进行检验,其目的是防止因样本的偏差过大而导致的失误。

二、抽样的类型

根据抽取对象的具体方式,人们把抽样分为许多不同的类型。总的来说,各种抽样都可以归为概率抽样与非概率抽样两大类。这是两种有着本质区别的抽样类型。概率抽样是依据概率论的基本原理,按照随机原则进行的抽样,因而它能够避免抽样过程中的人为误差,保证样本的代表性;而非概率抽样则主要是依据研究者的主观意愿、判断或是否方便等因素来抽取对象,它不考虑抽样中的等概率原则,因而往往产生较大的误差,难以保证样本的代表性。

概率抽样与非概率抽样又各自包括了许多具体类型。分别适用于不同调查对象。联系实际认识概率抽样的不同类型及其适用性是掌握抽样方法的关键。

(一)概率抽样

概率抽样又称随机抽样,是指总体中每一个成员都有同等的进入样本的可能性,即每一个成员的被抽概率相等,而且任何个体之间彼此被抽取的机会是独立的。概率抽样以概率理论为依据,通过随机化的机械操作程序取得样本,所以能避免抽样过程中的人为因素的影响,保证样本的客观性。虽然随机样本一般不会与总体完全一致,但它所依据的是大数定律,而且能计算和控制抽样误差,因此可以正确地说明样本的统计值在多大程度上适合于总体,根据样本调查的结果可以从数量上推断总体,也可在一定程度上说明总体的性质、特征。正是因为如此,现实生活中绝大多数抽样调查都采用概率抽样方法来抽取样本。

概率抽样依照具体抽样方法的不同,分为以下类型:

1.简单随机抽样

简单随机抽样又称纯随机抽样,是指在特定总体的所有单位中直接抽取n个组成样本。它是一种等概率抽样和元素抽样方法,最直观地体现了抽样的基本原理。简单随机抽样是最基本的概率抽样,其它概率抽样都以它为基础,可以说是由它派生而来的。

简单随机抽样分为重复抽样和不重复抽样两类。

常用的简单随机抽样方法有直接抽样法、抽签法和随机数表法。

其中直接抽样法、抽签法适用于总体规模稍小的抽样;随机数表法是用随机数表来抽样的方法,适用于总体规模稍大的抽样。

简单随机抽样没有人为因素的干扰,简单易行,是概率抽样的理想类型。但是它也

有很大局限性。

第一,这种抽样方法,在总体同质性较高时,用来比较准确有效,但在总体异质性较高时,则不一定效果好。这是因为当构成总体的个体差异较大时,用简单随机抽样方法抽出的样本由于在总体中的分布不一定均匀,所以很可能误差较大,不能很好地说明总体的性质和特征。

第二,当总体所含个体数目太多时,采用这种抽样方式不仅费时、费力、费钱,而且很难操作。

2.系统抽样

系统抽样也称等距抽样或机械抽样,是按一定的间隔距离抽取样本的方法。其做法是先编制抽样框,将总体的所有单位都按一定标志排列编号;再用总体的单位数除以样本的单位数,求得抽样间距;然后,在第一个抽样间距内随机抽出第一个样本单位,作为抽样的起点;接着,按照抽样间距依次抽取样本单位,直到抽足样本的单位数为止。

同简单随机抽样相比,系统抽样有明显的优点。

第一,当总体规模较大时,系统抽样比简单随机抽样中的随机数表法易于实施,工作量较少。它不需要反复使用随机数字表抽取个体,而只需按照间隔等距抽取即可。

第二,系统抽样的样本不是任意抽取,而是按照间隔等距抽取,所以在总体中的分布更均匀,抽样误差一般也要小于简单随机抽样,也就是说精确度更高,代表性更强。

系统抽样的局限性与简单随机抽样一样,也是仅适用于同质性较高的总体。当总体内不同类别个体的数量相差过于悬殊时,采用此法所抽出的样本代表性可能较差。另外,总体单位的排列不能呈有规律分布的状态,否则会使系统抽样产生很大误差,降低样本的代表性。

3.分类抽样

所谓分类抽样也叫类型抽样或分层抽样,就是先将总体的所有单位依照一种或几种特征分为若干个子总体,每一个子总体即为一类,然后从每一类中按简单随机抽样或系统随机抽样的办法抽取一个子样本,称为分类样本,再把它们集合起来即为总体样本。

按照确定分层样本数量的不同方式,分类抽样分为比例分类抽样和非比例分类抽样两种。比例分类抽样是指分类样本在总体样本中所占比例与该类所有单位在总体中所占比例相同;非比例分类抽样则比例不同。

分类抽样有着突出的优点:

第一,分类抽样能够克服简单随机抽样的缺点,适用于总体内个体数目较多,结构较复杂,内部差异较大的情况。

第二,精确度较高。

第三,便于对不同层面的问题进行探索。

第四,便于分工,使工作效率提高。

分类抽样的缺点是,如何分类通常由人们主观判定,因此要求调查者具备较高的素质与能力,并且必须事先对总体各单位的情况有较多的了解,而它们在实际工作中有时难以完全实现,这就会影响分类的科学性和精确性。

4.整群抽样

整群抽样又称聚类抽样或集体抽样,是将总体按照某种标准划分为一些群体,每一个群体为一个抽样单位,再用随机的方法从这些群体中抽取若干群体,并将所抽出群体中的所有个体集合为总体的样本。整群抽样分为等规模整群抽样和不等规模整群抽样,前者总体内所有群体的规模都大致相同,后者总体内各群体规模则不等,在社会调查研究中以后一种情况居多。这种差异如果较大,就会对抽样成本预算与精确度测算以及实地调查工作造成不利影响,同时还容易产生抽样偏差。为了解决这一问题,人们往往采

用概率与元素的规模大小成比例的抽样方法,简称PPS抽样(Probability Proportionate to Size),就是根据每个群体所包含的最终抽样单位(如家庭)的规模来决定各自抽取样本的比例大小,规模大则抽取样本比例相对小,规模小则抽取样本比例相对大,从而保证每个群体中的最终抽样单位都具有被抽中的同等机会。

整群抽样与分类抽样都是将总体分为一些子群,但它和分类抽样的区别在于不是按性质和特征而是按集群性划分抽样对象。而且分类抽样中所有子群均要抽取一个样本,总体样本是各分类样本的集合,即总体样本在各类中均有分布。整群抽样则不然,它是抽取若干子群,并将这些子群的全部个体集合为总体样本,因此,总体样本只分布在部分子群之中。整群抽样对于个体单位之间界限不清的总体,能够充分发挥其作用,却并不适用于总体单位界限分明的情况。对于后者,一般还是以采用分类抽样等方法为宜。

另外,整群抽样对于所含子群总数较少的总体也不大适用。

5.多阶段抽样

多阶段抽样又称多级抽样或分段抽样,就是把从总体中抽取样本的过程分成两个或多个阶段进行的抽样方法。它是在总体内个体单位数量较大,而彼此间的差异不太大时,先将总体各单位按一定标志分成若干群体,作为抽样的第1阶段单位,并依照随机原则,从中抽出若干群体作为第1阶段样本;然后将第1阶段样本又分成若干小群体,作为抽样的第2阶段单位,从中抽出若干群体作为第2阶段样本,依此类推,可以有第3阶段、第4阶段。。。直到满足需要为止。最末阶段抽出的样本单位的集合,就是最终形成的总体样本。

在进行大规模社会调查时,如果抽样单位只有一级,而且样本的分布极其分散,所需调查费用与人力物力就巨大。多阶段抽样采用从高级抽样单位到低级抽样单位逐段抽样的方法,能够较好地解决这些问题。因此,多阶段抽样的最大优点就是可以达到以最小的人财物消耗和最短的时间获得最佳调查效果的目的,特别适用于调查范围大、单位多、情况复杂的调查对象。此外,多阶段抽样由于在各阶段抽样时可根据具体情况灵活选用不同的抽样方法,所以能够综合各种抽样方法的优点,有利于提高样本质量。

多阶段抽样的不足之处是抽样误差较大。由于每次抽样都必然产生误差,所以抽样阶段越多抽样误差就越大。因此,为了降低抽样误差的程度,必须避免不必要的分段。

(二)非概率抽样

非概率抽样又称为不等概率抽样、非随机抽样或主观抽样,就是调查者根据自己的方便或主观判断抽取样本的方法。它不是严格按随机抽样原则来抽取样本,所以失去了大数定律的存在基础,也就无法确定抽样误差,无法正确地说明样本的统计值在多大程度上适合于总体。虽然根据样本调查的结果也可在一定程度上说明总体的性质、特征,但不能从数量上推断总体。

非随机抽样的具体方法很多,其中常用的有以下几种:

1.偶遇抽样

偶遇抽样又叫自然抽样、方便抽样或便利抽样,是调查者将在一定时间、一定环境里所能遇见到或接触到的人作为样本的方法。具体说就是调查者根据自己的方便,任意抽取偶然遇到的人或者选择那些离自己最近的、最容易找到的人作为样本。

2.判断抽样

判断抽样又叫目标抽样、或立意抽样,是调查者根据研究的目标和自己主观的分析,来选择和确定样本的方法。它又可分为印象判断抽样和经验判断抽样两种。

3.定额抽样

定额抽样又叫配额抽样,是先根据总体各个组成部分所包含的抽样单位的比例分配样本数额,然后由调查者在各个组成部分内根据配额的多少采用主观的抽样方法抽取样

本。

定额抽样与概率抽样中的分类抽样、整群抽样都是依据某些特征对总体进行分类,但定额抽样注重的是样本与总体在结构比例上的表面一致性而不是本质特征上的内部一致性。所以往往照顾不到总体单位之间的差异性。对于那些单位众多、错综复杂、情况不断更新的调查总体而言,定额抽样的样本很可能出现较大的误差,因此,根据定额抽样样本调查的结果是不能推论较大总体的,即使在较小的调查研究中,要用定额抽样调查的结果推论总体,也应谨慎从事。它一般不是用于说明总体状况,而是用于检验理论、说明关系、比较不同等。

4.滚雪球抽样

滚雪球是一种形象比喻的说法,它是指先找少量的、甚至个别的调查对象进行访问,然后通过他们再去寻找新的调查对象,依次类推,就像滚雪球一样越来越大,直至达到调查目的为止。

滚雪球抽样适用于总体的个体信息不充分或难以获得,不能使用其它抽样方法抽取样本的调查研究。

滚雪球抽样用于某一特殊群体的调查往往可以收到奇效。但是,当总体规模较大时,有许多个体就无法找到;有时调查对象会出于某种考虑故意漏掉一些重要个体,这都可能导致抽样样本产生误差,无法正确反映总体状况。

总之,非概率抽样不是按照概率均等的原则,而是根据人们的主观经验和便利条件来抽取样本,每个个体进入样本的概率是未知的,无法说明样本是否重现了总体的结构,所以,其样本的代表性往往较小,误差有时相当大并且无法估计,用这样的样本推论总体是不可靠的。

但是非概率抽样也有其优势:一是在很多情况下,严格的随机抽样无法进行或没有必要,例如,在人流涌动的车站、商店、广场、街道等许多场合,不允许调查者从容地随机抽样;对诸如吸毒者之类的特殊社会群体无法确定调查总体,也就无法随机抽取样本;有时调查的目的只是要对总体作最一般的了解和接触或做某些片面的研究,没必要采用随机抽样;由于调查者的时间,人力,物力不足,无力进行随机抽样,等等。在这些情况下,就只能采用非概率抽样。二是随机抽样为了保证概率原则,对抽样的操作过程要求严格,实施起来比较麻烦,费时费财费力,而非概率抽样操作便捷,省钱省时省力,统计上也远较概率抽样简单,因此如果调查的目的允许,而且调查者对调查总体有较好的了解,那么采用非概率抽样就不失为一种更好的选择。

常用抽样方法

1.非概率抽样(Non-probability sampling) 又称非随机抽样,指根据一定主观标准抽取样本,令总体中每个个体的被抽取不是依据其本身的机会,而是完全决定于调研者的意愿。 其特点为不具有从样本推断总体的功能,但能反映某类群体的特征,是一种快速、简易且节省的数据收集方法。当研究者对总体具有较好的了解时可以采用此方法,或是总体过于庞大、复杂,采用概率方法有困难时,可以采用非概率抽样来避免概率抽样中容易抽到实际无法实施或"差"的样本,从而避免影响对总体的代表度。 常用的非概率抽样方法有以下四类: 方便抽样(Convenience sampling) 指根据调查者的方便选取的样本,以无目标、随意的方式进行。例如:街头拦截访问(看到谁就访问谁);个别入户项目谁开门就访问谁。 优点: 适用于总体中每个个体都是"同质"的,最方便、最省钱;可以在探索性研究中使用,另外还可用于小组座谈会、预测问卷等方面的样本选取工作。 缺点: 抽样偏差较大,不适用于要做总体推断的任何民意项目,对描述性或因果性研究最好不要采用方便抽样。 判断抽样(Judgment sampling) 指由专家判断而有目的地抽取他认为"有代表性的样本"。例如:社会学家研究某国家的一般家庭情况时,常以专家判断方法挑选"中型城镇"进行;也有家庭研究专家选取某类家庭进行研究,如选三口之家(子女正在上学的);在探索性研究中,如抽取深度访问的样本时,可以使用这种方法。 优点: 适用于总体的构成单位极不相同而样本数很小,同时设计调查者对总体的有关特征具有相当的了解(明白研究的具体指向)的情况下,适合特殊类型的研究(如产品口味测试等);操作成本低,方便快捷,在商业性调研中较多用。 缺点: 该类抽样结果受研究人员的倾向性影响大,一旦主观判断偏差,则根易引起抽样偏差;不能直接对研究总体进行推断。 配额抽样(Quota sampling) 指先将总体元素按某些控制的指标或特性分类,然后按方便抽样或判断抽样选取样本元素。 相当于包括两个阶段的加限制的判断抽样。在第一阶段需要确定总体中的特性分布(控制特征),通常,样本中具备这些控制特征的元素的比例与总体中有这些特征的元素的比例是相同的,通过第一步的配额,保证了在这些特征上样本的组成与总体的组成是一致的。在第二阶段,按照配额来控制样本的抽取工作,要求所选出的元素要适合所控制的特性。例如:定点街访中的配额抽样。 优点: 适用于设计调查者对总体的有关特征具有一定的了解而样本数较多的情况下,实际上,配额抽样属于先"分层"(事先确定每层的样本量)再"判断"(在每层中以判断抽样的方法选取抽样个体);费用不高,易于实施,能满足总体比例的要求。 缺点:

抽样技术 概念

目录第一章预备知识 第二章基本概念 第三章简单随机抽样 第四章分层随机抽样 第五章不等概率抽样 第六章多阶段抽样 第七章整群抽样 第八章系统抽样 第九章非概率抽样

第一章预备知识 作为抽样技术的基础知识或预备知识,本章简要地介绍调查原理、排列组合、概率统计等方面的有关知识。 一、调查概论 调查的重要性:有利于制定政策、投资决策、科学研究、机构管理以及司法实践等;与此同时,许多学科的进步和发展也同样离不开调查。 (一)(一)调查本质上是一种测量活动 测量活动具有6个要素:测量主体、测量客体、测量对象、测量法则、测量工具、测量结果(数字/符号)。 测量得到的数据大体分为三种类型:分类型数据、顺序型数据以及数值型数据。 测量的方法分为:直接测量和间接测量。 (二)(二)真值、测量值与误差 误差公理:任何调查结果都可能具有误差,而且误差始终存在于一切科学试验和调查过程中 。根据误差的来源分类:调查主体误差、调查客体误差、调查工具误差、调查法则误差、调查环境误差。 误差公理:任何调查结果都可能具有误差,而且误差始终存在于一切科学试验和调查过程中。 根据误差的来源分类:调查主体误差、调查客体误差、调查工具误差、调查法则误差、调查环境误差。 根据误差的性质分类:系统误差、随机误差和粗大误差。 根据误差的计量尺度分类:绝对误差和相对误差。 绝对误差δ、(调查)估计值x以及真实值μ之间的关系:δ=x-μ。 相对误差r、绝对误差δ以及真实值μ之间的关系:r=δ/μ。 实际常用的真值分类:理论真值、约定真值以及相对真值。 实际常用的测量值分类:单次测量值、算术平均值、加权平均值、中位数和众数。 (三)(三)信度、效度与精度 信度表示测量结果中的随机误差大小的程度。 信度的表示方法:测量值的方差(或标准差)或者样本平均数的方差(或标准差)。 衡量信度的三种方法:再测信度、复本信度和折半信度。 衡量信度的三种方法;再测信度、复本信度和折半信度。 效度表示测量结果中的系统误差大小的程度,是测量结果的“有效性” 的反映。 效度分类:内容效度、准则效度和结构效度。 效度含义:(1)测量的特征即为研究的目标特征;(2)该特征被准确地测量。 效度的表示方法:B(x)=|x-μ|或者B(E x)=|E x-μ|。 精度是信度与效度的综合,但它还与信度与效度之外的因素有关。 精度的表示方法:均方误差MSE(x)=V(x)+ () 2 B Ex u - 效度的表示方法: μ - =x x B) (或者μ - =x E x E B) (。 精度表示信度与效度的综合,但它还与信度与效度之外的因素有关。 精度的表示方法:均方误差 2 ()()() MSE x V x B Ex =+ 信度、效度与精度之间的关系:对于测量或调查来说,信度高的效度未必高,反过来效度高的信度未必高,但精度高的信度和效度肯定高。 二、排列组合 (一)(一)两条基本原理 加法原理和乘法原理。

什么是抽样抽样的基本术语及其含义是什么

24什么是抽样?抽样的基本术语及其含义是什么? 24(什么是抽样,抽样的基本术语及其含义是什么, 答:前一问见名词简释。抽样的常用基本术语有: 1(总体。它是构成事物的所有元素、也就是最基本单位的集合。 (样本。它是从总体中按照一定方式抽取出的一部分元素的集合。一个样本是总体的 2 一个子集,一个总体中可以抽取出若干个不同的样本。 3(抽样元素。它指的是构成总体的每一个最基本单位,也称“抽样分子”或“个体”。社会调查研究中最常用的抽样元素是单个的人,但也可以是家庭、学校、企业、商店等。 4(抽样单位。它是一次直接的抽样所使用的基本单位。抽样单位与抽样元素有时是同一的,有时又是不同的。 5(抽样框。它又称作抽样范围,指的是一次直接抽样时总体中所有抽样单位的名单。 6(参数值。它也称为总体值,是关于总体中某一变量的综合描述,或者总体中所有元素的某种特征的综合数量表现。在统计中最常见的参数值是某一变量的平均值。 7(统计值。它也称为样本值,是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。样本值是从样本的所有元素中计算出来的,它是相应的总体值的估计量。 8(抽样误差。它是用样本统计值去估计总体参数值时所出现的误差。这种误差是因为抽样本身的特点而引起的。由于无论采取什么样的抽样方式,所抽取的样本

有多大,都无法涵盖总体,所以抽样误差是不可避免的。但是,抽样误差的大小是可以在样本设计中事先进行控制的。 25(在社会调查中,如何确定样本规模, 答:具体每一个社会调查研究究竟应当选择多大规模的样本,主要取决于以下几点: (1)总体规模:根据抽样原理,样本规模与总体规模越接近,样本值与总体值就越一致,抽样误差就越小,样本的代表性也越强。但是当总体规模大到一定程度以后,样本规模的加大就不是那么必要了。因此,对于10 000个单位以下的总体来说,样本规模应尽可能大;而对于那些超大型的总体,则可以按照一两万个单位的总体规模来确定样本规模,以避免不必要的浪费。 (2)抽样的精确性:从理论上说,样本的精确度越高越好,但相应的样本规模也要越来越大,这就意味着调查者的时间和人财物力的消耗也要增加好几倍。而对于大多数社会调查研究来说,实际上并不要求太高的精确度。因此,调查者应当根据必要性和可能性,适当地确定样本精确度,决不能因一味追求精确度的提高而拼命扩大样本规模,否则将导致巨大的浪费。 (3)总体的异质性程度:要达到同样的精确度,在同质性较高的总体中抽样时,样本规模可以小一些;在异质性较高的总体中,样本规模则应该大一些。为了提高了样本反映总体的精确度,人们通常用分类抽样的方法将总体划分为不同的类别或层次,让这些不同类别或层次在样本中都有代表,并使得抽样误差中基本不存在类与类之间的误差成分,而只存在类内各单位之间的误差成分,其效果相当于缩小了总体的异质性程度和单位分布的不均匀状态。 (4)调查者所拥有的经费、人力、物力和时间:尽管从样本的代表性、抽样的精确性考虑,样本规模应尽可能大,但一般调查的经费、人力、物力和时间总是有限

抽样检验方案

抽样检验方案 第四节抽样检验方案(大纲要求熟悉) 一、抽样检验的几个基本概念(基础知识) 1.抽样检验方案 是根据检验项目特性所确定的抽样数量、接受标准和方法。如在简单的计数值抽样检验方案中,主要是确定样本容量n和合格判定数,即允许不合格品件数c,记为方案(n,c)。 2.检验. 检验是对检验项目中的性能进行量测、检查、试验等,并将结果与标准规定要求进行比较,以确定每项性能是否合格所进行的活动。 3.检验批 4.批不合格品率 是指检验批中不合格品数占整个批量的比重。 5.过程平均批不合格品率 是指对k批产品首次检验得到的k个批不合格品率的平均数。 6.接受概率(又称批合格概率) 接受概率是根据规定的抽样检验方案将检验批判为合格而接受的概率。一个既定方案的接受概率是产品质量水平,即批不合格品率P的函数,用L(p)表示,检验批的不合格品率p越小,接受概率L(p)就越大。 二、抽样检验方案类型 (一)抽样检验方案的分类 (二)常用的抽样检验方案(大纲要求熟悉) 1.标准型抽样检验方案 (1)计数值标准型一次抽样检验方案 计数值标准型一次抽样检验方案是规定在一定样本容量n时的最高允许的批合格判定数c,记作(n,c),并在一次抽检后给出判断检验批是否合格的结论。c也可用Ac表示。c值一般为可接受的不合格品数,也可以是不合格品率,或者是可接受的每

百单位缺陷数。若实际抽检时,检出不合格品数为d,则当: d≤c时,判定为合格批,接受该检验批;d>c定为不合格批,拒绝该检验批。 (2)计数值标准型二次抽样检验方案(以上两种标准型抽样检验程序见图7-16、7-17) (3)多次抽样检验方案(★适当位置加图7-16和7-17) 2.分选型抽样检验方案 3.调整型抽样检验方案 [例题]当采用计数值标准型一次抽样检验方案实际抽检时,检验出的不合格品数d,当(),判定为不合格批,拒绝该检验批。 A. d c C. d =c D. d =r 答案:B 抽样检验方案参数的确定 三、抽样检验方案参数的确定(大纲要求了解) 实际抽样检验方案中也都存在两类判断错误。即可能犯第一类错误,将合格批判为不合格批,错误地拒收;也可能犯第二类错误,将不合格批判为合格批,错误地接受。错误的判断将带来相应的风险,这种风险的大小可用概率来表示。如教材157页图7-19所示。 第一类错误是当p=po时,以高概率L(p)=1-α接受检验批,以α为拒收概率将合格批判为不合格。由于对合格品的错判将给生产者带来损失,所以关于合格质量水平p o的概率α,又称供应方风险⑸椒缦盏取 第二类错误是当p=p1时,以高概率(1-β)拒绝检验批,以β为接受概率将不合格批判为合格。这种错误是将不合格品漏判,从而给消费者带来损失,所以关于极限不合格质量水平p1的概率β,又称使用方风险、消费者风险等。 [例题]实际抽样检验中,有出现错误判断的可能,第一类错误判断是()。 A.将合格批判为不合格批

审计测试中的抽样技术

第九章审计测试中的抽样技术 第一节审计抽样概论 【学习要领】理解统计抽样和非统计抽样的依据有何不同,抽样风险和非抽样风险的区别及对审计效率、效果的影响。掌握样本量与各因素的关系、选取样本的方法及评价抽样结果的步骤。 一、与审计抽样的相关概念 (一)审计抽样的概念: 审计抽样,是指注册会计师在实施审计程序时,从审计对象总体中选取一定数量的样本进行测试,并根据测试结果,推断审计对象总体特征的一种方法。 审计抽样对控制测试和实质性测试都适用,但并不是对于这些测试中的所有程序都适用。如审计抽样可用于逆查、顺查、函证、盘点等,但对询问、观察、分析性复核等不适用。 抽样审计不同于抽查。抽查作为一种技术,可以用来了解情况,确定审计重点,取得审计证据,使用中并无严格要求。审计抽样作为一种方法,需要运用抽查技术。 审计抽样的基本目标是在有限审计资源条件限制下,收集充分、适当的审计证据,以形成和支持审计结论。 抽样审计的步骤: ①确定抽样审计对象总体(1000笔销售业务); ②进行样本设计,确定有效样本容量(100笔销售业务);

③选取样本项目; ④审查样本项目,得出样本审查结果(误差)(2笔未经授权); ⑤分析样本结果,推断总体特征(误差)(推断20笔未经授权),得出审计结论。 (二)抽样误差和抽样风险 抽样误差:是由于采用抽样引起的误差,即注册会计师根据样本推断的总体特征与真实总体特征的差异。 抽样风险:抽样风险是由于采用抽样引起的风险,即注册会计师依据抽样结果得出的结论与审计对象总体特征不相符合的可能性。抽样风险与样本量成反向关系,样本量越大,抽样风险越低。(可这样理解:当抽取100%的样本时,样本就能完全代表总体,抽样风险为0。这实际上不是抽样了,而是全查,即不存在抽样风险。) (三)统计抽样和非统计抽样(按抽样决策的依据划分) 抽样审计发展经历了任意抽样、判断抽样和统计抽样三阶段。其中任意抽样和判断抽样属非统计抽样。 任意抽样,系指在所有被审查的资料中,任意抽取一部分作为样本,进行审查的一种方法。任意抽样由于样本是由注册会计师任意选取,没有一定的科学依据。因此,在审计工作实践中,很少采用这种方法。 判断抽样,系指注册会计师根据审计目的、被审项目的重要

抽样技术重点复习概念

调查:通过使用明确的概念、方法和程序,依据专门设计的调查方案知道的方式,从一个总体全部或部分单元中搜集感兴趣的指标信息,并将这些信息综合整理成数据系列的有关活动。 抽样调查:是调查应用最常见的模式,是一种非全面的调查,它是指从研究对象的全体(总体)中抽取一部分单元作为样本,根据对所抽取的样本进行调查,获得有关总体目标量的了解。这是广义的抽样调查的概念 抽样调查步骤:调查目标确定、抽样框选择、抽样方案设计、问卷设计、数据收集、数据编码和录入、审核与插补、参数估计、数据分析和调查结果的表述、数据分布、撰写调查报告 简单随机抽样:也称纯随机抽样,是从抽样框内的N个抽样单元中随机的、一个一个的抽取n个单元作为样本,在每次抽选中,所有未入样的待选单元入选样本的概率都想等,这n个被抽中的单元就构成了简单随机样本。简单随机样本也可以一次从总体(抽样框)中同时抽出,这时全部可能样本中的每一个样本被抽中的概率也需要相等。 分层抽样:是将抽样单元按某种特征或某种规划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计。 分层随机抽样:如果每层中的抽样都是独立地按照简单随机抽样进行的,那么这样的分层抽样称为分层随即抽样,所得的样本称为分层随即样本。 整群抽样:将总体中的若干个基本单元合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有基本单元全部实施调查,这样的抽样方法称为整群抽样。 多阶段抽样:采用类似整群抽样的方法,首先抽取群,但不是调查群内的所有基本单元,而是再进一步抽样,从选中的群中抽取出若干个基本单元进行调查,因为取得这些接受调查的基本单元需要两个步骤,所以将这种抽样方式成为两阶段抽样。这里,群是初级抽样单元,第二阶段抽取的是基本抽样单元。将这种方法推广,使抽样的段数增多,就称为多阶段抽样。 系统抽样:将总体中的所有单元(抽样单元)按一定顺序排列,在规定的范围内随机抽取一个单元作为初始单元,然后按事先规定好的规则确定其他样本单元,这种抽样方法称为系统抽样。 简单估计:在没有总体其他相关辅助变量信息可以利用的情况下,用样本特征直接估计总体特征,且样本特征与预估的总体特征除了写法之分外,完全同形同构,简单易记,因此有简单线性估计的名称,简称为简单估计。 比率估计:设对有两个调查变量Y 和X 的总体进行简单随机抽样,分别以y,x表示样本总值,以y,x表示样本均值,以μ// R y x y x ==为样本比率,用 μR作为总体比率R的估计称为的比率估计 回归估计:在简单随机抽样下,总体均值和总体总值Y的回归估计量定义为: ()() tr y y X x y x X ββ =+-=-- μ lr lr Y N y =其中Y,X分别为调查变量、辅助变量的样本均值,X是辅助变量的总体均值,β称为回归系数。 不等概抽样:如果总体中每个单元进入样本的可能性是不相等的,则这种随机抽样方式就称为不等概率随机抽样,简称不等概率抽样。 非抽样误差:除抽样误差以外的,由于各种原因引起的误差。 非抽样误差的分类:抽样框误差(由不完善的抽样框引起的误差);无回答误差(由于种种原因没有从被调查单元获得调查结果,造成调查数据的缺失);计量误差(所获得的调查数据与其真值之间不一致造成的误差)

谈谈几种典型的抽样方法(案例)

谈谈几种典型的抽样方法(案例) 学院:经济学院 班级: 08经41 学号: 08084004 姓名:毛雪晨 日期: 2011年10月20日

摘要:本文以抽样方法为中心,主要阐述几种常见的抽样方法,如简单随机抽样,分层抽样,整群抽样,系统抽样以及配额抽样,探讨了各种抽样方法在实际生活的应用以及各自的优缺点等。 关键词:抽样调查,应用,缺点。

导语:抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。显然,抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。 抽样调查是建立在随机原则基础上,从总体中抽取部分单位进行调查,并概率估计原理,应用所的资料对总体的数量特征进行推断的一种调查方法。例如,从某地区全部职工当中随机抽取部分职工,以家庭为单位按月调查取得有关收入、支出等方面的资料,并依据这些资料推断出全区职工的收支情况,这就是一种抽样调查。从调查方法上来看,它是属于一种非全面调查。但又与一般调查不同,它不只停留于搜集资料和整理资料,而且还要对资料进行分析,并据以推断总体的数量特征,从而提高统计的认识能力。因此,抽样调查的理论和方法在统计中占有很重要的地位。 下面介绍一下常用的抽样方法: 一. 简单随机抽样 一般,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的个体被抽到的机会相等,就把这种抽样方法叫做简单随机抽样。 简单随机抽样的具体作法有:直接抽选法,抽签法,随机数法。 直接抽选法例如某项调查采用抽样调查的方法对某市职工收入状况进行研究,该市有职工56,000名,抽取5,000名职工进行调查,他们的年平均收入为10,000元,据此推断全市职工年收入为8,000--12,000元之间。 抽签法又称“抓阄法”。它是先将调查总体的每个单位编号,然后采用随机的方法任意抽取号码,直到抽足样本。在这里选取一个案例说明,如要在10个人中选取3个人作为代表,先把总体中的10个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取3次,就得到一个容量为3的样本。这就是抽签法,与直接抽样法类似。 另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算

抽样方案设计

抽样方案设计 所谓抽样设计,就是依据调查目的,在给定的人力、物力、财力等的条件下,在从一定总体中抽取样本资料以前,预先确定抽样程序和方案,在保证所抽取的样本有充分代表性的前提下,力求取得最经济、最有效的结果。 一般来说,抽样设计的主要内容及步骤如下: (一)定义目标总体 目标总体是指抽样设计者根据调查目的界定的调查研究对象的集合体。调查目的和范围对定义目标总体具有关键性的作用。目标总体是对整个研究具有重大意义的群体,它们之所以有重要的地位,是因为我们可以从它们身上收集到对研究有关键用途的信息。另外,还有一些因素可能也会影响我们界定目标总体,如研究的主题、时间等。 (二)决定抽样框 目标总体选定后就需要由抽样框执行了。抽样框是抽样调查前在可能条件下作出的抽样单位一览表或一览图,即由抽样单位构成的名录。例如,以宁波市医师为抽样单位,则宁波市医师名册便是抽样框。如果以学校班级为抽样单位,则学校所有班级名册便是抽样框。抽样框既可以是一份包含所有抽样单位的名单,也可以是一张地图或其他适当的形式,如电话簿的列表、餐厅的菜单、包含公司所有客户名单的数据库或是电子数据库的目录等。无论是哪种形式,抽样框中的抽样单位必须是有序的,以便于编号。抽样单位是指在抽取样本前将总体依据一定标准分成若干部分,其中的每一部分称为一个抽样单位。各个抽样单位彼此不能交叉,所有这些抽样单位加总起来构成一个总体。抽样单位由抽样的组织形式决定,如果采用单纯随机抽样形式,抽样单位就是调查对象中的每个个体;如果采用分层抽样形式,抽样单位就是总体中的每个层;如果采用整群抽样形式,抽样单位就是总体中的每个群。 抽样框是组织抽样调查的重要依据,调查者必须对其抱有严谨的态度,认真地收集和编制。因为抽样框一旦有重复和遗漏,必然会直接影响到样本的选取,从而影响到整个抽样工作的质量。 抽样框根据其划分标准的不同,可以在不同层面上进行构建,从而使抽样框呈现不同等级,不同等级的抽样框可以用于各级抽样。 就目前的市场调查现场执行而言,有三种常用的抽样框:地图块、居委会块、居民户。 1.地图块 地图块是指在市场调查所涉及的行政区划范围内,将地图按一定标准划分为若干块,使各块具有相近的居民户数,每一块作为一个基本的抽样单位,各块的总和即为抽样框。地图块抽样框构建常用的方法有两种:一种是“行政区划法”,即以区、街道(镇)等作为基本抽样单位构建抽样框;另一种是“道路地块法”,即以道路、河流、铁路等明显的线状标志物为界限划定各个抽样单位。这种区划法的优点在于可以较合理地划定地图块的大小,如按该地图块内的人口密度确定地图块面积的大小等等,从而使各地图块内的居民户数达到基本相同,使样本单位之间具有可比性。据统计,在实际中采用道路地块法抽样时,由于拒访、行业限制、拆迁、界限不清等原因,约有1/3的居民户不能访问,故在实际确定每地块居民户数时,应考虑以上因素。 2.居委会块 居委会块是指以居委会所辖地域作为抽样的基本单位,其总体即构成抽样框。 3.居民户 居民户是指以某区域住户名单为抽样的基本单位,其总体即构成抽样框。这里所指的名单不一定是居住户的姓名,而有可能是居住户的门牌号、室号。这一形式的抽样框往往缺乏现成的资料,需要连续地进行资料积累和完善,并且不断地进行修订。

抽样调查基本概念

第四部分统计——第二十五章抽样调查 本章重点: 1.抽样调查基本概念(总体、样本、样本量、总体参数、样本统计量与抽样框),概率抽样和非概率抽样,抽样调查一般步骤,抽样调查中的误差来源(抽样误差、非抽样误差、抽样框误差、无回答误差、计量误差)等。 2.几种基本概率抽样方法:简单随机抽样、分层抽样、系统抽样、整群抽样和多阶段抽样。 3.估计量的性质(无偏性、有效性和一致性),样本量的影响因素。 知识点一、抽样调查基本概念 (一)抽样调查基本概念 1.总体:即调查对象的全体,调查总体必须是明确的而不能是模糊的。 【示例】:研究全国钢铁企业盈利状况,所有钢铁企业是总体。 样本:总体的一部分,它由从总体中按一定原则或程序抽出的部分个体所组成。 【示例】:选取了20家钢铁企业是样本。 样本量:样本中包含的入样单位的个数。 【示例】:20。 2.抽样框:供抽样所用的所有抽样单元的名单,是抽样总体的具体表现。 【示例】:工商局注册的20家企业。 3.总体参数:变量的数字特征,根据总体中所有单位的数值计算的。 【示例】:所有钢铁企业盈利总额,所有钢铁企业盈利均值。 4.样本统计量:根据样本中各单位的数值计算的,是对总体参数的估计,因此也称为估计量。 常用的样本统计量:样本均值,样本比例、样本方差等。 【示例】:20家企业盈利总额,20家企业盈利均值。 【例题·单选题】(2016年)北京市旅游管理部门要通过抽样调查了解2015年北京市常驻居民出境旅游总消费金额,该抽样调查的总体参数是2015年北京市()。 A.所有常住居民旅游总消费金额 B.被调查的常住居民出境旅游总消费金额 C.被调查的每一位常驻居民出境旅游消费金额 D.所有常住居民出境旅游总消费金额 『正确答案』D 『答案解析』本题考查抽样调查基本概念。总体参数是我们所关心变量的数字特征,它是根据总体中所有单位的数值计算的。 【例题·单选题】(2015年)在某市随机抽取2000家企业进行问卷调查,并据此调查有对外合作意向的企业,该抽样调查中的总体是()。 A.该市所有企业 B.该市有对外合作意向的企业 C.抽中的2000家企业 D.抽中的2000家企业中有对外合作意向的企业 『正确答案』A 『答案解析』本题考查抽样调查的基本概念。总体即调查对象的全体,要抽取2000家企业进行问卷调查,所以总体是该市所有企业。

谈谈几种典型的抽样方法

谈谈几种典型的抽样方法(案例) 摘要:本文以抽样方法为中心,主要阐述几种常见的抽样方法,如简单随机抽样,分层抽样,整群抽样,系统抽样以及配额抽样,探讨了各种抽样方法在实际生活的应用以 及各自的优缺点等。 关键词:抽样调查,应用,缺点。 导语:抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。显然,

抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。 抽样调查是建立在随机原则基础上,从总体中抽取部分单位进行调查,并概率估计原理,应用所的资料对总体的数量特征进行推断的一种调查方法。例如,从某地区全部职工当中随机抽取部分职工,以家庭为单位按月调查取得有关收入、支出等方面的资料,并依据这些资料推断出全区职工的收支情况,这就是一种抽样调查。从调查方法上来看,它是属于一种非全面调查。但又与一般调查不同,它不只停留于搜集资料和整理资料,而且还要对资料进行分析,并据以推断总体的数量特征,从而提高统计的认识能力。因此,抽样调查的理论和方法在统计中占有很重要的地位。 下面介绍一下常用的抽样方法: 一. 简单随机抽样 一般,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的个体被抽到的机会相等,就把这种抽样方法叫做简单随机抽样。 简单随机抽样的具体作法有:直接抽选法,抽签法,随机数法。 直接抽选法例如某项调查采用抽样调查的方法对某市职工收入状况进行研究,该市有职工56,000名,抽取5,000名职工进行调查,他们的年平均收入为10,000元,据此推断全市职工年收入为8,000--12,000元之间。 抽签法又称“抓阄法”。它是先将调查总体的每个单位编号,然后采用随机的方法任意抽取号码,直到抽足样本。在这里选取一个案例说明,如要在10个人中选取3个人作为代表,先把总体中的10个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取3次,就得到一个容量为3的样本。这就是抽签法,与直接抽样法类似。 另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算 当然,随机抽样也有不足之处,它只适用于总体单位数量有限的情况,否则

抽样调查的基本知识

附件6: 抽样调查的基本知识 一、抽样调查的概念 抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。 二、抽样调查的特点 抽样调查有以下三个突出特点:按随机原则抽选样本;总体中每一个单位都有一定的概率被抽中;可以用一定的概率来保证将误差控制在规定的范围之内。 三、抽样调查的几个主要常用的名词 (一)总体。总体是指所要研究对象的全体。它是根据一定研究目的而规定的所要调查对象的全体所作成的集合,组成总体的各研究对象称之为总体单位。 (二)样本。样本是总体的一部分,它是由从总体中按一定程序抽选出来的那部分总体单位所作成的集合。 (三)抽样框。抽样框是指用以代表总体,并从中抽选样本的一个框架,其具体表现形式主要有包括总体全部单位的名册、地图等。抽样框在抽样调查中处于基础地位,是抽样调查必不可少的部分,其对于推断总体具有相当大的影响。 (四)抽样误差。在抽样调查中,通常以样本作出估计值对总体的某个特征进行估计,当二者不一致时,就会产生误差。因为由样本作出的估计值是随着抽选的样本不同而变化,即使观察完全正确,它和总体指标之间也往往存在差异,这种差异纯粹是抽样引起的,故称之为抽样误差。

(五)偏差。所谓偏差,也称为偏误,通常是指在抽样调查中除抽样误差以外,由于各种原因而引起的一些偏差。 四、几种具体的抽样方式 (一)多阶段抽样 多阶段抽样,也称为多级抽样,是指在抽取样本时,分为两个及两个以上的阶段从总体中抽取样本的一种抽样方式。其具体操作过程是:第一阶段,将总体分为若干个一级抽样单位,从中抽选若干个一级抽样单位入样;第二阶段,将入样的每个一级单位分成若干个二级抽样单位,从入样的每个一级单位中各抽选若干个二级抽样单位入样……,依此类推,直到获得最终样本。 多阶段抽样的优点在于适用于抽样调查的面特别广,没有一个包括所有总体单位的抽样框,或总体范围太大,无法直接抽取样本等情况,可以相对节省调查费用。其主要缺点是抽样时较为麻烦,而且从样本对总体的估计比较复杂。 (二)等距抽样。 等距抽样也称为系统抽样、或机械抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。 按照样本单位抽选的方式,等距抽样可分为:随机起点等距抽样、半距起点等距抽样和对称等距抽样。 对称等距抽样。当抽取间隔k确定后,在第一组随机抽取第一个样本单位,假设该单位的顺序号为a,在第二组与第一个样本对称的位置抽取第二个样本单位,它的顺序号为2k-a。在第三组与第二组样本单位对称的位置抽取第三个样本单位,它的顺序号为2k+a,以后抽出的样本单位序号依次为(4k-a),(4k

抽样方法的几种分析

抽样方法的几种分析 1.抽样的基本方法 抽样方法基本上可分为随机抽样法和预定抽样法。 2.随机抽样法 这种抽样方法是以概率理论的原理为基础的,即基本整体中的每一个具体单元都有相同被抽中的机会(例如:掷骰子)。 ⑴简单随机抽样法 它直接从基本整体中抽出子样,前提条件是该整体至少能以标记形式来表示(例如:卡片),并可以混合至保证使每个单元都能有相同的被抽样的机会。简单随机抽样法简单易行,至于整体的某些特征及其分布情况不需要知道。但如果整体情况比较分散,彼此的差距比较大,则误差就可能较大。 所有的随机抽样方法都是以票箱模型为基础的(如抽彩票),即所有的票单(组成样本的单元)都标上号,装入票箱,封闭,然后抽票。一张票单在认定结果后再放回票箱,即整体数量保持不变。用这种方法来确定调查对象,就像用掷骰子来确定对象一样(整体数量不大时可以使用)。如果将抽样的票单放在一边可以避免出现重复。当

整体数量很大时,常采用下列方法代替票箱模式,因为在实际运用中它们的速度更快,也更完善。 ①乱数表抽样。例如用两只骰子掷数,可得下表所列数字:13、 45、65、36、22、24、31、43、61、52、55、16、23、14、25。每隔两位取一个数字,即可得到:65、24、61、16、25。从整体中抽出的这些数字就是所取得的子样。 ②尾数抽样(根据最后一个数字抽样)。将整体中的每一个单元都按顺序编上号,然后将例如 7、17、27、37等号抽出作为子样。 ③字母抽样。例如将整体中所有以“P”为姓名的第一个字母的人抽出来作为样本,但条件是必须在整体中所有姓的第一个字母均匀分布情况下得到“P”。 ⑵分层随机抽样法 分层随机抽样法是将混合着多种主要调查特征的综合性整体,分成不同类型的小组(层次),要求小组成员具有尽可能一致的特征,然后再从这些特征比较一致的小组(层次)中用相应的简单随机抽样法抽出所需的样本。例如:以一个国家为基本整体,各省份为小组。这种抽样方法特别适用于基本整体的特征表现为非均匀性(如:各省购买力不同),它能减少因采用简单随机抽样的方法而产生的偏差。分层方法有:①按比例的分层抽样。每一层中样本的比例同在基本整

抽样调查概述

第一章抽样调查概述 第一节抽样调查的意义和特点 抽样调查是现代统计调查中最常用的基本方法之一。 一、抽样调查的概念 关于抽样调查的定义大体上可以区分成广义和狭义两种,广义的抽样调查包括非概率抽样与概率抽样,狭义概念仅指概率抽样。 狭义的抽样调查是按照一定的程序和方法,从所要研究现象的总体中根据随机原则抽取一部分单位组成样本,通过对样本的调查,获得样本资料,计算出有关的样本指标(统计量),依一整套专门的方法据以对相应的总体指标(参数)作出估计和推算,并有效控制抽样误差的一种统计方法。 随机原则。①随机并非“随意”;②随机原则不等于等概率原则;③随机原则一般要求总体中每个单元均有一个非零的概率被抽中;④ 抽样概率对总体参数的估计有影响。 随机原则是抽样调查所必须遵循的基本原则。按随机原则抽样可以保证被抽中的单元在总体中均匀分布,不致出现系统性、倾向性偏差;在随机原则下,当抽样数目达到足够多时,样本就会遵从大数定律而呈正态分布,样本单位的标志值才具有代表性,其平均值才会接近总体平均值;按随机原则抽样,才可能实现计算和控制抽样误差的目的。 二、抽样调查的阶段划分与职业规范 由上述抽样调查的概念出发,我们可以将抽样调查工作的全过程 划分成三个不同的阶段 第一阶段为抽样设计阶段。

第二阶段为调查阶段。 第三阶段为数据处理和估计推断阶段。 在抽样调查中,首先,要注意尊重并保护被调查者的隐私权,调查结果只能用于综合分析,而不应给被调查者造成不必要的麻烦和伤害。其次,要诚实地分析调查资料,不能为得出某个事先期望的结论而随意地改动资料。第三,要做一个具有职业水平的工作者,做出来的东西既要有能让普通人看懂的主要信息,也要有能让专家看出其内涵的内容。第四,当从有些调查结果得不出好的结论时,应诚实地加以说明,而不应含糊其词。最后,抽样调查必须在国家法律法规所允许的范围内进行,不做违反社会公众利益的调查。 三、抽样调查的特点 首先,按随机原则抽选调查单位是抽样调查的一大特色。 其次,可以用样本资料推断总体资料是抽样调查的又一基本特征。 其三,抽样调查的速度快、周期短、精度高。 其四,在抽样推断之前可以计算和控制抽样误差。 其五,抽样技术灵活多样。 其六,抽样调查的应用十分广泛。 最后,同其他调查方式相比,抽样调查的技术性更强。 四、抽样调查的作用 抽样调查所依据的概率原理属于数理统计学的一个重要分支,也是现代统计学的基础。抽样的方法不仅对统计推断、统计检验以及统计决策等理论的发展产生了直接的影响,而且还构成了其他应用性学科如计量经济学、

几种抽样调查方法比较

几种抽样调查方法比较 数理统计是用概率论的思想,方法去解决实际问题.在实际问题中出现的总的研究对象,我们称为总体,其分布一般是未知的,所以,首先要对总体进行抽样,以获取总体的有关信息——样本,再利用这些信息对总体进行分析.对于如何选取样本这个问题,经过人们不断的尝试、试验,渐渐地就有了“抽样论”,“试验设计”的发展.1895年,Kiaer在国际统计学(ISI)最早提出了“代表性抽样”的概念,后来经过Neyman、Hansen和Mahalanobis等人的杰出贡献,抽样调查理论与方法在过去的一百年间,已经取得了很大发展.从概率抽样方法的发展和完善到收集信息与控制误差方面日益复杂的方法的应用,抽样调查已经取得了很大的进步.特别是近几十年来,在实践中实施的大型调查所涌现出的关于抽样设计和数据分析的难题,更是推动了理论研究的发展. 在现实生活中,有很多实际问题将会用到数理统计的知识,它会有效地帮助我们分析和论证,从而得到我们需要的信息.为了更加有效地应用这些知识,就需要在总体中选取一个最合适的样本来为我们服务.从这个方面来说,样本的选取方法就成了一个至关重要的问题.只有找一个最简洁又具有代表性的样本,才能获得隐藏在数据背后的真相. 本文主要介绍抽样调查理论,以及抽样调查的几种方法,并通过举例子介绍对比这几种方法.最后,本文又对抽样调查的这几种方法做了简单的总结和比较,显示了抽样调查理论在我们的生活中无处不在的强大生命力. 一、基本概念 1.抽样调查.它是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法. 2.总体与样本.总体是我们所研究(调查)的对象的全体.例如在全国儿童情况调查中,全国所有0—14岁的儿童就构成调查的总体.调查的目的是为了得到有关这个总体的某些数据.例如全国儿童总数、每个年龄男女儿童的平均身高和平均体重等.这些有关总体的指标就是调查的目标量.如果进行一次对全国儿童的普查,对每个儿童都进行有关指标的调查,就可以获得这些总体目标量的数据,当然这实际上是很难做到的,为此我们按某种方法只从总体中抽取一部分进行调查,这一部分儿童就构成样本.根据这些样本数据就可以对总体目标量进行估计. 3.概率抽样.抽取样本是抽样调查中的一个重要方法.最常用且最科学的方法是进行概率抽样,也称随机抽样.其优点是能保证样本的代表性,避免人为的误差,而且它可以对抽样误差进行估计,从而可以获得估计的精度.为了抽样便利,使概率抽样能够实施,通常将总体划分成互不重叠且又穷尽的若干个部分,每个部分称为一个抽样单元. 4.误差与精度.抽样调查中有两类误差,一类是由于调查中获得的原始数据不正确,抽样框有缺陷,或在调查中由于种种原因无法得到按方案的全部样本数据等等,这类误差统称为非抽样误差;另一类误差是由于抽样引起的,即用样本估计总体所产生的误差,称为抽样误差.抽样误差通常用估计量的均方误差、标准差(或方差)等来表示.抽样误差越小,调查的精度就越高,精度的另一种表示方法是给出总体目标量的置信区间,即以一定的置信度(也用概率表示,例如95%)表示总体目标量落在一定的范围内.在相同的置信度下,置信区间长度愈短,精度就愈高.

常用的抽样方法总结

常用的抽样方法总结 1.非概率抽样(Non-probability sampling) 又称非随机抽样,指根据一定主观标准抽取样本,令总体中每个个体的被抽取不是依据其本身的机会,而是完全决定于调研者的意愿。 其特点为不具有从样本推断总体的功能,但能反映某类群体的特征,是一种快速、简易且节省的数据收集方法。当研究者对总体具有较好的了解时可以采用此方法,或是总体过于庞大、复杂,采用概率方法有困难时,可以采用非概率抽样来避免概率抽样中容易抽到实际无法实施或“差”的样本,从而避免影响对总体的代表度。 常用的非概率抽样方法有以下四类: 方便抽样(Convenience sampling) 指根据调查者的方便选取的样本,以无目标、随意的方式进行。例如:街头拦截访问(看到谁就访问谁);个别入户项目谁开门就访问谁。 优点: 适用于总体中每个个体都是“同质”的,最方便、最省钱;可以在探索性研究中使用,另外还可用于小组座谈会、预测问卷等方面的样本选取工作。 缺点: 抽样偏差较大,不适用于要做总体推断的任何民意项目,对描述性或因果性研究最好不要采用方便抽样。 判断抽样(Judgment sampling) 指由专家判断而有目的地抽取他认为“有代表性的样本”。例如:社会学家研究某国家的一般家庭情况时,常以专家判断方法挑选“中型城镇”进行;也有家庭研究专家选取某类家庭进行研究,如选三口之家(子女正在上学的);在探索性研究中,如抽取深度访问的样本时,可以使用这种方法。 优点: 适用于总体的构成单位极不相同而样本数很小,同时设计调查者对总体的有关特征具有相当的了解(明白研究的具体指向)的情况下,适合特殊类型的研究(如产品口味测试等);操作成本低,方便快捷,在商业性调研中较多用。 缺点: 该类抽样结果受研究人员的倾向性影响大,一旦主观判断偏差,则根易引起抽样偏差;不能直接对研究总体进行推断。 配额抽样(Quota sampling) 指先将总体元素按某些控制的指标或特性分类,然后按方便抽样或判断抽样选取样本元素。 相当于包括两个阶段的加限制的判断抽样。在第一阶段需要确定总体中的特性分布(控制特征),通常,样本中具备这些控制特征的元素的比例与总体中有这些特征的元素的比例是相同的,通过第一步的配额,保证了在这些特征上样本的组成与总体的组成是一致的。在第二阶段,按照配额来控制样本的抽取工作,要求所选出的元素要适合所控制的特性。例如:定点街访中的配额抽样。 优点: 适用于设计调查者对总体的有关特征具有一定的了解而样本数较多的情况下,实际上,配额抽样属于先“分层”(事先确定每层的样本量)再“判断”(在每层中以判断抽样的方法选取抽样个体);费用不高,易于实施,能满足总体比例的要求。 缺点: 容易掩盖不可忽略的偏差。 滚雪球抽样(Snowball sampling)

抽样调查基本原理

第二章抽样调查基本原理 第一节有关基本概念 一、总体 总体也叫母体,它是所要认识对象的全体,是具有同一性质的许多单位的集合。组成总体的每个个体叫做单位。 总体可以是有限的,也可以是无限的。如果总体中所包含个体的数目为有限多个,则该总体就是有限总体,反之是无限总体。总体也可区分成计量总体(由测量值组成的)和计数总体(由品质特征组成的)。 在抽样以前,必须根据实际情况把总体划分成若干个互不重叠并且能组合成总体的部分,每个部分称为一个抽样单元,不论总体是否有限,总体中的抽样单元数一定是有限的,而且是已知的,因此说抽样调查的总体总是有限的。抽样单元又有大小之分,一个大的抽样单元可以分成若干个小的抽样单元,最小的抽样单元就是每一个个体。如一项全国性的调查,如果把省作为一级单元,则可以把县作为二级单元,乡作为三级单元,村作为四级单元等等。又如在流动人口抽样中,可以以居委会作为抽样单元,而在家计调查中,则以户为抽样单元。 总体应具备同质性、大量性和差异性的特征。在抽样调查中,通常将反映总体数量特征的综合指标称为总体参数。常见的总体参数主要有: 1.总体总和Y:例如全国人口数。 Y=∑y i=y1+y2+…+y N 2.总体均值Y:例如职工平均工资。 Y=Y/N=∑y i /N 3.总体比率R:是总体中两个不同指标的总和或均值的比值。如总收入与总支出之比。 R=Y/X=Y/X 4.总体比例P:是总体中具有某种特性的单元数目所占比重。如产品的合格率。 二、样本 样本是由从总体中所抽选出来的若干个抽样单元组成的集合体。抽样前,样本是一个n 维随机变量,属样本空间;抽样后,样本是一个n元数组,是样本空间的一个点。 样本是总体的缩影,是总体的代表。抽样的效果好不好,依赖于样本对总体是否有充分的代表性。样本的代表性愈强,用样本指标对总体全面特征的推断就愈精确,即推断的误差就愈小;反之,如果样本的代表性愈弱,推断的误差就愈大,推断结果就愈不可靠。 如何增强样本的代表性,使其能达到估计或推断的预期效果,就必须分析影响样本代表性的因素,以便加强控制。一般情况下,影响样本代表性的因素有以下几个方面: (1)总体标志值分布的离散程度。若总体标志值的分布很集中,即平均离散程度(标准差)很小,从中任抽部分单元做样本,样本特征很近似于总体特征,样本的代表性就强;反之,如果标志值的分布很分散,即平均离散程度很大,从中抽取样本单元的随机波动也很大,必将影响样本的代表性。 (2)抽样单元数的多少(或称样本容量的大小)。抽样单元数的多少,影响样本对总体的代表性。一般说来,样本容量以大为好,但要根据实际情况,以掌握适度为宜,要在保证一定可靠程度的情况下,尽可能满足及时性和经济性的要求,取得好的效益。 (3)抽样方法。抽样方法一般分为放回抽样和不放回抽样。放回抽样也叫重置抽样,或

相关文档