文档视界 最新最全的文档下载
当前位置:文档视界 › 统计数据的搜集与整理

统计数据的搜集与整理

统计数据的搜集与整理
统计数据的搜集与整理

第二章统计数据的搜集与整理

一、教学目的与要求

通过本章的学习,了解统计数据的计量尺度和数据的类型,了解绝对数和相对数的意义及比例和比率的计算方法;了解各种统计调查方式的特点和适用场合;掌握统计调查方案设计的内容,了解数据预处理的意义;掌握统计数据的分组方法,能够对原始数据进行适当的分组并编制频数分布表,绘制频数分布的直方图和茎叶图。

二、教学重点

1、统计调查方案设计

2、统计数据的分组

3、变量数列的编制

三、教学难点

1、抽样调查、重点调查与典型调查的比较

2、调查方案的设计

3、次数分布的概念

4、变量数列的基本术语及编制

四、教学基本内容

第一节数据的计量与类型

一、数据的计量尺度

(一)定类尺度

按事物的某种属性对其进行平行的分类或分组。(只能测度事物之间的类别差,其他差别无法得知)例:按照性别将人口分为男、女两类。

(二)定序尺度

又称顺序尺度,是对事物之间等级差别和顺序差别的一种测度。它不仅可以测度类别差,还可以测度次序差。(不能测量类别之间的准确差值,只能比较大小,不能进行加、减、乘、除数学运算)例:考试成绩可分为优、良、中、及格、不及格。

(三)定距尺度

又称间隔尺度,是对事物类别或次序之间距离的测度。该尺度通常使用自然或物理单位作为计量尺度。例:考试成绩80分与90分之间相差10分。定距数据可以进行加、减运算,不能进行乘、除运算。其原因为定距尺度中没有绝对零点(定距尺度中的“0”表示水平,不表示没有)。

(四)定比尺度

又称比率尺度,由于定比尺度有绝对零点(定比尺度中的“0”表示没有,不存在)。因此,不仅可以加减运算,还可以乘除运算。例如,甲工资为600元,乙工资为1200元,则乙的工资为甲的2倍。二、数据的类型

统计数据大体上分为两种类型:定性的数据和定量的数据。

定性数据也称品质数据,它说明的是事物的品质特征,是不能用数值表示的,这类数据由定类尺度和定序尺度计量形成。

定量数据也称数量数据,它说明的是事物的数量特征,是能够用数值表示的,这类数据由定距尺度和定比尺度计量形成。

说明现象某种特征的概念称为变量,变量的具体表现称为变量值。变量可分为连续型变量和离散型变量。离散变量只能取有限个数,而且其取值都以整位数断开,如企业个数、职工人数等;连续变量可以取无穷个数值,其取值是连续不断的,不能一一列举,如零件尺寸、年龄、温度等。

三、统计数据的表现形式

数量型统计数据通常有两种基本的表现形式,即绝对数与相对数。

(一)总量指标(绝对数)

1、概念:反映客观现象总规模、总水平的指标。

2、种类

按反映现象总体内容的不同,可分为:

总体单位总量:反映总体所有单位总数的指标。

总体标志总量:反映总体中各单位标志值总和的指标。

按指标反映的时间状况不同

时期指标:反映现象在一段时期发展变化的总量指标。

时点指标:反映现象在某个时点所达总量的指标。

(二)相对指标

1、概念:两个相互联系的指标数值对比的比值(相对水平)

2、作用:用一个抽象化了的数值来反映两个有联系的事物之间的数量关系

3、种类

计划完成程度相对数、结构相对数、比例相对数、比较相对数、强度相对数、动态相对数

第二节统计数据的搜集

一、统计数据的直接来源

直接来源:专门组织的调查、科学试验;

(一)统计调查方式

1、普查

专门组织的一次性的全面调查。

特点:(1)、一次性调查;

(2)、全面性调查;

(3)、是有关国情、国力的调查。

标准时点:对调查对象登记时所依据的统一时点。

标准时点的作用:

(1)、避免调查数据的重复或遗漏,确保数据的准确性。

(2)、反映现象在该时点上的状况。

普查的组织方式

(1)、通过专门组织的普查机构进行。如人口普查

(2)、利用企事业单位日常核算资料和报表资料进行。如物资库存普查、快速普查等

2、抽样调查

从调查总体中按随机原则抽取部分单位进行调查,并根据其结果推断总体数量特征。

特点:(1)、根据样本资料推断总体数量特征;

(2)、按随机原则抽取调查单位;

(3)、抽样误差可以计算和控制。

3、重点调查

从调查对象中选择一部分重点单位进行调查。重点单位是指调查的标志值在总体标志总量中占有绝大比重的单位。

特点:(1)、调查目的是了解总体的基本情况;

(2)、重点单位的重点位置是客观存在的;

(3)、不可推断总体数量特征。

4、典型调查

在对调查对象初步分析的基础上,选择几个有代表性的单位进行深入细致的调查。

特点:(1)、是深入细致的调查;

(2)、典型单位的选择带有明显的主观因素;

(3)、可以据以估算总体数值,但不能计算和控制调查误差。

5、统计报表制度自上而下布置任务,自下而上上报资料的统计制度或调查方法。

(二)数据的搜集方法

1、访问调查

2、邮寄调查

3、电话调查

4、座谈会

5、个别深度访问

(三)调查方案设计

1、确定调查目的(Why)

2、确定调查对象与调查单位(Who)

调查对象:被研究现象的总体(即调查范围)。

调查单位:需要对它的标志进行登记的总体单位填报单位:填写、上报统计资料的单位。

注:调查单位与填报单位有时一致,有时不一致。

3、确定调查项目和调查表(What)

调查项目:调查时应进行登记的标志。

调查表:具体可区分为单一表与一览表。单一表:一个调查单位用一张表;一览表:多个调查单位共一张表。

4、确定调查时间(When)

调查时间:资料所属时间(一段时期、某个时点)。

时期现象:资料所反映的起止时间。

时点现象:调查规定的时点。

调查期限:调查工作进行的起止时间。

5、组织实施计划(How)

二、统计数据的间接来源

第二手数据:主要有公开出版或公开报道的数据。

第三节统计数据的整理

统计整理的概念:根据研究的目的和要求,对调查资料进行科学的加工处理,使之条理化、系统化,以反映总体特征的工作过程。

一、数据的预处理

(一)数据的审核与筛选

准确性审核(包括逻辑检查和计算检查)

及时性审核(是否按时交统计数据)

完整性审核(调查单位是否全包括?调查项目是否都回答?)

(二)数据的排序

二、数据分组与频数分布

(一)统计分组

1、统计分组的概念和作用

概念:将总体按照一定的分组标志区分为若干个性质不同的组成部分的一种统计方法。

作用:(1)、划分现象的不同类型;

(2)、揭示现象的内部结构;

(3)、分析现象之间的依存关系。

2、统计分组的原则和关键

原则:保持组内的同质性与组与组之间的差异性

关键:选择分组标志和划分各组界限(二)、次数分布的概念及类型

1、概念

次数:分布在各组的单位数

频率:各组次数与总次数的比重

次数分布:反映总体单位数在各组间的分布(表、图)。

次数分布作用:显示现象的分布规律和分布特征。

2、类型

属性分布数列:按品质标志分组所形成的分布数列。体现现象质上的差别且较稳定。

变量分布数列:按数量标志分组所形成的分布数列。体现现象量上的差别且有多种编制方法。

变量数列的构成:(1)变量及变量值;(2)次数或频率。

3、变量数列的编制

组限:一组的数量界限。组限的确定原则:确保组内的同质

性,组间的差异性。

组距=本组上限-本组下限

组数=全距/组距

组中值=(上限十下限)/2

开口组首组组中值=上限一邻组组距/2

开口组末组组中值=下限+邻组组距/2次数密度=本组次数/本组组距对连续型变量,只可编制组距数列,且相邻的组限必须重叠。

记住:“上组限不在内”

对离散型变量,可编制单项数列和组距数列。编制组距数列时采用不重叠组限

依据:遵循不重复、不遗漏的原则。三、次数分布的图示和类型

(一)直方图和折线图

(1)直方图

横轴:表示变量;

纵轴:表示次数。

(2)折线图:将组中值用折线连接而成。

(二)茎叶图

茎叶图可用于展示原始数据的分布,同时还保留原始数据在图形里面,相当直观。从茎叶图中,可直接看出数据是否对称、是否有极端值以及数据的集中趋势和离中趋势。

茎叶图由“茎”和“叶”两部分构成,其图形由数字组成。绘制茎叶图的关键是设计好树茎,通常是以该组数据的高位数值作为树茎。树茎一经确定,树叶就自然地长在相应的树茎上了。

第三章数据分布特征的描述

一、教学目的与要求

通过本章的学习,要求学生熟练掌握数据分布特征的各种描述方法;掌握不同测度方法的特点、应用条件及应用场合;能利用所学的方法对统计数据作各种统计描述。

二、教学重点

1、集中趋势测度的方法及应用场合

2、离散程度测度的方法及应用场合

3、分布偏态与峰度的测度

三、教学难点

1、集中趋势测度的方法及应用场合

2、离散程度测度的方法及应用场合

四、教学基本内容

第一节分布集中趋势的测度

集中趋势是指一组数据向分布的中心集中的现象。数据分布集中趋势的测度指标又称平均指标。

一、众数

众数是指总体中出现次数最多的标志值。一般只有在总体单位比较多,且存在明显集中趋势的数列中才存在众数。众数是根据标志值在数列中所处的位置来计算的,不受极端值影响。在实际工作中,可以利用众数来表明现象的一般水平。例如,某农贸市场某种蔬菜的单价有1.00、1.20、1.50、2.00元不等,在了解这种蔬菜的平均价格时,不需登记这种蔬菜所有的成交量和成交额来加以平均计算,只要掌握这种蔬菜成交量最大的价格就可以了。

(一)、由单项数列确定众数

在单项数列中,出现次数最多的标志值就是众数。

(二)、由组距数列确定众数

下限公式:

上限公式:

二、中位数

把总体各单位标志值按大小顺序排列起来,处于中点位置的标志值就是中位数。中位数不受极端值影响,当一个总体的大部分总体单位的标志值比较集中时,以中位数为代表值,比算术平均数还能更确切地反映次数分配的集中趋势。

(一)、根据未分组资料确定中位数

当总体单位数为奇数时,处于中间位置上的那个标志值就是中位数;如果总体单位数为偶数,中位数则是位于中间位置的两个标志值的算术平均数。

(二)根据分组资料确定中位数

1、由单项数列确定中位数。

第—步,根据中位数位置公式确定中位数所在组;

第二步:中位数所在组的标志值,就是中位数。

2、由组距数列确定中位数。

第一步:根据中位数位置公式确定中位数所在组;

第二步:在假定中位数所在组的次数是均匀分布的前提下,利用比例插值法推算中位数的近似值。

下限公式:

上限公式:

三、均值(算术平均数)

(一)、简单算术平均数(适用于未分组资料):

(二)、加权算术平均数(适用于分组资料):

次数之所以具有权数的作用,是因为各组的次数不相等。如果各组次数相同,那它对各组标志值来说,就失去了权衡轻重的作用。

用绝对数权数与用相对数权数计算的结果一致。

(三)、算术平均数的数学性质

1、各个变量值与其算术平均数离差之和等于零。

2、各变量值与其算术平均数的离差平方和为最小值。

四、几何平均数

几何平均数是N个变量值乘积的N次方根。

(一)、简单几何平均数

当各变量值的次数不相同时,采用简单几何平均数。

(二)加权几何平均数

当各变量值的次数不相同时,采用加权几何平均数。

用同一资料计算算术平均数、调和平均数和几何平均数的结果是:H≤G≤。

五、集中趋势测定指标的比较

(一)、各种数值平均数的比较

1、适用场合不同。在计算总体单位标志值的平均数时,若总体标志总量等于总体各单位标志值之和,可采用算术平均数或调和平均数计算;若总体标志总量等于总体各单位标志值之积,则应采用几何平均数计算。

2、某些数值平均数对于被平均变量的取值有着特殊的限制。例如,当被平均变量出现一个零值时,几何平均数为零,调和平均数无法计算。当被平均变量出现一个负值时,几何平均数失去意义。

(二)、中位数、众数和算术平均数的关系

当现象呈对称的钟形分布时,中位数、众数和算术平均数三者处于同一位置上,即。在适度正偏情形下,有;在适度负偏情形下,有,中位数始终位于算术平均数和众数之间。

在钟型分布只存在适度或轻微偏斜的情形下,中位数一般介于众数与算术平均数之间;并且,中位数与算术平均数的距离,大约只是中位数与众数之距离的一半。即

第二节分布离散程度的测度

集中趋势只是数据分布的一个特征,它把总体各单位标志值之间的数量差异抽象化了,所反映的是各变量值向其中心聚集的程度。数据的离散程度是数据分布的另一个重要特征,它所反映的是各变量值远离中心的程度,也称为离中趋势。应从集中趋势和离散趋势两个方面来反映总体标志值的分布特征。

一、全距

全距=最大标志值—最小标志值

全距是两个极端值之间的距离,表明了总体各单位标志值变动的最大范围。全距愈小,说明总体各单位标志值越集中;全距愈大,说明总体各单位标志值越分散。

全距是只受极端值的影响,没有考虑中间标志值的变异情况。

二、标准差和方差

标准差是总体各单位标志值与其算术平均数离差平方的算术平均数的平方根。标准差的平方叫方差。标准差和方差愈大,表明总体各单位标志变异程度愈大;标准差和方差愈小,表明总体各单位标志变异程度愈小。标准差和方差具有平均差综合反映总体各单位标志值差异程度的优点,且避免了取绝对值所引起的不便于进行代数处理的缺陷。

(一)、资料未分组时,采用简单标准差和简单方差公式计算。其计算公式为:

(二)、资料已分组时,则采用加权标准差和加权方差公式计算,其计算公式为:

三、标志变异系数

为了对比分析不同性质、不同水平的总体之间的标志变异程度,需要计算标志变异系数,以消除不同总体之间在平均水平、计量单位等方面的不可比因素。

标志变异系数是标志变异指标与其算术平均数之比的相对变异指标。常用的标志变异系数有标准差系数。

第三节分布偏态与峰度的测度

相对于集中趋势和离散程度而言,偏度和峰度主要不是从各单位标志水平的角度考察分布的代表值或变异程度,它们所刻划的是“分布的形态特征”。

一、偏态及其测度

分布的“偏度”是指分布不对称的方向和程度。偏态系数是对分布偏斜程度的测度。

当=0时,总体分布为对称分布;

当>0时,总体分布为正偏(右偏)分布;

当<0时,总体分布为负偏(左偏)分布;

二、峰度及其测度

“峰度”是指次数分布曲线的尖峭程度或峰凸程度。

次数分布曲线的峰度大致可以分为三类:A为正态峰度,它是标准正态分布曲线的峰度;B为尖顶峰度,它与正态峰度相比,分布曲线凸起部分的顶端比正态分布曲线的顶端显得更陡峭,形成尖顶;C为平顶峰度,它与正态峰度相比,分布曲线凸起部分的顶端比正态分布曲线的顶端显得更为平坦,形成平顶。

当时,次数分布曲线为正态曲线;当时,为尖顶曲线,的值越大,次数分布曲线的顶端越尖;当时,为平顶曲线;当接近于1.8时,次数分布趋向一条水平线,即各组包括的次数相同,为矩形分布;当的值小于1.8时,为U形分布。

第四节统计表与统计图

一、统计表

(一)、统计表的结构

从外表形式看,由四部分构成:

1、总标题:表的名称,包括:时间、空间、总体、指标;

2、横行标题:反映总体及其分组的名称;

3、纵栏标题:统计指标名称;

4、指标数值:列在横行与纵栏的交叉处。

从统计表的内容来看

1、主词:统计表所要说明的内容;

2、宾词:统计指标及其数值。

(二)、统计表的种类

按用途分,可分为调查表、整理表、分析表

按主词的分组情况分,可分为:

1、简单表:对主词(总体)未经任何分组的表。

2、分组表:对主词进行简单分组后所形成的表。

3、复合表:对主词进行复合分组后所形成的表。

统计学第二章 统计数据的收集、整理与显示试题及答案

第二章统计数据的收集、整理与显示 二、单项选择题 1、人口普查的调查单位是(C )。 A、每一户 B、所有的户 C、每一个人 D、所有的人 2、对一批商品进行质量检验,最适宜采用的调查方法是(B )。 A、全面调查 B、抽样调查 C、典型调查 D、重点调查 3、下列调查中,调查单位与填报单位一致的是(D )。 A、企业设备调查 B、人口普查 C、农村耕畜调查 D、工业企业生产经营现状调查 4、抽样调查与重点调查的主要区别是(D )。 A、作用不同 B、组织方式不同 C、灵活程度不同 D、选取调查单位的方法不同 5、先对总体中的个体按主要标志加以分类,再以随机原则从各类中抽取一定的单位进行调查,这种抽样调查形式属于( D )。 A、简单随机抽样 B、等距抽样 C、整群抽样 D、类型抽样 6、对某省饮食业从业人员的健康状况进行调查,调查单位是该省饮食业的(D )。 A、全部网点 B、每个网点 C、所有从业人员 D、每个从业人员 7、调查时限是指(B )。 A、调查资料所属的时间 B、进行调查工作的期限 C、调查工作登记的时间 D、调查资料的报送时间 8、对某市全部商业企业职工的生活状况进行调查,调查对象是(B )。 A、该市全部商业企业 B、该市全部商业企业的职工 C、该市每一个商业企业 D、该市商业企业的每一名职工 9、作为一个调查单位(D )。 A、只能调查一个统计标志 B、只能调查一个统计指标 C、可以调查多个统计指标 D、可以调查多个统计标志 10、某市规定2018年工业经济活动成果年报呈报时间是2019年1月31日,则调查期限为( B )。 A、一天 B、一个月 C、一年 D、一年零一个月 11、统计分组对总体而言是( B ) A、将总体区分为性质相同的若干部分 B、将总体区分为性质不同的若干部分 C、将总体单位区分为性质相同的若干部分 D、将总体单位区分为性质不相同的若干部分 12、按某一标志分组的结果表现为( B )

第二章统计数据的搜集与整理

第二章统计数据的搜集与整理 一、教学目的与要求 通过本章的学习,了解统计数据的计量尺度和数据的类型,了解绝对数和相对数的意义及比例和比率的计算方法;了解各种统计调查方式的特点和适用场合;掌握统计调查方案设计的内容,了解数据预处理的意义;掌握统计数据的分组方法,能够对原始数据进行适当的分组并编制频数分布表,绘制频数分布的直方图和茎叶图。 二、教学重点 1、统计调查方案设计 2、统计数据的分组 3、变量数列的编制 三、教学难点 1、抽样调查、重点调查与典型调查的比较 2、调查方案的设计 3、次数分布的概念 4、变量数列的基本术语及编制 四、教学基本内容 第一节数据的计量与类型 一、数据的计量尺度 (一)定类尺度 按事物的某种属性对其进行平行的分类或分组。(只能测度事物之间的类别差,其他差别无法得知)例:按照性别将人口分为男、女两类。 (二)定序尺度 又称顺序尺度,是对事物之间等级差别和顺序差别的一种测度。它不仅可以测度类别差,还可以测度次序差。(不能测量类别之间的准确差值,只能比较大小,不能进行加、减、乘、除数学运算)例:考试成绩可分为优、良、中、及格、不及格。 (三)定距尺度 又称间隔尺度,是对事物类别或次序之间距离的测度。该尺度通常使用自然或物理单位作为计量尺度。例:考试成绩80分与90分之间相差10分。定距数据可以进行加、减运算,不能进行乘、除运算。其原因为定距尺度中没有绝对零点(定距尺度中的“0”表示水平,不表示没有)。 (四)定比尺度 又称比率尺度,由于定比尺度有绝对零点(定比尺度中的“0”表示没有,不存在)。因此,不仅可以加减运算,还可以乘除运算。例如,甲工资为600元,乙工资为1200元,则乙的工资为甲的2倍。二、数据的类型 统计数据大体上分为两种类型:定性的数据和定量的数据。 定性数据也称品质数据,它说明的是事物的品质特征,是不能用数值表示的,这类数据由定类尺度和定序尺度计量形成。 定量数据也称数量数据,它说明的是事物的数量特征,是能够用数值表示的,这类数据由定距尺度和定比尺度计量形成。 说明现象某种特征的概念称为变量,变量的具体表现称为变量值。变量可分为连续型变量和离散型变量。离散变量只能取有限个数,而且其取值都以整位数断开,如企业个数、职工人数等;连续变量可以取无穷个数值,其取值是连续不断的,不能一一列举,如零件尺寸、年龄、温度等。 三、统计数据的表现形式 数量型统计数据通常有两种基本的表现形式,即绝对数与相对数。 (一)总量指标(绝对数) 1、概念:反映客观现象总规模、总水平的指标。 2、种类 按反映现象总体内容的不同,可分为: 总体单位总量:反映总体所有单位总数的指标。 总体标志总量:反映总体中各单位标志值总和的指标。 按指标反映的时间状况不同 时期指标:反映现象在一段时期发展变化的总量指标。 时点指标:反映现象在某个时点所达总量的指标。 (二)相对指标 1、概念:两个相互联系的指标数值对比的比值(相对水平) 2、作用:用一个抽象化了的数值来反映两个有联系的事物之间的数量关系 3、种类 计划完成程度相对数、结构相对数、比例相对数、比较相对数、强度相对数、动态相对数 第二节统计数据的搜集

第二章数据收集、整理与显示

第二章数据搜集、整理与显示 Ⅰ.学习目的 本章阐述统计数据搜集、整理与显示的理论与方法,通过学习,要求: 1.了解统计数据的类型及其搜集方法; 2.了解普查、统计报表、抽样调查、重点调查等各种统计调查组织形式的特点及其适用场合; 3.掌握统计分组方法;4能够编制分布数列;5.能够运用各种统计图表。 Ⅱ.课程内容要点 第一节数据的搜集 一、数据搜集 数据是人们对现象进行调查研究所搜集、整理、分析和解释的事实和数字,是对客观现象进行计量的结果。 数据搜集就是根据统计研究预定的目的和任务,运用相应的科学的调查方法与手段,有计划、有组织地搜集资料的过程。 数据的计量尺度有四种 定类尺度是按照某种属性对客观事物进行平行分类或分组的一种测度,定类尺度的值是以文字表述的,可以用数值标识,但仅起标签作用。 定序尺度是把各类事物按一定特征的大小、高低、强弱等顺序排列起来,构成定序数据。它是对事物之间等级或顺序差别的一种测度。定序尺度不仅可以测度类别差,还可以测度次序差,并可比较大小,但其序号仍不能进行加减乘除计算。 定距尺度是对事物类别或次序之间间距进行的一种测度。定距尺度不仅

能区分事物的类别、进行排序、比较大小,而且可以精确地计量大小的差异,可以进行加减运算,没有绝对零点。 定比尺度是对事物之间比值的一种测度,定比尺度能区分类别、排序、比较大小、求出大小差异、可采用加减乘除运算,具有绝对零点。 从不同方面数据划分为不同类型。 根据数据反映的现象的特征不同,可以归结为两类:品质数据(亦称定性数据)和数量数据(亦称定量数据)。品质数据是由定距尺度和定比尺度计量所形成的数据,数量数据是由定距尺度和定比尺度计量所形成的数据。 根据数据反映的现象的时间不同,可以将数据分为横截面数据和时间序列数据。横截面数据是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。时间序列数据是指在不同时间对同一总体的数量表现进行观察而获得的数据。 根据数据的搜集方法,可以将数据分为观察数据和实验数据。 根据数据的来源渠道,可以将数据分为直接数据和间接数据。 二、数据搜集的方法 数据搜集的方法有直接观察法、报告法(通讯法)、采访法、登记法和实验设计调查法。 三、统计调查的形式 普查是一种非经常性的全面调查,通过普查可以掌握大量、详细、全面的资料。 统计报表制度是依照国家有关法规自上而下地统一布置,按照统一的表式、统一的项目、统一的报送时间和程序,自下而上地逐级地定期地提供统计资料的一种调查方式。 抽样调查是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据所获得的样本数据,对调查对象总体特征作出科学推断。 重点调查是在调查对象中,只选择一部分重点单位进行的非全面调查。重点调查的前提是必须存在重点单位。 典型调查是从众多的调查研究对象中,有意识地选择若干个具有代表性的典型单位进行深入、周密、系统地调查研究。典型调查有解剖麻雀型和划类选典型两种类型。

第二章 统计数据的搜集习题

第二章统计数据的搜集 练习题 一、填空题 1.常用的统计调查方式主要有、、、、等。 2.典型调查有两类:一是;二是。 3.统计调查按调查对象包括的范围不同可分为、。 4.确定调查对象时,还必须确定两种单位,即和。 5.重点调查是在调查对象中选择一部分进行调查的一种调查。 6.询问调查具体包括、、、、、等。 7.访问调查的方式有、。 8.邮寄调查的问卷发放方式有、、三种。 9.根据观察者是否使用科学的观察仪器,观察可分为和。 10.调查表一般由、和三部分组成。 11.就一般的统计数据而言,其质量评价标准为、、、、、。 二、单项选择题 1.某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量的80%的五个大型水泥厂的生产情况进行调查,这种调查方式是( )。 A普查B典型调查C抽样调查D重点调查 2.某灯泡厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应选择( )。 A统计报表B重点调查C全面调查D抽样调查 3.人口普查规定统一的标准时间是为了( )。 A避免登记的重复与遗漏B确定调查的范围C确定调查的单位D登记的方便 4.以下哪种场合宜采用标准式访问( )。 A居民入户调查B座谈会C当事人或知情者个别采访D观察法 5.某地进行国有商业企业经营情况调查,则调查对象是( )。 A该地所有商业企业B该地所有国有商业企业 C该地每一国有商业企业D该地每一商业企业 6.以下哪种调查的报告单位与调查单位是一致的( )。 A 工业普查B工业设备调查C职工调查D未安装设备调查 7.统计调查所搜集的可以是原始资料,也可以是次级资料,原始资料与次级资料的关系是( )。 A原始资料来源于基层单位,次级资料来源于上级单位 B次级资料是由原始资料加工整理而成 C原始资料与次级资料之间无必然联系 D原始资料与次级资料没有区别 8.调查项目通常以表的形式表示,称作调查表,一般可分为( )。 A单一表和复合表B单一表和一览表

统计数据的整理和显示习题

第三章统计数据的整理和显示习题 一、填空题 1.统计数据分组的关键在于。 2.一般说来,统计分组具有三方面的作用:(1) ;(2);(3)。 3.根据分组标志的不同,统计分组可以有分组和分组。 4.按每个变量值分别列组所编制的变量分布数列叫,其组数等于。 5.在组距式数列中,表示各组界限的变量值叫。各组中点位置上的变量值叫。 6.组距式变量数列,根据各组的组距是否相等可以分为和。 7.已知一个数列最后一组的下限为900,其相邻的组中值为850,则最后一组的上限和组中值分别为和。 8.统计资料的表现形式主要有和。 9.从形式上看,统计表主要由、、和四部分组成;从内容上看,统计表由和两部分组成。 10.统计数据整理就是对搜集得到的进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的的工作过程。 11.数据的预处理是数据整理先行步骤,它是在对数据分类或分组之前对和所做的必要处理,包括对数据的、和。 12.直方图是用——的宽度和高度来表示频数分布的图形。 13.雷达图是一种的图示方法。 二、单项选择题 1.统计分组的关键问题是( ) A确定分组标志和划分各组界限B确定组距和组数 C确定组距和组中值D确定全距和组距 2.要准确地反映异距数列的实际分布情况,必须采用( ) A次数B累计频率C频率D次数密度 3.按品质标志分组,分组界限的确定有时会发生困难,这是由于( ) A组数较多B标志变异不明显C两种性质变异间存在过渡形态D分组有粗有细4.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( ) A260 B 215 C 230 D 185 5.下列分组中按品质标志分组的是( ) A人口按年龄分组B产品按质量优劣分组 C企业按固定资产原值分组D乡镇按工业产值分组 6.对企业先按经济类型分组,再按企业规模分组,这样的分组,属于( ) A简单分组B平行分组C复合分组D再分组 7.用组中值代表各组内的一般水平的假定条件是( ) A各组的次数均相等B各组的组距均相等 C各组的变量值均相等D各组次数在本组内呈均匀分布 8.对统计总体按两个及以上标志分组后形成的统计表叫( ) A简单表B简单分组表C复合分组表D汇总表 9.对某地区的全部商业企业按实现的销售额多少进行分组,这种分组属于( )

统计数据的整理

第三章统计数据的整理 一、填空题 1、综合平均 2、简单分组复合分组 3、统计分组的关键在于分组标志的选择 4、人口按性别民族职业分组属于按品质标志分组人口按年龄,工资分组属于按数量标志分组 5、统计复合分组表:是指主词按两个或两个以上标志进行层叠分组的统计表 6、可量性综合性 7、简单分组复合分组 8、百分数或倍数复名数 9、调查单位报告单位 10 、总体单位总量总体标志总量 二、简答题 1、统计资料整理的一般程序:编制整理纲要、统计资料的审核、统计资料的分类汇总、编制统计表。 2、统计分组有何作用:区分事物的性质,反映总体的内部结构,描述统计变量的分布状况研究现象之间的依存关系。 3、统计分组:根据统计研究的目的和被研究现象的本质特征,将统计总体按照一定的标志划分为若干性质不同的部分或组。 4、数量指标是用绝对数形式表现的,用来反映总体规模大小、数量多少的统计指标,其数值大小一般随总体范围的大小而增减。质量指标是说明总体内部数量关系和总体单位水平的统计指标,其数值大小不随总体范围的大小而增减。 5、比例相对指标有反映总体结构的作用,与结构相对指标有密切联系。所不同的是二者对比方法的不同,说明问题的点不同,比例相对指标反映的比例关系是一种结构性比例,一般侧重有一个经验数据。(2)强度相对指标也反映一种比例关系,相对比例相对指标而言,它所反映的是一种依存性比例而非结构性比例,不存在经验数据。 6、编制数量指标指数和质量指标指数应遵循的一般原则是:数量指标指数要使用基期的质量指标作为同度量因素,而质量指标指数要使用报告期的数量指标作为同度量因素,称之为“数基质报”原则。 三、计算题 1、 某公司日商品销售额分组

统计学数据处理的基本思路

统计学数据处理的基本思路 数据的整理是数据收集与数据分析之间的中间环节数据整理是对收集来的数据进行加工整理使之符合统计分析的需要。如对数据进行图表显示,以发现数据中的基本规律。数据整理的中心任务就是分组与编制频数分布表。 而数据处理的主要步骤又包括以下几点:数据的预处理,数据的分组,数据的整理与显示,统计表。 数据整理是所以步骤的第一步,也最为重要。统计整理是统计调查的继续,是统计分析的前提和基础,在整个统计工作中,发挥着承上启下的作用。 其中,在数据的预处理中,把混在原始数据中的“异常数据”排除、把真正有用的“信息”提取出来。因此,对异常数据的剔除就显得尤为重要,其中又包含多种方法,主要有1、根据人们对客观事物已有的认识,判别由于外界干扰、人为误差等原因造成实测数据偏离正常结果,在实验过程中随时判断,随时剔除。2、给定一个置信概率,并确定一个置信限,凡超过此限的误差,就认为它不属于随机误差范围,将其视为异常数据剔除。 比如,在对一个班的同学的身高做调查的时候,可以依据常识,在列表中对那些明显不符合的数据做剔除处理,即身高中出现2米多的数据,依常识不可能。 再则,预处理完毕后,则需要对数据进行分组。通过分类发现数据内部的特点。例如,在对全班身高进行整理后得到数据,可以对之进行不同的分组,如分男女生,如分不同高度段等等。通过分组发现数据内部结构的特点。即有所谓的类型分组,分析分组,结构分组等等。 第三,就是数据的整理与显示。包括的重点有:1、频数(落在各类别中的数据个数。)2、频率(某一类别数据的频数占总体单位个数的比重。)3、频数分布(把频数以表格形式全部列出就是~绘制频数分布表的演示操作(调用Excel文件:分类数据的整理)4、比例(各类数据与全部数据之比)5、百分数(把比例基数100化比率:各类数据间的比值)。 这些处理是下一步的前提与基础,为绘图做准备,比如在对全班身高完成分组后,可以依据一定的需要,对其进行整理与显示,如要研究男女身高的差异,可以分别理出男女身高的平均数,频数,频率,频数分布,比例,百分比等等数据。然后根据需要对其进行显示。 最后一步,就是绘图。其中不同的需要目的需要不同的图形予以显示。图形主要有条形图,直方图,饼状图,折线图等等。以条形图为例,长度表示各类频数的多少,而宽度则一般固定。用于显示各数据直观上的绝对多少。其他图形依然。 所以,综上述,基本思路即包括数据的预处理,数据的分组,数据的整理与显示以及绘图。(由于不会word绘图功能,故相关事例绘图滤去)

统计数据的整理[1]

统计数据的整理 一、统计整理 (一)定义:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。对已整理过的资料(包括历史资料)进行再加工也属于统计整理。(二)意义: 1、通过统计调查可以取得第一手资料,但这种资料只能反映总体各单位的具体情况,是分散、零碎、表面的。要说明总体情况,揭示出总体的内在特征,还需要对这些资料进行加工整理,使之系统化,以便通过综合指标对总体作出概括性的说明。 2、统计整理是整个统计工作和研究过程的中间环节,起着承前启后的作用。统计整理是统计调查的继续,又是统计分析的基础。统计调查所搜集到的资料,只有通过科学的审核、分类、汇总等整理工作,才能使统计在认识社会的过程中,实现由个别到全体、由特殊到一般、由现象到本质、由感性到理性的转化,才能从整体上反映出事物的数量特征。否则统计调查所得的资料再丰富、再完备,其作用也发挥不出来,统计调查就将徒劳无益,统计分析也将无法进行。 3、统计整理还是积累历史资料的必要手段。统计研究中经常要用动态分析,这就需要有长期累积的历史资料,而根据积累资料的要求,对已有的统计资料进行筛选,以及按历史的口径对现有的统计资料重新调整、分类和汇总等,都必须通过统计整理工作来完成。 (三)程序: 1、设计整理方案: 分组和分组体系; 统计指标 2、对搜集到的资料进行审核:对调查资料进行审核是统计整理的第一步,包括以下内容: (1)完整性和及时性 完整性,就是看调查单位或填报单位是否齐全;规定的项目是否都有答案,应报资料的份数是否符合规定。 及时性,是看填报单位是否按时报送了有关资料。对不报、漏报或迟报的现象都要及时查清。(2)审核资料的正确性: 审核资料的正确性,是检查所填报的资料是否准确可靠。常用的审核方法有两种: ①逻辑检查: 首先,从理论上或常识上检查资料是否有悖常理、有无不切实际或不符合逻辑的地方。 例:一张调查表中,年龄是9岁,职业是教师,其中必有一个是错误的。 若在某行业的报表中,企业规模为大型,而职工人数则是100人,这其中也必有一错。 其次,是检查各项目之间有无相互矛盾的地方。 例:企业的净产值大于同期总产值就是明显的逻辑错误。 ②计算检查: 即检查各项指标的计算口径、计量单位是否符合规定,并通过各种计算方法来检查各指标间的数字是否相互衔接。 例:各分项之和 = 总计 各比例之和 = 100%

相关文档