文档视界 最新最全的文档下载
当前位置:文档视界 › 统计学基础知识

统计学基础知识

统计学基础知识
统计学基础知识

一、数据的特征值

(一)数据的位置特征值 1)平均值

如果从总体中抽取一个样本,得到一批数据x 1,x 2,x 3….x n ,则样本的平均值x 为:

n-数据个数; x i -第i 个数据数; ∑-求和。

2)中位数

有时,为减少计算,将数据x 1,x 2,x 3….x n 按大小次序排列,用位居于正中的那个数或中间两个数的平均值(当数据为偶数时)表示数据的总体平均水平。

3)中值M 测定值中的最大值x max 与最小值x min 的平均值,用M 表示。

4)众数

在用频数分布表示测定值时,频数最多的值即为众数。若测定值按区间做频数分布时,频数最多的区间代表值(一般取区间中值)也称众数。

(二)数据的离散特征值 1)极差R

测定值中的最大值x max 与最小值x min 之差称为极差。通常R 用于个数n 小于10的情况下,n 大于10时,一般采用标准偏差s 表示。

2)偏差平方和S 各测定值x i 与平均值 之差称为偏差。各测定值的偏差平方和称为偏差平方和,简称平方和,用S 表示。

无偏方差

各个测定值的偏差平方和除以(n-1)后所得的值称为无偏方差(简称方差),用s 2表示:

~

x _x _

x ∑

=--=-=n i i x x n n S s 1

2

_2)(1112

_

2

_

22

_

1)(...)

()

(x x x x x x n -+-+-∑=-n

i i x x 1

2

_

)(S = =

标准偏差s

2

(三)变异系数

以上反映数据离散程度的特征值,只反映产品质量的绝对波动大小。在工程实践中,测量较大的产品,绝对误差一般较大,反之亦然。因此要考虑相对波动的大小,在统计技术上

上式中σ和μ为总体均值和总体标准差,当过程在受控状态下,且样本容差较大时,可用样本标准差s 和样本均值 估计。

_x

Ca、Cp、Cpk的计算

过程准确度指数(Ca值):表示过程特性中心位置的偏移程度,越小越好

Ca=(样本平均值-规格中心值)/(规格公差/2)

等级A:|Ca|≦12.5% 表示作业员遵守作业规范,并达规格要求

等级B :12.5%< |Ca|≦25% 表示必要时尽可能提升至A级

等级C:25%< |Ca|≦50% 表示作业员可能看错或未按标准作业,或须修改规格及作业标准。等级D:50%< |Ca| 表示应采取紧急措施,全面整改可能影响之因素,必要时应停止生产。

过程精密度能力系数(Cp值):表示过程特性分散的程度,值越大越集中。

Cp=(规格上限-规格下限)/(6×标准差)

合格:1.33≦Cp表示能力足够

警告:1.00 ≦Cp< 1.33表示能力无足够宽度,平均值稍有偏差时,不良率既会增加。

不合格:Cp< 1.00表示能力不足,有不合格品,须全数筛选,并设法缩小变异或整改规格公差。过程综合能力系数(Cpk值):同时考虑“偏移”程度及“分散程度

Cpk=(1-Ca) ×Cp

此系数为过程评价用系数,用于过程改善

客户指定Cpk值时,欲达到此Cpk值,可先探讨Ca及Cp值:“准确度”“精密度”是否有适当能力

一般客户是指定值多数为≧1.33;Cpk值≧3.00时,表示过程能力已经足够了,继续维持即可;若想进一步改善,应考虑成本效益。

Cp=(Ucl-Lsl)/6δ

Cpku=(Ucl-Xbar)/3δ

Cpkl=(Xbar-Lsl)/3δ

Cpk=min(Cpku : Cpkl)

二、 回归分析

(一)什么是回归分析

回归分析是用来研究一个指标与几个变量间的相关关系的方法。

设有两个变量x 和y ,前者为自变量,后者为因变量,并均为随机变量。当自变量X 变化时,Y 会产生相应的变化,如果具有大量或较多的统计数据(x i ,y i ),则可以用数学方法找出两者之间的统计关系y =f(x),这种数学方法称为回归分析。

当y =a +bx 时,称之为一元线性回归;

当y =f(x)为非线性函数关系时,称之为非线性回归;

当x 变量不止1个,有几个时,即有(x 1,x 2···,x n ),则y =f (x 1,x 2···,x n )称之为多元回归。

当有y =a +b 1 x 1+b 2 x 2+···+b n x n 时,称之为多元线性回归,否则为多元非线性回归。

回归分析可用于预测、质量控制等方面。

(二) 一元线性回归方程的计算方法

设一元线性回归方程的表达式为: y=a+bx

现在给出了n 对数据(x i , y i ),要求根据这些数据去估计a 与b 的值。则:

其中 L xx:----x 的离差平方和 L yy ----y 的离差平方和 L xy ----x ,y 的离差成积之和

2

n

1

i )

Lx x x x i -=∑

=(2

n

1

i )

Lyy y y i -=∑

=(x

b y -=a xx xy L L =b )y )(Lx y n

1

i y x x i i --=∑

=(

三、统计过程控制基本概念

Statistical Process Control(SPC---统计过程控制)的概念是:应用统计技术对过程中的各个阶段进行评估和检察,保持过程处于可接受的和稳定的水平,以保证产品与服务满足要求的均匀性。

这里的统计技术涉及到数理统计内容,但所应用的主要工具是控制图。

SPC可以判断过程的异常,及时告警。但是不能告知此异常是什么因素引起的,发生于何处。20世纪80年代起,我国的张公绪先生提出Statistical Process Diagnosis理论(SPD---统计过程诊断)。20世纪90年代起又发展为Statistical Process Adjustment (SPA---统计过程调整)。三者循环关系如下:

SPC---告诉过程是否有异常

SPD---告诉过程是否有异常,若异常,告知问题出在哪里

SPA---告诉过程是否有异常,若异常,告知问题出在哪里,如何进行调整

所以SPC是质量改进循环的首要步骤,应该熟练掌握运用。

四、控制图的应用

统计过程控制的主要工具是控制图(SPC图)。控制图是将一个过程定期收集的样本数据按顺序描点绘制成曲线的一种技术,可以发现过程异常,是采取预防措施的重要手段。1984年日本名古屋工业大学调查了上百家中小型企业,发现平均每家企业采用137张控制图。美国柯达一共应用了35000张控制图。

(一)控制图的原理

当质量特性值x服从正态分布时,由两个参数决定分布曲线的位置与形状,即平均值μ和标准差σ。不论μ和σ取什么值,产品质量特性值x落在[μ-3σ,μ+3σ]区间内的概率为99.73%。根据小概率事件可以忽略的原则,若变量x超出±3σ范围,则认为过程存在异常。

一个控制图有三条线:

中心线,简称CL线。 CL=μ

上控制线,简称UCL线。 UCL=μ+3σ

下控制线,简称LCL线。 LCL=μ-3σ

将正态分布曲线图旋转180度,即得到控制图。

(二)如何利用控制图判断过程异常

多数点子在μ±1σ范围内(68%左右),小部分点子在μ±2σ和μ±1σ之间(27%左右),点子随机排列,是过程控制的理想状态。

中心线一侧的点子明显比另一侧多,应考虑均值可能产生偏移。

较多的点子接近上下控制线,说明标准差已经变大。

中心线一侧连续出现多个点子或点子连续上升/下降,证明有系统因素干扰。

点子按一定时间间隔呈周期性变化,可能工艺、环境等因素失控。

(三)常规控制图(休哈特控制图)

常规控制图即休哈特控制图,参见下表“常规控制图”。

常规控制图

五、 过程能力分析、过程能力指数计算

(一)、过程能力分析

过程能力(process capability )指过程加工质量方面的能力,决定因素是人、机、料、法、测和环(即5M1E ),与公差无关。分析过程能力只能在稳态的基础上,即统计控制状态。

过程能力决定于由偶因造成的总变差σ,当过程处于稳态时,产品的计量质量特性值有99.73%在μ±3σ范围内,即几乎全部产品的特性值包含在6σ范围之内。故常用6倍标准差(6σ)表示过程能力,它的数值越小,表示过程能力越强。 (二)、过程能力指数计算

当产品质量特性分布的均值μ与公差中心M 重合时

1、对于公差的上、下限都有要求时, 过程能力指数计算公式如下:

T 为公差, T U 为 公差上限,T L 为公差下限, 是质量特性总体标准差的估计值。

在上述过程能力指数中,T 反映对产品的技术要求(或客户对产品的要求),而σ反映本企业过程加工的质量。比值C P 反映过程加工质量满足产品技术要求的程度。

根据T 与6σ的比值,可以得到下图所示三种典型的情况。C P 值越大,表明加工质量越好,但对设备和人员的要求也越高,加工成本相应升高。当C P =1,似乎既满足要求也节约成本,但由于过程的波动,分布中心一有偏移,不合格品率就要增加,因此,C P 应取>1。一般情况下,当C P =1.33,T=8σ,整个分布基本上都在上下规范限度内,且留有变动空间。故ISO8258:1991要求C P ≥1.33。

2、只对单侧公差限有规定时 只规定上限时,

只规定下限时,

σσσ?666L

U L U P T T T T T C -≈-===过程变异度规定的公差σ?σ

μ

3-=U PU

T C σ

μ3L

PL T C -=

当产品质量特性分布的均值μ与公差中心M 有偏离时

这种情况下,需要对无偏离C P 乘上一个修正系数(1-K )。

有偏离情况下的过程能力指数是:

过程能力指数与不合格品率的关系

考虑过程能力指数与不合格品率的关系时,直接查@正态分布表比较方便。 当公差中心M 与数据分布中心μ重合时,

当公差中心M 与数据分布中心μ有偏离时,

例:在无偏离情况下,求C P =0.7时的不合格品率P 。 解答:

C P =0.7, 3 C P =2.1 查“正态分布表”,得到 不合格品率为:

P=2-2 x 0.98214=0.03572

6.4.3.3 6σ控制方法

6σ控制方法,即过程能力指数达到2以上,不合格品率0.08197316, 几乎达到零缺陷。 执行6σ需要多方面的专业技能和知识,包括:SPC 、MSA 、DOE 、可靠度工程、FMEA 、TQM 、QFD 、田口方法、ISO9000、质量成本QCOST 、数理统计、顾客满意、同步工程、价值工程、绿色设计等等。

所用的工具可以是:

? SPC 度量、分析、改进和监控过程的波动

? DOE/田口方法 优化设计技术,通过DOE ,改进过程设计,使过程能力达到最优水平 ? FMEA 风险分析技术,辅助确定改进项目,制定改进目标

? QFD 顾客需求分析技术,辅助将顾客需求正确地转换为内部工作要求 ? 防错 从根本上防止错误发生的方法

σε62)1(-=-=T C K C P PK []

)3(22P C P φ-=σσσ?666L

U L U P

T T T T T C -≈-===过程变异度规定的公差()[]()[]{}K C K C P P P -++-=13132φφ[]

)3(22P C P φ-=[]98214.0)1.2(=φ

平均值加减标准差表示的是什么

标准差,标准差的平方是方差,方差就是为了统计这组数据偏离平均值的程度,也可以说是这组数据的稳定性。

例如两个人打靶,A打6,7,8,9,10,平均值是8,方差就是[(-2)^2+(-1)^2+0+1^2+2^2]/5=2,标准差等于根号2

B打8,8,8,8,8,平均值是8,方差就是0,这样来说B的成绩更稳定。

平均数加减标准差的范围内代表大概率事件,范围外代表小概率事件。用成绩为样本,则范围内的成绩为正常的大部分考生的成绩,范围外的为特殊的少部分考生的成绩(包括特别好的和特别差的)。通常,一次考试的成绩都是成正态分布的,平均数加减标准差的范围内的成绩应该达到85%以上。如果没有成正态分布,则说明试卷没有出好,出得太难或者太简单了。对某一个人所有考试的成绩看平均数和标准差就够了,对平均数加减标准差的分析没有多大意义。但是,某一个人在一段时间内某一特定科目的所有考试成绩又可以用平均数加减标准差来分析了。

平均数只能显示总体情况,而标准差能够看出变异程度。标准差越大,数据越离散。比如以下两组数:a. 2 2 2 2 2 b.1 1 2 3 3 两组的均数相等,而a组数据集中(向均数集中),b组离散,a组标准差小于b组

P值与α值的关系?

P值(P value)就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。

α值是一个临界概率值。它表示在“统计假设检验”中,用样本资料推断总体时,犯拒绝“假设”错误的可能性大小。α越小,犯拒绝“假设”的错误可能性越小。

P是“拒绝原假设时犯错误概率”又或者说是“如果你拒绝掉原假设实际上是在冤枉好人的概率”。

不管怎么表达理解上都有点绕,所以你还是看例子吧。比如你做一个假设(null hypothesis):你的女性朋友平均身高2米,输入你统计的样本数据后,计算机给你返回的p值是0.03。这意味着如果你拒绝“女性朋友平均身高2米”这个结论,犯错的概率是0.03,小于0.05(人们一般认为拒绝一句话时犯错概率小于0.05就可以放心大胆地拒绝了),这个时候你就可以拒绝原假设。如果计算机返回p值是0.9,那么你就会想,这说明拒绝原假设犯错概率高达90%,那么我就不应该拒绝原假设,即你应该认为你的女性朋友平均身高就是2米。

至于什么是alpha呢,上面例子中0.05这个标准就是alpha值,这个标准是可以你自己人为改变的。

==========================以下是补充内容

===========================

统计学基础知识要点 很重要

第一章:导论 1、什么是统计学?统计方法可以分为哪两大类? 统计学是收集、分析、表述和解释数据的科学。统计方法可分为描述统计方法和推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没 有对事物进行人为控制的 条件下等到的;实验数据的 在实验中控制实验对象而 收集到的数据。按被描述的 对象与时间关系分时:截面 数据所描述的是现象在某 一时刻的变化情况;时间序 列数据所描述的是现象随 时间而变化的情况。 3、举例说明总体、样本、 参数、统计量、变量这几个 概念。 总体是包含研究的全部个 体的集合。比如要检验一批 灯泡的使用寿命,这一批灯 泡构成的集合就是总体。样 本是从总体中抽取的一部 分元素的集合。比如从一批 灯泡中随机抽取100个,这 100个灯泡就构成了一个样 本。参数是用来描述总体特 征的概括性数字度量。比如 要调查一个地区所有人口 的平均年龄,“平均年龄” 即为一个参数。统计量是用 来描述样本特征的概括性 数字度量。比如要抽样调查 一个地区所有人口的平均 年龄,样本中的“平均年龄” 即为一个统计量。变量是说 明现象某种特征的概念。比 如商品的销售额是不确定 的,这销售额就是变量。 第二章:数据的收集 1、调查方案包括哪几个方 面的内容? 调查目的,是调查所要达到 的具体目标。调查对象和调 查单位,是根据调查目的确 定的调查研究的总体或调 查范围。调查项目和调查 表,要解决的是调查的内 容。 2、数据的间接来源(二手 数据)主要是公开出版或公 开报道的数据;数据的直接 来源一是调查或观察,二是 实验。 3、统计调查方式:抽样调

统计学基础试题

2014-2015学年第一学期《统计学》期复习资料 一、单项选择题 1.下列属于品质标志的有(B )。 A.劳动时间 B.健康状况 C.工资级别 D.劳动生产率 2.标志是说明( A )。 A.总体单位的特征的名称 B.总体单位量的特征的名称 C.总体质的特征的名称 D.总体量的特征的名称 4.调查某乡镇工业企业职工工资情况,则调查对象是( B )。 A.该乡镇全部工业企业 B.该乡镇全部工业企业的职工 C.该乡镇全部工业企业的职工的工资 D.该乡镇工业企业每一名职工的工资 5.对某地区三家不同部门进行某项改革的企业进行调查,以了解某近阶段生产情况和存在问题,以便为今后的普遍推广积累经验,这种调查是( C ) A.普查 B.重点调查 C.典型调查 D.抽样调查 6.按连续型变量分组,第一组为75以下,第二组为75~85,第三组为85~95,第四组为95以上,则数据( A ) A.75在第一组 B.85在第二组 C.85在第三组 D.95在第四组 7.按连续型变量分组,其末组为开口组,下限为2000。已知相邻组的组中值为1750,则末组组中值为( C ) A.2100 B.2200 C.2250 D.2500 第一步: 一般情况下,组中值=(上限+下限)/2 已知相邻组组中值为975,相邻组的上限即为末组的下限1000,即975=(1000+下限)/2 由该公式得到下限=950 所以,相邻组组距=1000-950=50 第二步: 计算开口组的组中值时,只有下限而无上限,则 组中值=下限+相邻组组距/2=1000+50/2=1025 8.在全国医院总体中,医院数(a)、医院医生人数(b)和病床张数(c)三个指标() A.都是总体单位总量 B.a是总体安慰总量,b、c是总体标志总量 C.都是总体标志总量 D.b是总体安慰总量,a、c是总体标志总量 9.某商店计划规定本年费用水平比去年下降4%,实际下降了6%,则该商店费用水平计划完成程度是( A ) A.97.9% B.101.9% C.102.1% D.150% 10.不能全面反映总体各单位标志值变异程度的标志变异指标是() A.平均差 B.标准差系数 C.标准差 D.全距 11.要了解某市工业企业生产设备情况,则统计总体是( )。 A.该市全部工业企业 B.该市每一个工业企业 C.该市工业企业的某一台设备 D.该市所有工业企业的全部生产设备 12.下列情况属于离散变量的是( C )。 A.营业额 B.工龄 C.工厂数D.职工年收入 13.调查问卷中,开放式问题一般应该排在问题的( C )。 A.开头B.中间C.最后D.都可以

统计学基础知识要点

第一章:导论 1、什么就是统计学?统计方法可以分为哪两大类? 统计学就是收集、分析、表述与解释数据的科学。统计方法可分为描述统计方法与推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据与数值型数据;按照统计数据的收集方法,分为观测的数据与实验的数据;按照被描述的对象与时间的关系,分为截面数据与时间序列数据。 按计量尺度分时:分数数据中各类别之间就是平等的并列关系,各类别之间的顺序就是可以任意改变的;顺序数据的类别之间就是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据就是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的就是现象在某一时刻的变化情况;时间序列数据所描述的就是现象随时间而变化的情况。 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体就是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就就是总体。样本就是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数就是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量就是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量就是说明现象某种特征的概念。比如商品的销售额就是不确定的,这销售额就就是变量。 第二章:数据的收集 1、调查方案包括哪几个方面的内容? 调查目的,就是调查所要达到的具体目标。调查对象与调查单位,就是根据调查目的确定的调查研究的总体或调查范围。调查项目与调查表,要解决的就是调查的内容。 2、数据的间接来源(二手数据)主要就是公开出版或公开报道的数据;数据的直接来源一就是调查或观察,二就是实验。 3、统计调查方式:抽样调查、普查、统计报表等。 抽样调查就是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查就是为某一特定目的而专门组织一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。统计报表就是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。 除此之外,还有重点调查与典型调查。 4、统计数据的误差通常就是指统计数据与客观现实之间的差距,误差的主要类型有抽样误差与非抽样误差两类。 抽样误差主要就是指在样本数据进行推断时所产生的随机误差(无法消除);非抽样误差就是人为因素造成的(理论上可以消除) 5、统计数据的质量评价标准:精度,即最低的抽样误差或随机误差;准确性,即最小的非抽样误差或偏差;关联性,即满足用户决策、管理与研究的需要;及时性,即在最短的时间里取得并公布数据;一致性,即保持时间序列的可比性;最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。 6、数据的收集方法分为询问调查与观察实验。 7、统计调查方案包括哪些内容? 调查目的即调查所要达到的具体目标;调查对象与调查单位,调查对象就是根据调查目的确定的调查研究的总体或调查范围,调查单位就是构成调查对象中的每一个单位;调查项目与调查表,就就是调查的具体内容;其它问题,即明确调查所采用的方式与方法、调查时间及调查组织与实施细则。 第三章:数据整理与展示 1、对于通过调查取得的原始数据,应主要从完整性与准确性两个方面去审核。 2、对分类数据与顺序数据主要就是做分类整理,对数值型数据则主要就是做分组整理。 3、数据分组的步骤:确定组数、组距,最后制成频数分布表 统计分组时“上组限不在内”,相邻两组组限间断,上限值采用小数点。 组中值=(下限值+上限值)/2 4、频数:落在各类别中的数据个数;频数分布指把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来;比例:某一类别数据占全部数据的比值;百分比:将对比的基数作为100而计算的比值;比率:不同类别数值的比值;分类数据的图示包括条形图与饼图。 5、直方图与条形图的差别:条形图就是用条形的长度表示各类别频数的多少,宽度则就是固定的,直方图就是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,直方图的各矩形通常就是连续排列,而条形图则就是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章:数据分布特征的测度 1、一组数据的分布特征可以从哪几个方面进行测度? 一就是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二就是分布的离散程度,反映各数据据远离其中心值的趋势;三就是分布的形状,反映数据分布偏斜程度与峰度。 2、简述众数、中位数与均值的特点与应用场合及关系。

统计学知识点梳理

型;有下划线的重点记忆!当然整理的知识点都就是重点!都要背与理解!Fighting!) 第一章绪论 一.统计的含义 即统计工作、统计资料与统计学 统计工作:统计实践活动,搜集,整理,分析与提供关于社会现象数字资料工作总称 统计资料:统计实践活动过程中所取得的各项资料,包括原始资料与加工整理资料 统计学:关于认识客观现象总体数量特征与数量关系的科学 二.统计工作过程 就一次统计活动来讲,一个完整的认识过程一般可以分为统计调查、统计整理与统计分析三个阶段。 统计调查:第一阶段,就是认识客观经济现象的起点,就是统计整理与统计分析的基础。 统计整理:第二阶段,处于统计工作的中间环节,起着承前启后的作用。

统计分析:第三阶段,通过第三阶段,事物由感性认识上升到理性认识。 三.总体与总体单位(会辨析总体与总体单位即可) 总体,亦称统计总体,就是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体;构成总体的这些个别单位称为总体单位。 总体由总体单位构成,要认识总体必须从总体单位开始,总体就是统计认识的对象。 例如:所有的工业企业就就是一个总体,其中的每一个工业企业就就是一个总体单位。 四.标志与指标 标志就是用来说明总体单位特征的名称。 指标,亦称统计指标,就是说明总体的综合数量特征的。一个完整的统计指标包括数量指标名称与指标数值两部分。(以上内容理解即可) 1、指标与标志的区别与联系(简答) 指标与标志的区别:(1)指标就是说明总体特征的,而标志就是说明总体单位特征的;(2)指标都能用数值表示,而标志中的品质标志不能用数值表示,就是用属性表示的;(3)指标数值就是经过一定的汇总取得的,而标志中的数量标志不一定经过汇总,可直接取得;(4)一个完整的统计指标,一定要讲时间、地点、范围,而标志一般不具备时间、地点等条件。 指标与标志的联系:(1)有许多统计指标的数值就是从总体单位的数量标志值汇总而来的; (2)两者存在着一定的变换关系,即由于研究目的不同,原来的统计总体如果变成总体单位了,则相应的统计指标也就变成数量标志了。 2、标志与标志值(会区分) 标志分为品质标志与数量标志,数量标志用来说明总体单位量的特征,可以用数值表示,即为标志值(如:年龄、工资额、身高) 3、变异与变量(会什么就是变异,什么就是变量) 变异:品质标志在总体单位之间的不同具体表现。如:性别表现为男、女,民族表现为汉、满、蒙等。 变量:数量标志抽象化即为变量,而数量标志的不同具体表现则称为变量值(或标志值)。如:某职工的年龄就是42岁,月工资2200元。 4、统计指标的划分 (1)统计指标按其所反映的总体内容的不同,可分为数量指标与质量指标。数量指标指说明总体规模与水平的各种总量指标。质量指标指反应现象总体的社会经济效益与工作质量的各种相对指标与平均指标。 (2)统计指标按其作用与表现形式的不同,有总量指标(绝对数)、相对指标(绝对数)、平均指标(平均数)三种。 第二章统计调查与整理 一、统计调查的含义 统计调查就是统计工作过程的第一阶段。它就是按照统计任务的要求,运用科学的调查方法,有组织的向社会实际搜索各项原始资料的过程。统计调查就是整个统计认识活动的基础,决定着统计认识过程及其结果的成败。 二、统计调查方案设计的内容+调查对象、调查单位的含义 ⒈确定调查目的;(为什么调查) 根据实际需要与可能确定 ⒉确定调查对象与调查单位;(向谁调查) 调查对象——社会现象的总体 调查单位——调查标志的承担者(总体单位)

第三版统计学基础练习题部分答案

第一章 1统计数据可分为哪几种类型不同类型的数据各有什么特点 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。 2变量分为那几类:分类变量、顺序变量和数值型变量。 3举例说明离散型变量和连续型变量: 离散变量是指其数值只能用自然数或整数单位计算的则为离散变量.例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得. 在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值.例如,生产零件的规格尺寸,人体测量的身高,体重,胸围等为连续变量,其数值只能用测量或计量的方法取得.

练习书上有答案:需注意:用数值表示的属于数值变量。分类选择的属于分类变量。投票选举的属于顺序变量。 第二章: 简述普查和抽样调查的特点: 抽样调查是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查是为某一特定目的而专门组织一次性全面调查。 特点:第一普查通常是一次性的或周期性的。第二普查一般需要规定统一的调查时间。第三普查的数据一般笔记哦啊准确,规范化程度也较高,因此它可以为抽样调查或其他调查提供基本的依据。第四普查使用范围比较狭窄,只能调查一些最基本的、特定的现象。 调查方案包括哪几方面的内容:调查目的、调查对象和调查单位、调查项目和调查表。 什么是调查问卷:它由哪几部分组成 调查问卷是用来收集调查数据的一种工具,是调查者根据调查目的和要求所涉及的,有一系列问题、备选答案、说明以及码表组成的一种调查形式。结构:开头部分、甄别部分、主体部分和背景部分组成。

统计学基础知识及其概念

一、概念篇 总体:总体是指客观存在的,在同一性质基础上结合起来的许多个别事务的整体,亦称统计总体。 总体单位:总体单位是指构成统计总体的个别事物的总称。 指标:指标是反映总体现象数量特征的概念。 标志:标志是说明总体单位特征的名称。 统计调查:是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地向客观实际搜集统计资料的过程。 调查对象:是根据调查目的、任务确定的调查的范围,即所要调查的总体,它是由某些性质上相同的许多调查单位所组成的。 调查单位:是所要调查的现象总体中的个体,即调查对象中的一个一个具体单位,它是调查中要调查登记的各个调查项目的承担者。 报告单位:是负责向统计调查机关提交调查资料的单位。 普查:是专门组织的一次性的全面调查,用来调查属于一定时点上或时期内的现象的总量。 抽样调查:是从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。抽样调查又称为概率抽样或称为随机抽样。 抽样调查是抽取总体重的部分单位,收集这些单位的信息,用来对总体进行推断的调查方法。这里的总体是指抽样推断所要认识的研究对象的整体,它是由所要研究的范围内具同一性质的全体单位所组成的整体。被抽中的部分单位构成样本。一般的,将总体记作N,将样本记作n。 面谈访问法:是由访问员与被调查者见面,通过直接访问来填写调查问卷的方法。 统计整理:是统计工作的一个重要环节,它是根据统计研究的任务与要求,对调查所取得的各种原始资料,进行审核、分组、汇总,使之系统化、条理化,从而得到反映总体特征的综合资料的过程。 复合分组:对同一总体选择两个或两个以上的标志重叠起来进行分组。 复合分组体系:多个复合分组组成的分组体系。 频数:是指分配数列中各组的单位数,也称次数。 频率:是将跟组的单位数(频数)与总体单位数相比,求得的用百分比表示的相对数,也称比率或比重。 统计指标:是反映总体现象数量特征的基本概念及其具体数值的总称。 总量指标:是反映总体规模的统计指标,表明现象总体发展的结果。 平均指标:是总体各单位某一数量标志一般水平的统计指标。 是将一个总体内各个单位在某个数量标志上的差异抽象化,以反映总体的一般水平的综合指标。 标志变异指标:是表明总体各个单位标志值的差异程度(离散程度)的指标。 强度相对指标:是不属于同一总体的两个性质不同但相互间有联系的总量指标对比的比值,是用来反映现象的强度、密度和普遍程度、利用程度的综合指标。 加权算数平均数:是在总体经过分组形成变量数列(包括单项数列和组距数列),有变量值和次数的情况下,将各组变量值分别与其次数相乘后加总求得标志总量,再除以总体单位数(即次数总和)而求得的数值。 标准差:是总体各单位变量值与其平均数的离差平方的算术平均数的平方根。 发展速度:是表明社会经济现象发展程度的相对指标,它是根据两个不同时期发展水平对比求得,说明报告期水平是基期水平的几倍或百分之几,常用倍数或百分数来表示。由于所采用的基期不同,发展速度又可分为定基发展速度和环比发展速度。 概率抽样:概率抽样在抽取样本时不带有任何倾向性,它通过从总体中随机抽选单位来避免这种偏差,因而对总体的推断更具代表性。 比例分析法:比例分析法又名“比率分析法”,是用倍数或百分比表示的分数式,即通过计算相关指标之间的相对比值,来揭示和对比不同规模、不同性质事物的水平和效益的好坏,或分析部分和整体之间比例关系的分析方法。 国家统计报表制度:国家统计报表制度是各级政府统计部门实施国家统计调查项目的业务工作方案,由国家统计局制定,或者由国家统计局和国务院有关部门共同制定。 现行国家统计报表制度分为周期性普查制度、经常调查制度和非经常性调查制度三大类。 周期性普查制度:是国家统计报表制度的一个类型,是就我国社会经济发展的状况,由国务院组织,每隔一段时

统计学原理考试知识点整理

第1章 绪论 1、统计的含义统计一词最基本的含义是对客观事物的数量方面进行核算和分析,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。 2、统计的特点P3 数量性 具体性 综合性 3、统计学的若干基本概念 总体与总体单位P10: 总体是指在某种共性的基础上由许多个别事物结合起来的整体,构成总体的个别事物叫总体单位; 总体的特征:同质性,大量性,差异性;总体的分类:有限总体与无限总体;标志、变异与变量P10: 标志,是指说明总体单位特征的名称。变异:总体单位之间品质和数量上的差异,即可变标志在总体各单位之间所表现出的差异。变量:可变的数量标志。 连续型变量与离散型变量联系和区别:连续型:变量值可作无限分割的变量离散型:变量值只能以整数出现的变量指标与标志P11 (指标,说明总体数量特征的概念)区别:第一,指标说明总体的特征,而标志则说明总体单位的特征。第二,指标只反映总体的数量特征,所有指标都要用数字来回答问题,没有用文字回答问题的指标。而标志既有反映数量也有反映品质。 第2 章统计调查 1、统计调查的含义及其在统计工作中的地位P13 含义:根据统计研究的目的,有组织、有计划地搜集统计资料的过程地位:是统计工作的第一阶段,是整个统计工作的基础一环 2、统计调查的基本原则P13-14 一、要实事求是,如实反映情况 二、要及时反映,及时预报 三、要数字与情况相结合 3、统计调查的组织形式:普查P14:含义:为搜集某种社会经济现象在某时某地的情况而专门组织的一次性全面调查、优缺点:,适用场合:主要用于一些重要项目呢的调查,如人口普查、耕地普查、基本单位普查、工业普查和库存普查等; 随机抽样调查P14:含义(按随机原则(机会均等原则)从总体中抽取部分单位进行调查,并借以推断和认识总体的一种统计方法)以及具体的抽样方法【第七章】系统抽样、多阶 简单随机、分层抽样、整群抽样、 段抽样)及适用场合;非随机抽样:含义(调查者有意识地或随意而 非随机地从总体中抽取部分单位进行调查的统计方法)以及具体的抽样方法P15 (重点抽样:只对总体中为数不多但影响颇大的重点单位进行研究的一种非

统计学基础复习题

10级电商《应用统计学》期末复习 一、单选题 1.统计学的研究对象是( A ) A.客观事物的总体数量特征和数量关系 B.统计工作过程 C.总体与样本的关系 D.抽象数量的联系和空间形式 2.按某一标志分组的结果,表现出( A ) A.组内同质性和组间差异性 B.组内差异性和组间差异性 C.组内同质性和组间同质性 D.组内差异性和组间同质性 3.指出下面的数据哪一个属于顺序数据( D ) 个人的年龄分别是25,22,34,41,33 B.性别:男,女 C.上市公司所属行业:金融,房地产,医药,机械制造 D.员工对企业某项改革措施的态度:赞成,中立,反对 4.下列不属于描述统计问题的是( A ) A.根据样本信息对总体进行的推断 B.了解数据分布的特征 C.分析感兴趣的总体特征 D.利用图、表或其他数据汇总工具分析数据 5.我国六次人口普查规定的标准时间是2010年11月1日0时(截止时间),下列情况应计入人口数的是( D ) 年11月2日出生的婴儿 年10月29日21时出生,10月31日23时死亡的婴儿 年10月29日23时死亡的人 年11月1日3时死亡的人 6.某商场2010年空调销售量为10000台,库存年末比年初减少100台,这两个总量指标是( A ) A.时期指标 B.时点指标 C.前者是时期指标,后者是时点指标 D.前者是时点指标,后者是时期指标 7.某企业某年上半年月产量分别为410、420、380、410、420、420万件,则该企业上半年的平均月产量、中位数和众数分别为( A ) 、415、420 、420、420 、420、420 、420、410 8.下列数列中属于时间序列数据的是( B ) 年我国的国内生产总值 年我国的国内生产总值 年底我国的人口数 年10月我国的进口额 9.下列关于相关系数的陈述中哪一个是错误的( A ) A.数值越大说明两个变量之间的关系就越强 B.仅仅是两个变量之间线性关系的一个度量,不能用于描述非线性关系 C.只是两个变量之间线性关系的一个度量,并不意味两个变量之间存在因果关系 D.绝对值不会大于1 10.如果报告期商品价格计划降低5%,销售额计划增加10%,则销售量应增加( D ) % % 同时研究居民的消费支出与居民货币收入和消费品价格的数量关系,属于( B ) A.单相关 B.复相关 C.直线回归 D.曲线回归 12.在回归直线$μμ0 1 y x β β=+中,μ1 β表示( C )

统计学基础知识

一、数据的特征值 (一)数据的位置特征值 1)平均值 如果从总体中抽取一个样本,得到一批数据x 1,x 2,x 3….x n ,则样本的平均值x 为: n-数据个数; x i -第i 个数据数; ∑-求和。 2)中位数 有时,为减少计算,将数据x 1,x 2,x 3….x n 按大小次序排列,用位居于正中的那个数或中间两个数的平均值(当数据为偶数时)表示数据的总体平均水平。 3)中值M 测定值中的最大值x max 与最小值x min 的平均值,用M 表示。 4)众数 在用频数分布表示测定值时,频数最多的值即为众数。若测定值按区间做频数分布时,频数最多的区间代表值(一般取区间中值)也称众数。 (二)数据的离散特征值 1)极差R 测定值中的最大值x max 与最小值x min 之差称为极差。通常R 用于个数n 小于10的情况下,n 大于10时,一般采用标准偏差s 表示。 2)偏差平方和S 各测定值x i 与平均值 之差称为偏差。各测定值的偏差平方和称为偏差平方和,简称平方和,用S 表示。 无偏方差 各个测定值的偏差平方和除以(n-1)后所得的值称为无偏方差(简称方差),用s 2表示: ~ x _x _ x ∑ =--=-=n i i x x n n S s 1 2 _2)(1112 _ 2 _ 22 _ 1)(...) () (x x x x x x n -+-+-∑=-n i i x x 1 2 _ )(S = =

标准偏差s 2 (三)变异系数 以上反映数据离散程度的特征值,只反映产品质量的绝对波动大小。在工程实践中,测量较大的产品,绝对误差一般较大,反之亦然。因此要考虑相对波动的大小,在统计技术上 上式中σ和μ为总体均值和总体标准差,当过程在受控状态下,且样本容差较大时,可用样本标准差s 和样本均值 估计。 _x

统计学基础

一、单项选择题(共10道小题,共100.0分) 1.在下列调查中.调查单位与填报单位一致的是( )。 A. 公司设备调查 B. 农村耕地调查 C. 学生学习情况调查 D. 汽车养护情况调查 2. 3.在统计调查中,调查标志的承担者是( )。 A. 调查对象 B. 调查单位 C. 填报单位 D. 调查表 4. 5.填报单位( )。 A. 是调查标志的承担者 B. 是负责向上报告调查内容的单位 C. 是构成调查对象的每一单位 D. 即是总体单位 6. 7.变量数列中各组频率之和是( )。 A. 不等于l B. 大于1 C. 小于1 D. 等于l

8. 9. 统计表的结构,从其外形看,是由( )。 A. 标题和数字资料两部分构成 B. 标题、横行、纵栏标目三部分构成 C. 横行和纵栏数字资料构成 D. 标题、横纵、纵栏、数字资料等部分构成 10. 11.有20个工人看管机器台数资料如下:2、5、4、4、3、4、3、4、4、2、2、 4、3、4、6、3、4、 5、2、4,按以上资料编制分配数列,应采用( )。 A. 单项式分组 B. 等距分组 C. 不等距分组 D. 以上几种分组均可 12. 13.某厂劳动生产率计划在去年的基础上提高8%,执行结果仅比去年提高4%, 则劳动生产率的计划完成相对数算式为( )。 A. 4%÷8% B. 8%÷4% C. (100%+4%)÷(100%+8%) D. (1+8%÷1+4%) 14. 15. (错误) 下面属于结构相对指标的是( )。

A. 招生录取率 B. 人均钢产量 C. 轻重工业比例 D. 人均国民收入 16.对全市科技人员进行调查,每位科技人员是总体单位,科技人员的职称是 ( )。 A. 品质标志 B. 变量 C. 变量值 D. 标志值 17. 18.某学生某门课成绩为80分,则该成绩是( )。 A. 品质标志 B. 数量标志 C. 变量 D. 指标 1.设2000~2004年各年的环比增长速度为6%、7%、8%、9%和10%,则平均增长速度为 ( )。 A. B. C.

统计学重点知识点

基本统计方法 第一章 概论 1. 总体(Population ):根据研究目的确定的同质对象的全体(集合);样本(Sample ):从总体中随机抽取的部分具有代表性的研究对象。 2. 参数(Parameter ):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表示,是固定的常数;统计量(Statistic ):反映样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。 3. 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。 第二章 计量资料统计描述 1. 集中趋势:均数(算术、几何)、中位数、众数 2. 离散趋势:极差、四分位间距(QR =P 75-P 25)、标准差(或方差)、变异系数(CV ) 3. 正态分布特征:①X 轴上方关于X =μ对称的钟形曲线;②X =μ时,f(X)取得最大值;③有两个参数,位置参数μ和形态参数σ;④曲线下面积为1,区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。 4. 医学参考值范围的制定方法:正态近似法:/2X u S α±;百分位数法: P 2.5-P 97.5。

第三章 总体均数估计和假设检验 1. 抽样误差(Sampling Error ):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。抽样误差不可避免,产生的根本原因是生物个体的变异性。 2. 均数的标准误(Standard error of Mean, SEM ):样本均数的标准差,计算公式: X σσ=误差的大小。 3. 降低抽样误差的途径有:①通过增加样本含量n ;②通过设计减少S 。 4. t 分布特征: ①单峰分布,以0为中心,左右对称; ②形态取决于自由度ν,ν越小,t 值越分散,t 分布的峰部越矮而尾部翘得越高; ③当ν逼近∞,X S 逼近X σ, t 分布逼近u 分布,故标准正态分布是t 分布的特例。 5. 置信区间(Confidence Interval , CI ):按预先给定的概率(1-α)确定的包含总体参数的一个范围,计算公式:/2,X X t S αν±或/2,X X u S αν±。95%CI 含义:从固定样本含量的已知总体中进行重复抽样试验,根据每个样本可得到一个置信区间,则平均有95%的置信区间包含了总体参数。 6. 假设检验的基本原理:小概率反证法的思想。 ①反证法:从问题的对立面(H 0)出发间接判断要解决的问题(H 1)

《统计学基础知识》试题答案

《统计学基础知识》试题答案 一、单项选择题(以下每小题各有四项备选答案,其中只有一项是正确的。本题共40分,每小题1分。) 1(统计调查方案中的调查工作期限是指( )。 A(调查工作的起止时间 B(搜集资料的时间 C(时期现象资料所属的时间 D(时点现象资料所属的时间 2(有意识地选择几个城乡结合部地区调查外来流动人口在本市的生活状况,这种调查方式属于( )。 A(典型调查 B(重点调查 C(抽样调查 D(普查 3(对职工的生活水平状况进行分组研究,正确地选择分组标志应当用( )。 A(职工月工资总额 B(职工人均月收入额 C(职工家庭成员平均月收入额 D(职工的人均月岗位津贴及奖金数额 4(次数分布中的次数是指( )。 A(划分各组的数量标志 B(分组的组数 C(分布在各组的总体单位数 D(标志变异个数 5(某连续变量分为5组:第一组为40~50,第二组为50~60,第三组为60~70,第四组为70~80,第五组为80以上。依习惯上规定( )。 A(50在第一组,70在第四组 B(60在第二组,80在第五组

C(70在第四组,80在第五组 D(50在第二组,80在第四组 6(一个开口组距数列最大组的下限为600以上,其相邻组的下限为400,则该数列最大组的组中值应为( )。 A(500 B(650 C(700 D(800 7(时点指标的数值( )。 A(与其时间间隔长短无关 B(通常连续登记 C(时间间隔越长,指标数值越大 D(具有可加性 8(一个企业产品销售收入计划增长5,,实际增长9,,则计划超额完成程度为( )。 A(4, B(180, C(103.81, D(3.81, 9(将不同地区、部门、单位之间同类指标进行对比所得的综合指标称为( )。 A(动态相对指标 B(结构相对指标 C(比例相对指标 D(比较相对指标 10(两个总体的平均数相等,标准差不等,若比较两总体平均数的代表性,以下说法正确的是( )。 A(标准差大的,代表性大 B(标准差小的,代表性大 C(标准差小的,代表性小 D(两平均数的代表性相同 11(加权算术平均数中权数的实质是( )。 A(各组的单位数 B(总体单位数 C(各组的单位数占总体单位数的比重

统计学基础知识考试重点

统计学基础知识考试重点 第一章统计和数据 第二章 ●统计是用来处理数据的,是关于数据的一门学问。 1、统计学:是用以收集数据、分析数据和由数据得出结论的一组概念、原则和方法。 2、统计分析数据的方法分为:(1)描述统计(2)推断统计 3、描述统计:是研究数据搜集、处理和描述的统计学方法。 4、推断统计:是研究如何利用样本数据来推断总体特征的统计学方法。 5、推断统计包括:(1)参数估计(2)假设检验 6、定性变量的特点: 只反映现象的属性特点,不能说明具体量的大小和差异。 ●定性变量包括分类变量和顺序变量。 ●只反映现象分类特征的变量称分类变量。分类变量没有数值特征,所以不能对其数据进行数学运算。 ●如果类别具有一定的顺序,这样的变量称为顺序变量。顺序变量不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。 7、定量变量的特点: 可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异。 ●数值型数据(定量数据)作为统计研究的主要资料,其特征在于它们都是以数值的形式出现的,有些数值型数据只可以计算数据之间的绝对差,而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差。其计量精度远远高于定性数据。在统计学研究中,数值型数据有着最广泛的用途。 8、数据按获取的方法不同分为:(1)观测数据(2)实验数据 9、观测数据:是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。 10、实验数据:一般是在科学实验环境下取得的数据。 11、统计数据资料的来源: (1)通过直接的调查或实验获得的原始数据,这是统计数据的直接来源; (2)别人调查的间接数据,并将这些数据进行加工和汇总后公布的数据,这是数据的间接来源。 12、数据的直接来源:(1)统计调查(2)实验法 ●通过统计调查得到的数据,一般称为观测数据。 ●运用实验法时,实验组和对照组的产生应当是随机的。 13、数据的间接来源:

统计学基础模拟试题B卷答案

)

A.样本单位数 B.估计值 C.抽样误差范围 D.概率保证程度 D.抽样平均误差 4.指出下面的数列那些属于时点数列( ADE)。 A.某种股票周一至周五隔天的收盘价 B.某工厂个月份的利润额 C.某地区2005-2009年的各年平均人口数 D.某商店各月末的商品库存额 E.某企业2005年-2009年年末固定资产净值 三、判断题 1.统计一词包含统计工作、统计资料、统计学等三种含义。(√) 2.调查单位和填报单位在任何情况下都不一致。(×) 3.统计分组的关键问题是确定分组标志。(√) 4.置信概率表达了区间估计的可靠性。(√) 5.如果变量X的数量减少,变量Y的数值也随之减少,则称两个变量为负相关。(×) 四、填空题 1.统计指标按其反映的数量特点不同可以分为数量指标和质量指标。 2.统计调查根据被研究总体的范围分为全面调查和非全面调查。 3.在对数据进行分组时,如果将一个变量值作为一组称为单项式分组;如果把某一区间的变量值作为一组则称为组距式分组。 4.总量指标按其反映现象总体内容的不同可分为总体单位总量和总体标志总量。 5.总指数的计算方法有综合指数和平均数指数两种。 五、简答题 1.调查对象、调查单位和填报单位有何区别? 答: 调查对象是应搜集其资料的许多单位的总体; 调查单位是构成调查对象的每一个单位,它是进行登记的标志的承担者; 报告单位也就填报单位,它是提交调查资料的单位,一般是基层企事业组织。 2.一般情况下,怎样根据经济内容确定综合指数中同度量因素的所属时期? 答: (1)编制质量指标综合指数,作为同度量因素的数量指标固定在计算期上。 (2)编制数量指标综合指标,作为同度量因素的质量指标固定在基期上。 (3)上述确定方法不是固定不变的。

统计学贾俊平考研知识点总结

统计学重点笔记 第一章导论 一、比较描述统计和推断统计: 数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。 (1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。 (2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。 (3)两者的关系:描述统计是基础,推断统计是主体 二、比较分类数据、顺序数据和数值型数据: 根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。 (1)分类数据是只能归于某一类别的非数字型数据。它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。 (2)顺序数量是只能归于某一有序类别的非数字型数据。也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。 (3)数值型数据是按数字尺度测量的观察值。其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。 总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。 三、比较总体、样本、参数、统计量和变量: (1)总体是包含所研究的全部个体的集合。通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。总体根据其所包含的单位数目是否可数可以分为有限总体和无限总体。有限总体是指总体的范围能够明确确定,而且元素的数目是有限可数的,需要注意的是,统计意义上的总体,通常不是一群人或一些物品的集合,而是一组观测数据。 (2)样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量。例如我们从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。

统计学基础练习题

统计学基础(练习题三) 一、单项选择题 1.已知两个总体平均数不等,但标准差相等,则() A、平均数大,代表性大 B、平均数小,代表性大 C、平均数大,代表性小 D、以上都不对 2.标准差指标数值越小,则反映变量值() A、越分散,平均数代表性越低 B、越集中,平均数代表性越高 C、越分散,平均数代表性越高 D、越集中,平均数代表性越低 3.某企业生产的一种零部件要经过两道工序才能完成,第一道工序的合格率为81%,第二道工序的合格率为64%,则该零部件的平均合格率为() A、72.5% B、81% C、64% D、72% 4.下列标志变异指标中易受极端值影响的是() A、全距 B、平均差 C、标准差 D标准差系数 5.平均数是对() A、总体单位数的平均 B、变量值的平均 C、标志的平均 D、变异的平均 6.下列标志变异指标中易受极端值影响的是() A、全距 B、平均差 C、标准差 D、标准差系数 7.已知两个总体平均数不等,但标准差相等,则() A、平均数大,代表性大 B、平均数小,代表性大 C、平均数大,代表性小 D、以上都对 8.不能全面反映总体各单位标志值变异程度的标志变异指标是() A、全距 B、平均差 C、标准差 D、标准差系数 9.平均差与标准差的主要区别在于() A、计算条件不同 B、指标意义不同 C、数学处理方法不同 D、计算结果不同 10. 在标志变异指标中,能相对反映总体各单位标志值变异程度的指标是() A、平均差 B、标准差 C、全距 D、离散系数 11. 若两数列平均水平不同,在比较两数列离散程度时,应采用() A、全距 B、平均差 C、标准差 D、标准差系数 12.平均数是对() A、总体单位数的平均 B、变量值的平均 C、标志的平均 D、变异的平均13.下列标志变异指标中易受极端值影响的是() A、全距 B、平均差 C、标准差 D、标准差系数

统计学知识点的总结

1、统计的含义 (1)统计工作:即统计实践,是指很据科学的方法从事统计设计、收集、整理、分析研究和提供各种统计资料和统计咨询意见的活动的总称。其成果是统计资料(原始调查资料和加工处理后的系统资料); (2)统计资料:即统计工作过程中所获得的各种有关数字资料以及与之相关的其他资料的总称。通常以统计表、统计图和统计报告的形式变现,用以反映社会经济现象的规模、水平、速度、结构和比例关系等信息的数字和文字资料; (3)统计科学:即统计理论,是指统计工作实践的理论概括和科学总结。 2、统计学 统计学:是一门搜集、整理、分析数据方法的科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。 3、统计学的研究对象 统计学研究的对象是:社会经济现象总体的数量特征和数量关系。 其根本特征:在质与量的辩证统一中,研究大量社会经济现象总体的数量方面,反映社会现象发展变化的规律性在具体时间、地点和条件下的数量表现,揭示事物的本质、相互联系、变动规律和发展趋势。 4、统计学研究特点 数量性、总体性、具体性、社会性 5、统计工作的过程及基本职能 统计工作的过程:统计设计、统计调查、统计整理、统计分析(定性—定量—定性:循环往复) 统计设计:指根据统计研究对象的特点和研究的目的、任务,对统计工作的各个方面和各个环节的通盘考虑和安排,是统计认识过程的第一个阶段,即定性认识的阶段; 统计调查:指根据统计研究对象和目的要求,依据统计设计的内容、指标和指标体系的要求,有计划、有目的、有组织的收集原始资料的工作过程,即由定性到定量认识的阶段;统计整理:指根据统计研究的目的,将统计调查得到的原始资料和通过各种方法得到的次级资料进行科学的分类和汇总,使其条理化、系统化的工作过程,即为统计分析准备在一定程度上可以反映总体特征的统计资料; 统计分析:指在统计整理的基础上,根据研究的目的和任务,应用各种科学的统计方法,从静态和动态两个方面对研究对象的数量方面进行计算、分析研究,认识和揭示所研究对象的本质和规律性,做出科学的结论,进而提出建议和可预测性的意见的工作过程,即从定量到定性深入认识的阶段。 统计工作的基本职能:信息、咨询、监督 6、统计学研究的基本方法 大量观察法、统计分组法、综合指标法、时间数列分析法、指数法、抽样推断法、相关分析法。 7、统计学的基本概念 (1)总体:指客观存在的,有性质相同的许多个别事物组成的整体; (2)总体单位:指组成总体的许多性质相同的个别事物,简称单位/个体; (3)标志:用于说明总体单位特征的名称或概念,有数量标志和品质标志之分; (4)标志表现:标志特征在各单位的具体体现,数量标志表现为具体的数值,品质标志表现为对特征加以描述的文字; (5)统计指标:用于说明总体数量特征的名称或概念及数值:一个完整的统计指标包括指标名称、指标数值、指标计量单位、计算方法、指标所属的时间和空间等因素;

相关文档