文档视界 最新最全的文档下载
当前位置:文档视界 › 统计学的领域

统计学的领域

统计学的领域
统计学的领域

注:本文是为中国人民大学统计学院本科院刊所写的稿件。走过了四年本科,觉得应该对后来人讲一些负责人的话,以使大家能更高效地学习。我认为人生的奋斗,怕的不是没有动力,而是有动力却不知道方向。因此,我把我所了解的统计学的领域介绍给大家,让大家早日了解一下统计学的基本内容,早日找到自己的方向。当然,仅仅四年的学习,得出的观点或多或少会浅薄,所以也请各位大师多多指点批评。

统计学的领域

——写给在统计学院学习的学弟学妹

如果学了几年统计,还连统计的那个经典定义都背不出就不应该了,在此我不再啰嗦一遍。统计学也不是什么神秘的学科,它的目的主要是通过数据探索信息,因此也就相应有一系列的流程:收集、整理、分析和表述(数据)。

按照这个流程,统计下属的众多学科的地位与作用也就一目了然。今日我取标题为“统计学的领域”,说实话这个题目有些狂妄。够资格写这种题目的人,恐怕至少应该在统计学界混过数十载。

不幸的是,本人一向提倡“人不猖狂枉少年”。如果没有足够的热情和斗志,是不可能取得一番成就的。正值青春年少,安能不立鸿鹄之志?此为题外话。

1、收集数据

一般来说,数据的来源无非是试验和调查。平时我们谈统计学似乎不太注重数据的收集问题,然而试验设计和调查技术(包括抽样等)都是很有用的学问。就我们这种纯粹的统计学院来说,试验设计的地位似乎不太高,而我所了解的生物统计、医学统计等领域对它的要求却特别高,有志于生物医学统计方向的同学一定要注意研究这门课,有些名词诸如正交设计、随机区组试验、拉丁方试验等都是你们将来会遇见的,方差分析一般则是试验设计之后最基本的统计分析方法;对于调查,一方面它是由统计学的理论作背景支撑的(大数定律、数理统计、抽样理论等),另一方面涉及到实务操作方面的技术,做过调查的同学应该都了解调查的“艰辛”,当然如果有统计学的指导,我们也会发现一些让人变聪明的技术,举个例子,对于吸毒问题,受众(调查客体)一般都会低报(不愿意告诉访员自己吸毒),对于这种情况我们该怎么处理?暂且把悬念留在这里;如果事先不知道答案,恐怕是很难想象这件事情与抛硬币有任何瓜葛的。

对于我们这个统计学院(素以经济统计强势著称),从收集数据角度来说,国民经济核算与经济社会统计也是两门比较重要的课程,搞经济统计不能不对于经济数据的来龙去脉了如指掌,要不然统计指标都是从何计算而来有何意义都搞不清楚,还从何谈起经济统计?

2、整理数据

数据不是说收集上来就可以马上作分析,有实践经验的人都知道,在收集数据的过程中,总会有各种意想不到的情况发生,但也是天要下雨娘要嫁人没办法的事情,你总不能把那些

在问卷上偷懒空着不填或者乱填一气的同志们抓来严刑拷打。在此我有必要提醒各位,一定要做好心理准备,无论你们在学校里老师教授给你们多完美的理论,到现实中往往会四处碰壁的。空着调查项目不填写的我们称之为缺失值(Missing Value),胡乱填写的可能成为离群点或野值(Outlier),对于这样的数据,我们应该事先做一些处理才能进行下一步的统计分析,不然会对统计结果产生一些不良影响,这些道理用脚趾头想想就能明白(都用不着用膝盖想)。当然数据的整理还包括很多其它内容,诸如重新编码(Recode)或者进行某种综合计算等等,这里不详谈,因为都是很陈旧的内容了。我想把我所知道的统计学中比较近代的技术介绍给大家,让大家对我们的前沿知识有所了解。关于缺失值的处理,目前已经发展起来比较完备的插补技术(Imputation),这里面包括均值插补、热平台插补、冷平台插补、最近邻插补、EM算法、Bootstrap、Jackknife、MCMC(Monte-Carlo Markov Chain)等知识。相信如果大家看看近代现代统计学的发展,这些名词一定不会陌生。对于数据中的离群点,也要先思考一下,不要轻易删除,一个穷山村中冒出一个大富翁的可能性不一定就是0,在离群点中反而有可能隐藏对我们有启发的信息(比如一位同学的学分绩太高以至于成了“野值”,我们就不能把他/她从班里“删除”,而应该借鉴学习经验)。

3、分析数据

不可否认,当今社会对于统计的需求,大部分都在于这一块。数理统计的纸老虎会让很多数学功底不好的同志望而却步,再加上统计中众多术语如P值、置信区间、卡方统计量等又会让很多人觉得费解(曾经有一次我给一位同志解释了好半天X与Y两个变量的相关系数对方死活就不明白,我疯了),如果再来一些稍微前沿一些的统计分析方法例如结构方程模型什么的,他们更是会云里雾里找不着北,然而来自统计分析的打击似乎是无穷尽的,他们最后发现统计软件也不太会用,要花很多钱购买,更可怕的还都是英文的……我琢磨着,他们一定心想,苍天呐,如果还有来生,我……一定要学统计……

作为统计人也不要太得意,首先统计分析方法你不一定会用,其次即使你会用也未必能用对地方。这个领域我几乎已经无法介绍,因为数百年的发展,让统计方法扩充得让人很难概括全面了。最简单的分类莫过于描述统计与推断统计了(事实上按照C. R. Rao书中写的,还应该包括探索性统计分析);描述统计大家应该都懂,数据是什么就是什么,在原始数据的基础上稍作加工,提炼一下信息,让人对一个数据集(样本)在心中有一个大致的了解,比如一国的GDP,国家统计局不可能每年都向人民群众公布张三家的鸡下蛋买了多少钱以及某红星工厂钢铁年产值多少钱,等等,而是公布一个总数,让大家对我国的国力有大致的了解;推断统计就需要用到一些比较精深的统计理论了,最重要的支撑莫过于数理统计,所以这门课大家也一定要学好,要知道相比起数学系的数学课,数理统计根本就没什么难度。推断统计中,根据是否需要对分布作假设又可以分为参数统计和非参数统计,后者出现的年代要晚,因此在理论和应用方面可能不如前者,二者的比较又足以写一大篇文章,此处作罢,但是无论如何,从参数统计到非参数统计,你的统计思维必将经历一个重大转变,如果学得够深入,你甚至可以由此联想人生得失问题;不是和大家开玩笑,有时候统计确实能为我们展现一种人生观。

相关的名词恐怕也不是一两页纸能列举完的:相关分析(包括典型相关分析)、回归分析(包括投影寻踪回归、分位数回归)、对应分析、信度分析、生存分析、聚类分析、判别分析、因子分析、路径分析和主成分分析等。如果你至今还只知道普通最小二乘法(OLS)而不知道偏最小二乘法(PLS)这样的名词,那只能说明你还在一个古董世界徘徊,需要加

把劲了。

关于数据分析方法,当然首先要打好基础,掌握那些基本方法,若想在方法领域有所造诣,那么请回家把概率论与数理统计多翻几遍,然后开始啃国外的教材以及文章。我常常遇到这种情况,就是一种方法,我看国外最早的论文是二十世纪六七十年代的,而国内最早的论文则往往已经是二十一世纪了。可以看出,国内在方法上的研究与国外的差距有多大。聪明人会从这里发现一个“市场”,我就不诱导大家了,这对于国内统计学的长远发展不太有利。

还有一点,也是要提醒大家切记,统计分析方法往往都有理论假设或前提,在实际应用时,务必务必要注意!首先要检查数据是否满足我们的理论条件,不要拿来就作分析,即使统计软件会“不假思索”地给你输出漂亮的结果。(统计软件有时候挺害人的,不要完全相信它们)

4、表述数据

我认为世上不存在不懒的人,因此数据的表述一定也是一门学问。你要是把统计软件输出的P值活生生拿给别人看,八成会被殴;你要是胆敢告诉人家聚类分析碎石图上石头的位置表示特征根的大小,被扁的概率将一致趋近于1。

统计是用来说明问题的,不是用来吓唬人的。把我们的分析结果表述给人家看,就需要经过一定的“转化”。不要轻视数据的表述问题,有些统计方法之所以能“红”起来,就是因为人们为它的分析结果找到了巧妙的解释。

上面说的是统计学方面的表述,外观形式方面的问题同样应该注意。表格中的数据不使用右对齐(或小数点对齐)、图形画得花里胡哨或土里土气,都会让统计的功效受损,虽然只是“面子问题”。学了那么长时间的统计,不应该不知道图的标题应该写在图下方而表的标题应该写在表上方,平时看文章多注意别人是怎样表达的。

好了,统计学本身就从流程上介绍到这里。稍微再谈谈我所见到的统计学发展趋势:一方面是学科结合的趋势,单单只会一门统计学恐已难以立足,统计学的发展动力,越来越多地来自于其它各个学科,若不是这些学科给统计学“出难题”,统计学的发展可能早已经停止了,医学会问你,怎样设计试验既能得出显著的统计结果又能节约成本?心理学会问你,人的情商是一个隐变量,应该怎样测量?金融学会问你,股票市场上时序数据的异方差怎样处理?市场营销学会问你,怎样从超市的海量数据中挖掘出有用的商品信息?法学会问你,某甲杀人的概率有多大?新闻传播学会问你,大众对某位候选者的真实支持率有多高?等等……;另一方面是计算机的广泛应用趋势,我也要特别强调,计算机在未来的统计中必将扮演越来越重要的角色,想要摇着笔杆子去追赶奔四3.2绝对是不可能了,计算机方面又尤其要数编程能力最重要,这番话是对那些想冲到统计时代前沿的同学们说的,统计方法的发展太快,以至于很多统计软件都跟不上,因此,若自己掌握计算机编程技术的话就能不必受到统计软件的制约。

我在中国人民大学统计学院已经学习了四年,感触颇多,牢骚也不少。生活方面不多说,大家最好早点学会自强自立,早已经过了18岁,有空听听郑智化的《水手》。

学习方面说这样几点吧:

首先,不要指望你的老师会教给你所有的知识,同时也要明白你所学的知识是很不全面的。大学与高中不一样,这里不是一个纯粹的教学的地方,更多地是思想碰撞交流的地方。如果到现在你还在上课时埋头认真地把老师说的每一个字记下来,那么你可能还没理解什么叫大学。统计学纷繁芜杂的体系,不是老师在几节课上能讲出来的。老师可以告诉你,统计学都有什么内容,剩下的就是你自己多多努力奋斗。

其次,攻书莫畏难。可能这也是大学与高中的区别之一,高中某一道题不会做可能会影响你的考试成绩,而大学则不是用来为难人的地方。此路不通可以走彼路,你若不擅长积分,那么对于书中证明用到积分的地方大可不必仔细看,总之要有自己擅长的地方,然后注意培养自己的优势,以最快的速度向前发展。不过话说回来,不要被我误导,我不是说可以随意放弃一些课程,基础仍然是要打好的,在这个条件下,你可以选择自己擅长的方向发展。

再次,不要忽视图书馆的丰富资源,不仅包括图书,而且还有大量电子资源,注意上网看看,学校都购买了大量的论文数据库,不用实在可惜了。里面的统计刊物可以趁早接触一些,对于论文写作以及知识面的拓展是很有好处的。

最后,不要惧怕高年级的学长们,他们都知道吃人是犯法的,因此大可放心去请教、取经,让自己少走一些弯路。只可惜,当年没有学长对我这样说,以至于我一直惧怕学长会吃了我……

还有,一定要用好英语。(我可没告诉你们要考好英语)

以及,不要没日没夜地上自习。(当然也别像我从不上自习)

对了,上网别总聊QQ,以后发财了有的是时间聊,现在有空多来我们的“统计之都”网站看看:https://www.docsj.com/doc/ef10364505.html,

一死生为虚诞,齐彭殇为妄作。各位加油。

下载全文:谢益辉:Domain of Statistics>>>

统计学经典题库与答案

2. 数据筛选的主要目的是( A 、发现数据的错误 C 、找出所需要的某类数据 3. 为了调查某校学生的购书费用支出, B 、对数据进行排序 D 纠正数据中的错误 将全校学生的名单按拼音顺序排列后,每 ) A H 0:二=0.15;二-0.15 B H o :二二 0.15;二=0.15 C H 0: 一 - 0.15;二:: 0.15 D H 0:二乞 0.15;二 0.15 9. 若甲单位的平均数比乙单位的平均数小, 大,则( )。 A 、甲单位的平均数代表性比较大 C 甲单位的平均数代表性比较小 10. 某组的向上累计次数表明( A 、 大于该组上限的次数是多少 B 、 小于该组下限的次数是多少 但甲单位的标准差比乙单位的标准差 B 、两单位的平均数一样大 D 、无法判断 1.当正态总体方差未知时,在大样本条件下,估计总体均值使用的分布是 ( A )。 z 分布 B 、t 分布 F 分布 D 、 2 分布 A 、比平均数高出2个标准差 C 等于2倍的平均数 D 5.峰态通常是与标准正态分布相比较而言的。 则峰态系数的值( )。 B 比平均数低2个标准差 等于2倍的标准差 如果一组数据服从标准正态分布, A =3 C 、v 3 6. 若相关系数r=0,则表明两个变量之间( A 、相关程度很低 C 不存在任何关系 7. 如果所有变量值的频数都减少为原来的 1/3, 均数( )。 A 、不变 B C 减少为原来的1/3 D > 3, =0 )。 不存在线性相关关系 存在非线性相关关系 而变量值仍然不变,那么算术平 扩大到原来的3倍 不能预测其变化 8. 某贫困地区所估计营养不良的人高达 15%然而有人认为这个比例实际上还要 高,要检验该说法是否正确,则假设形式为( )。 隔50名学生抽取一名进行调查,这种调查方式是( A 、简单随机抽样 B 、分层抽样 C 、系统抽样 D 、整群抽样 4. 如果一组数据标准分数是(-2 ),表明该数据( )。

统计学简答题及答案

统计学简答题及参考答案 1.简述描述统计学的概念、研究容与目的。 概念:它是研究数据收集、整理和描述的统计学分支。 研究容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。 研究目的:描述数据的特征;找出数据的基本数量规律。 2.简述推断统计学的概念、研究容与目的。 概念:它是研究如何利用样本数据来推断总体特征的统计学分支。 研究容:参数估计和假设检验的理论与方法。 研究目的:对总体特征作出统计推断。 3.什么是总体和样本? 总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。 可分为有限总体和无限总体: ?有限总体的围能够明确确定,且元素的数目是有限的,可数的。 ?无限总体所包括的元素数目是无限的,不可数的。 总体单位数可用N表示。 样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量,记为n。 4.什么是普查?它有哪些特点? 普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它有以下的特点: 1)通常是一次性或周期性的 2)一般需要规定统一的标准调查时间 3)数据的规化程度较高 4)应用围比较狭窄。 5.什么是抽样调查?它有哪些特点? 抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。 它具有经济性好、时效性强、适应面广、准确性高等特点。 6.简述统计调查方案的概念及应包括的基本容。 答:统计调查方案就是统计调查前所制订的实施计划,它是指导整个调查过程的纲领性文件,是保证调查工作有计划、有组织、有系统地进行的计划书。 它应包括的基本容有: 〈1〉明确调查目的; 〈2〉确定调查对象和调查单位; 〈3〉设计调查项目; 〈4〉设计调查表格和问卷; 〈5〉确定调查时间; 〈6〉组织实施调查计划; 〈7〉调查报告的撰写,等等。 7.简述统计分组的概念、原则和具体方法。 答:(1)概念

统计学简答题完整版

一、统计的含义和本质是什么P2 含义:“统计”一词可以有三种含义:统计活动、统计数据和统计学。统计活动是对各种统计数据进行搜集、整理并做出相应的推断、分析的活动,通常被划分为统计调查、统计整理和统计分析三个阶段;统计数据是通过统计活动获得的、用以表现研究现象特征的各种形式的数据;统计学则是指导统计活动的理论和方法,是关于如何搜集、整理和分析统计数据的科学。 本质:统计的本质就是关于为何统计,统计什么和如何统计的思想。 二、统计数据有哪些分类不同类型数据有什么不同特点P7 1.统计数据按照所采用的计量尺度不同,可以分为定性数据与定量数据。定性数据是指只能用文字或数字代码来表现事物的品质特征或属性特征的数据,具体又分为定类数据与定序数据两种。定量数据是指用数值来表现事物数量特征的数据,具体又分为定距数据与定比数据两种。 2.统计数据按照其表现形式不同,可以分为绝对数、相对数和平均数。绝对数是用以反映现象或事物绝对数量特征的数据,有明确的计量单位。相对数是用以反映现象或事物相对数量特征的数据,它通过另外两个相关统计数据的对比来体现联系关系。平均数是用以反映现象或事物平均数量特征的数据,体现现象某一方面的一般数量水平。 3.统计数据按照其来源不同,可以分为观测数据与实验数据两类。观测数据是通过统计调查或观测的方式而获取的反映研究现象客观存在的数量特征的数据。实验数据是在人为控制的条件下,通过实验的方式而获得的关于实验对象的数据。 4.统计数据按照其加工程度不同,可以分为原始数据与次级数据两类。原始数据是指直接向调查对象搜集的、尚待加工整理、只反映个体特征的数据。次级数据也称为加工数据或二手数据,是指已经经过加工整理、能反映总体数量特征的各种非原始数据。 5.统计数据按照其时间或空间状态不同,可以分为时序数据与截面数据。时序数据是对同一现象在不同时间上搜集到的数据(即空间状态相同,时间状态不同)。截面数据是对一些同类现象在相同或近似相同的时间上搜集到的数据(即空间状态不同,时间状态相同)。 三、总体和样本概念以及它们之间的关系如何P14 概念:总体,就是统计研究的客观对象的全体,是由所有具有某种共同性质的事物所组成的集合体。样本,就是从总体中抽取的一部分个体所组成的集合。 关系:1.总体是所要研究的对象,而样本则是所要观测的对象,样本是总体的代表和缩影。 2.样本是用来推断总体的。对样本进行观测的目的是要对总体数量特征做出估计或判断,即通常所说的以样本推断总体。 3.总体和样本的角色是可以改变。随着考察角度的改变,一定的研究总体也可成为另一意义上总体的一个样本,这说明总体与样本的角色是可以改变的。 四、标志和指标之间的关系如何P17 区别:1.指标和标志说明的对象不同,指标说明总体的特征,标志则说明个体的特征。 2.指标和标志的表现形式不同,指标是用数值来表现的,而标志则既有只能用文字来表现的品质标志,又有用数值来表现的数量标志。 联系:1.标志是计算统计指标的依据,即统计指标数值是根据个体的标志表现综合而来的。 2.由于总体与个体的确定是相对的、可以换位的,因而指标与标志的确定也是相对的、可以换位的。 五、统计数据收集方案包括哪些内容P25 数据收集目的(why)、数据及其类型(what type)、数据收集对象与观测单位(whom)、观测标

卫生统计学简答题汇总

统计学简答汇总 第一章:绪论(无) 第二章:定量变量的统计描述 1.均数﹑几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。 不同点:表2-5. 表2-5 均数,几何均数和中位数的相异点 平均数意义应用场合 均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布 几何均数平均增减倍数①等比资料;②对数正态分布资料 中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两 察值水平端出现不确定值 2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系? 答: 1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。 (2)计算:中位数和百分位数均可用同一公式计算,即 Px=L+(i/f x)(n·x%-Σf L) 可根据研究目的选择不同的百分位数代入公式进行计算分析。 (3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中 更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。 3.同一资料的标准差是否一定小于均数? 答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。 变异大,标准差就大,有时比均数大;变异小,标准差小。 4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些? (1)样本含量的大小,样本含量越大,标准差越稳定。 (2)分组的多少 (3)分布形状的影响,偏态分布的标准差较近似正态分布大 (4)随机测量误差大小的影响 (5)研究总体中观察值之间变异程度大小 5.标准差与变异系数的异同点有哪些? 答:标准差:是以算数平均数为中心,反映各观测值离散程度的一个绝对指标.当需要对同一总体不同时期或对不同总体进行对比时,缺乏可比性.当总体平均水平不同或计量单位不同时,用标准差是无法实现两组数据离散程度大小对比的. 变异系数:标准差与平均数的比值称为变异系数,记为C·V.变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。 6.如何表达一批计量数据的基本特征? 答:从集中趋势和离散趋势两方面回答。 7. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况? 答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系

统计学简答题整理

统计学简答题整理 第一章P11 1.获取直接统计数据的渠道主要有哪些?及区别在于? 普查、抽样调查 普查是为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。花费的时间、人力、财力和物力都较大,间隔的时间较长。而两次普查之间的年份以抽样调查方法获得连续的统计数据。 抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法。存在着由样本推断总体产生的抽样误差,但统计方法可以估计出误差的大小进一步控制误差;节省人力、财力、物力,又能保证实效性 2.简要说明抽样误差和非抽样误差。 非抽样误差是由于调查过程中各有关环节工作失误造成的。(它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差,还有一种人为干扰造成的误差即有意瞒报或低报数据等)。非抽样误差在普查、抽样调查中都有可能发生,但可以避免。 抽样误差是利用样本推断总体时产生的误差。(由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的。但可计量、可控制)。抽样误差与样本量的平方根成反比关系。 第二章P51

1.统计的计量尺度 ①列名尺度(定类尺度):是按照某一品质标志将总体分组之后,对属性相同的单位进行计量的方法。各组之间的关系是并列的,没有大小、高低、先后之别。 ②顺序尺度(定序尺度):是按照某一品质标志将总体分组,对等级相同的单位进行计量的方法。各组之间的关系是有顺序的,可以进行排序。 ③间隔尺度(也称定距尺度):是按某一数量标志将总体分组,对相同数量或相同数量范围的单位或其标志值进行计量的方法。其特点是不仅可以进行排序,还可以计算不同数值之间的绝对差距。 ④比例尺度(也称定比尺度):是类似于间隔尺度,又高于间隔尺度的计量方法。其特点是不仅可计算数值的绝对差异,还可以计算数值的相对差异。 2.简述统计分组的概念和作用。 概念:统计分组是根据统计研究目的,选择一定的分组标志,将总体划分为若干组的统计方法。其目的是使组与组有明显差别,同一组中具有相对的同质性。(例:人口按性别、年龄、民族、职业分组;企业按规模分为大型、中型和小型。) 作用:1.划分社会经济现象的类型 2.反映总体的内部结构 3.分析现象之间的依存关系 3.简述众数、中位数和均值的特点与应用场合。 众数是总体中出现次数最多的标志值。反映了标志值分布的集中趋势,是一种由位置决定的平均数。可以没有众数也可有两个。

统计学简答题答案资料讲解

1、什么是统计学,有哪些特点? 统计学是收集、整理、分析、解释数据并从数据中得到结论的学科。 特点:客观性~~相关性~~实用性~~科学性~~严谨性~~逻辑性~~~ 2、何谓标志,按能否用数量表示可以分为哪两种类型,分别举例说明 标志是指说明总体单位属性或特征的名称。可以分为数量标志和质量标志 品质标志:说明总体单位属性特征的名称,用文字描述。Ex:性别,名族,工种,籍贯数量标志:说明总体单位数量特征的名称,用数量表示。数量标志的具体表现称标志值。 Ex:工人的年龄,工资,工龄 3、什么是离散型变量,连续性变量?举例说明 变量:可变的数量标志和指标; 离散型变量:指变量的数值只能以计数的方法取得,(变量值只能取整数); 连续型变量:指变量的取值连续不断,(变量值能取小数)。 4、简述品质标志和数量标志的区别,并举例说明。 区别:数量标志说明的是总体的数量特征,而品质标志说明的是总体的属性特征。 5、什么是数量指标和质量指标?二者有何关系? 统计指标:反映总体数量特征的科学概念和具体数值。 注意:从理论上讲,一个完整的统计指标由两部分构成:指标名称+指标数值 例如:某地区2009年完成利税总额(指标名称)为1500(指标数值)亿元。 数量指标:用来反映现象的总规模、总水平、或工作总量的指标。其数值大小随总体的研究范围的大小而增减。 质量指标:反映客观现象的劳动效果或工作质量等事物内部数量关系的指标,其数值的大小与总体的研究范围大小无直接联系。 6、统计标志和统计指标有和联系与区别? 区别:1、标志是反映总体单位特征;指标反映总体特征。 2、指标都能用数量表示,标志只有数量标志能用数量表示; 3、标志是一个理论概念,实际应用中只有指标。 联系:1、标志与指标可以相互转化,随研究目的的转化而改变; 2、指标值一般是标志值汇总来的; 3、标志的名称常常就是指标名称。 7、制定一份完整的统计调查方案,应包括哪些内容? 1)明确调查的目的和任务 2)确定调查的对象和调查单位、 3)确定带调查项目、设计调查表或问卷 4)确定调查时间、调查地点和调查方式方法 5)制定调查的组织实施计划 8、举例说明重点调查的概念和特点 重点调查:是在调查对象范围内部选择部分重点调查单位进行的调查。 特点:调查单位少、适用于调查对象的标志值比较集中于某些单位的场合、重点调查的调查方式主要采取专门调查的组织形式(一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。);有点在于花费较少的人力物力和时间就可以获得总体的基本情况资料。 9、简述重点调查、典型调查、抽样调查的联系与区别P31 抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。

统计学原理简答题汇总

统计学原理简答题汇总 一说到统计学原理简答题,大家都会连声抱怨:好多内容要背啊,好难背啊,不过一切抱怨过后还是要继续努力。我个人觉得,统计学原理简答题还是以理解为主,只要大概意思有了,那就已经是很不错的了。 1.品质标志与数量标志有什么区别? 答:统计标志通常分为品质标志和数量标志两种。品质标志表明总体单位属性方面的特征,其标志表现只能用文字表示,如学生的性别、职工的文化程度等,品质标志不能直接汇总为统计指标,只有对其标志表现所对应的单位进行汇总综合才能形成统计指标即总体单位总量;数量标志则表明总体单位的数量特征,其标志表现用数值来表示,即标志值,如学生的成绩、职工的工资等,它们从不同方面体现出总体单位在具体时间、地点条件下运作的结果。数量标志值可直接汇总综合出数量指标。 2.举例说明统计标志与标志表现有何不同? 答:标志是总体中各单位所共同具有的某特征或属性,即标志是说明总体单位属性和特征的名称。标志表现是标志特征在各单位的具体表现,是标志的实际体现者。例如:工人的“工资”是标志,而工资为“1200”分,则是标志表现。 3.一个完整统计调查方案应包括哪些主要内容? 答:一个完整的统计调查方案包括发下主要内容:(1)确定调查目的;(2)确定调查对象和调查单位;(3)确定调查项目,拟定调查表;(4)确定调查时间和时限;(5)确定调查的组织和实施计划。 4.举例说明如何理解调查单位与填报单位的关系? 答:调查单位是调查项目的承担者,是调查对象所包含的具体单位;填报单位是负责向上提交调查资料的单位。两者在一般情况下是不一致的。例如:对工业企业生产设备进行普查时,调查单位是每一台工业生产设备,而填报单位是每一个工业企业。但调查单位和填报单位有时又是一致的。例如:对工业企业进行普查时,调查单位是每一个工业企业,而填报单位也是每一个工业企业,两者一致。 5.调查对象、调查单位和填报单位有何区别? 答:调查对象是应搜集其资料的许多单位的总体;调查单位是构成调查对象的每一个单位,它是进行登记的标志的承担者;报告单位也叫填报单位,它是提交调查资料的单位,一般是基层企事业组织。 6.简述什么是普查及普查的特点。 答:普查是专门组织的、一般用来调查属于一定时点上社会经济现象数量的全面调查。例如:人口普查、经济普查、基本生产单位普查等。 普查的特点:(1)普查是一种这连续调查。(2)普查是一种全面调查。(3)普查能解决全面统计报表不能解决的问题。(4)普查要耗费较大的人力、物力和时间,因而不能经常进行。 7.简述变量分组的种类及应用条件。 答:变量分组包括单项式分组和组距式分组。离散变量变动幅度小,分组可以选择单项式分组。如果离散变量的变动幅度较大,分组应该选择组距式分组。而对于连续变量只能用组距式分组。 8.某地区对占该地区工业增加值三分之二的10个企业进行调查,你认为这种调查方式是重点调查还是典型调查?为什么? 答:首先,从该题内容可知该地区对工业企业进行的是一种非全面调查;第二,非全面调查包括抽样调查、重点调查和典型调查。这三种非全面调查的主要区别是选择调查单位的方法不同,抽样调查是按随机原则抽选单位,重点调查是根据单位标志总量占总体标志总量的比重来确定调查单位,而典型调查是依据对总体的分析,有意识地选取调查单位。因此,

统计学简答题参考答案

统计学简答题参考答案 第一章绪论 1.什么是统计学?怎样理解统计学和统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学和统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。2.简要说明统计数据的来源。 答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。 3.简要说明抽样误差和非抽样误差。 答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。 4.解释描述统计和推断统计的概念?(P5) 答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。第二章统计数据的描述 1描述次数分配表的编制过程。 答:分二个步骤: (1)按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组和组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。 统计分组应遵循“不重不漏”原则 (2)将数据分配到各个组,统计各组的次数,编制次数分配表。 2. 一组数据的分布特征可以从哪几个方面进行测度? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。 3.怎样理解均值在统计中的地位? 答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。 4. 简述众数、中位数和均值的特点和使用场合。 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,使用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。5.为什么要计算离散系数?

统计学简答题

统计学简答题 1、统计的含义与本质是什么? (1)“统计”一词可以有三种含义:统计活动、统计数据、统计学 统计活动是对各种统计数据进行收集、整理并做出相应的推断、分析的活动,通常被划分为统计调查、统计整理、和统计分析三个阶段; 统计数据是通过统计活动获得的,用以表现研究现象特征的各种形式的数据; 统计学则是指导统计活动的理论和方法,是关于如何收集、整理和分析数据的科学。 (2)统计的本质是关于为何统计,统计什么,和如何统计的思想。 2、统计学的学科性质: 1、统计学就其研究对象而言,具有数量性、总体性和差异性的特点。统计学的研究对象是各种现象的数量方面。 2、统计学就其学科范畴而言,具有方法性、层次性和通用性的特点。 3、统计学就其研究方式而言,具有描述性和推断性的特点。 3、总体、样本、个体三者关系如何?试举例说明。 总体:就是统计研究的客观对象的全体,是由所有具有某种共同性质的事物所组成的集合体,有时也称为母体; 样本:就是从总体中抽区的一部分个体所组成集合,也称为子样;组成总体的每个个别事物就称为个体,也称为总体单位。 (1)总体与个体的关系(可变性) 总体容量随着个体数的增减可变大或变小; 随着研究目的的不同,总体中的个体可发生变化; 随着研究范围的变化,总体与个体的角色可以转换 (2)样本与总体的关系 样本是所要研究的对,而样本则是所要观测的对象,样本是总体的代表和缩影。 样本是用来推断总体的。 总体和样体的角色是可以改变的。 4、理解标志、指标、变量三者的含义?标志与指标的联系与区别? 标志是用以描述或体现个性特征的名称; 统计指标简称指标,是反映现象总体数量特征的概念及其数值; 从狭义上看,变量是指可变的数量标志;从广义上来看,变量不仅指可变的数量标志,也包括可变品质标志,因此,可变标志就是变量。 (1)标志与指标的区别:指标和标志说明的对象不同,指标说明总体的特征,标志则说明个体的特征;指标与标志的表现形式不同,指标是用数值来表现的,而标志则既能用文字来表现品质标志,也能用数字来表现数量标志。 (2)标志与指标的联系:标志是计算统计指标的依据,即统计指标数值是根据个体的标志综合表现而来的;由于总体与个体的确定是相对的,可以换位的,因而指标与标志的确定也是相对的、可以换位的;指标与标志同属于变量的范畴。 5、什么是统计指标体系?有哪些表现形式? 同一总体多个反面数量特征的、一系列相互联系的统计指标所形成的体系称为统计指标体系表现形式: 数学等式关系:若干统计指标之间可以构成一个等式关系 相互补充关系:各个指标相互配合,相互补充,从不同方面开说明现象的数量特征 相关关系:各个指标之间的存在着一定的相关关系 原因、条件和结果关系:若干指标中有的是原因,有的是条件有的则为结果

统计学简答题(完全)

简答题 1.一个完整的统计调查方案包括哪些主要内容 (1)确定调查目的。 (2)确定调查对象和调查单位。 (3)确定调查项目,拟定调查表。 (4)确定调查时间和时限。 (5)确定调查的组织和实施计划。 2.简述品质标志与数量标志的区别。 品质标志表明总体单位属性方面的特征,其标志表现只能用文字来表示。 品质标志本身不能直接汇总为统计指标,只能对其标志表现所对应的单位进行汇总综合才能形成统计指标即总体单位总量。 数量标志表明总体单位数量方面的特征,其标志表现可用数值表示,即标志值。 数量标志值可直接汇总综合出数量指标。 3.时期指标有什么特点 (1)时期指标的数值是连续计数的,表示现象在一段时期内发生的总量; (2)时期指标具有累加性; (3)时期指标数值的大小与时间长短直接相关,时期越长,时期指标数值就越大。 4.影响抽样平均误差的因素有哪些 (1)总体各单位标志的变动程度(总体内部差异程度); (2)抽样单位数的多少; (3)抽样组织方式; (4)取样方法(重复抽样或不重复抽样)。 5.品质标志与质量指标有何区别和联系 区别:品质标志说明总体单位的属性特征,只有名称,没有数值;而质量指标是统计指标中的一种,是说明统计总体特征的综合性数值,由指标名称和指标数值两个部分组成。 联系:品质标志与质量指标之间本身没有直接的关系只是在进行统计分析时,可以利用按某一品质标志分组的资料,计算各组某种质量指标,研究这种质量指标在各组之间的变动规律,这时两者之间便产生了一定的联系。 6、时期指标与时点指标有何区别 (1)时期指标反映现象在一段时期内发展过程的总数量 时点指标表示现象处在某一时刻上的状态 (2)时期指标可以累计相加; 时点指标则不能 (3)时期指标数值的大小与计算时期长短有直接关系; 时点指标数值的大小与时间间隔长短没有直接关系

统计学简答题整理精编版

统计学简答题整理 GE GROUP system office room 【GEIHUA16H-GEIHUA GEIHUA8Q8-

统计学简答题整理第一章P11 1.获取直接统计数据的渠道主要有哪些及区别在于 普查、抽样调查 普查是为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。花费的时间、人力、财力和物力都较大,间隔的时间较长。而两次普查之间的年份以抽样调查方法获得连续的统计数据。 抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法。存在着由样本推断总体产生的抽样误差,但统计方法可以估计出误差的大小进一步控制误差;节省人力、财力、物力,又能保证实效性 2.简要说明抽样误差和非抽样误差。 非抽样误差是由于调查过程中各有关环节工作失误造成的。(它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差,还有一种人为干扰造成的误差即有意瞒报或低报数据等)。非抽样误差在普查、抽样调查中都有可能发生,但可以避免。

抽样误差是利用样本推断总体时产生的误差。(由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的。但可计量、可控制)。抽样误差与样本量的平方根成反比关系。 第二章P51 1.统计的计量尺度 ①列名尺度(定类尺度):是按照某一品质标志将总体分组之后,对属性相同的单位进行计量的方法。各组之间的关系是并列的,没有大小、高低、先后之别。 ②顺序尺度(定序尺度):是按照某一品质标志将总体分组,对等级相同的单位进行计量的方法。各组之间的关系是有顺序的,可以进行排序。 ③间隔尺度(也称定距尺度):是按某一数量标志将总体分组,对相同数量或相同数量范围的单位或其标志值进行计量的方法。其特点是不仅可以进行排序,还可以计算不同数值之间的绝对差距。 ④比例尺度(也称定比尺度):是类似于间隔尺度,又高于间隔尺度的计量方法。其特点是不仅可计算数值的绝对差异,还可以计算数值的相对差异。 2.简述统计分组的概念和作用。 概念:统计分组是根据统计研究目的,选择一定的分组标志,将总体划分为若干组的统计方法。其目的是使组与组有明显差别,同一组中具有相对的同质性。(例:人口按性别、年龄、民族、职业分组;企业按规模分为大型、中型和小型。)

统计学简答题

1常用的统计调查方式主要有哪些? 答:⑴统计报表。是按照国家有关法规的规定,自上而下地统一布置,自下而上地逐级提供基本统计数据的一种调查方式。⑵普查。是为特定目的而专门组织的一次性全面调查。⑶抽样调查。是从研究对象的总体中随机抽取一部分个体作为样本进行调查,并根据调查结果来推断总体数量特征的一种非全面调查方法。 2分类数据、顺序数据的整理及图示方法各有哪些? 答:对于分类数据:(1)数据的整理方法有列出所分的类别,计算每一类别的频数、频率、比例、比率等。(2)图示方法有条形图和圆形图。对于顺序数据:(1)数据的整理方法中包括所有的处理分类数据的方法,同时还可以计算累积频数和累积频率(2)图示方法包括累积分布图和环形图 3数值型数据的整理及图示方法有哪些?试述组距分组的步骤。 ⑴用频数分布表(变量数列)展示数值型数据①单变量值分组②组距分组 ⑵用图示展示数值型数据①直方图②箱线图③线图④茎叶图组距分组的步骤:①确定组数②确定各组的组距③整理成频数分布表 4误差主要包括哪两类?引起误差的原因分别是什么? 答:主要包括抽样误差和非抽样误差抽样误差:是指由样本数据对总体特征进行估计时所引起的代表性误差,原因是由于每次抽取一个样本,而样本中包含的哪些单元是随机的,不同的样本由于包含的单元不同,得到的估计值自然不同,各个估计值与总体特征之间不可避免的出现差距,由此产生了抽样误差。非抽样误差:其来源比较复杂,主要有抽样框未能不重不漏包含所有抽样单元导致的抽样框误差,调查测量不准确引致的测量误差,还有无回答误差和粗大误差。 5什么是抽样平均误差?抽样平均误差、方差和偏差的关系? 抽样平均误差是反映抽样误差一般水平的指标,它的实质含义是指抽样平均数(或成数)的标准差。即它反映了抽样指标与总体指标的平均离差程度。 6影响样本容量的主要因素有哪些? 答:(1)总体各单位标志变异程度;(2)允许误差的大小;(3)概率度的大小;(4)抽样方法不同;(5)抽样方式不同。 7什么是多重共线:多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确 8方差分析的基本原理是什么? 答:方差分析总的思想是通过计算来比较因某一特定因素带来的样本值的差异与随机偶然因素对样本值的差异的大小,从而判断该因素对总体是否有统计意义。 9简述方差分析的基本步骤? (1建立检验假设; H0:多个样本总体均值相等; H1:多个样本总体均值不相等或不全等。 检验水准为0.05。 (2计算检验统计量F值;(3确定P值并作出推断结果。 10简述方差分析和回归分析的异同? 答:方差分析主要用来研究数据分布的离散与集中,稳定与波动的情况,回归分析是通过数据的分布情况拟合出其分布规律.两者不是一回事 11简述回归方程的显著性检验与回归系数的显著性检验的区别和联系。 答:t检验常能用作检验回归方程中各个参数的显著性,而f检验则能用作检验整个回归关系的显著性。各解释变量联合起来对被解释变量有显著的线性关系,并不意味着每一个解释

统计学简答题完整版

统计学简答题 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

简答题l.获得数据的概率抽样方法有哪些 (1)简单随机抽样 简单随机抽样又称纯随机抽样,是指在特定总体的所有单位中直接抽取n个组成样本。 它最直观地体现了抽样的基本原理,是最基本的概率抽样。 (2)系统抽样 系统抽样也称等距抽样或机械抽样,是按一定的间隔距离抽取样本的方法。 (3)分层抽样 分层抽样也叫分类抽样,就是先将总体的所有单位依照一种或几种特征分为若干个子总体,每一个子总体即为一类,然后从每一类中按简单随机抽样或系统随机抽样的办法抽取一个子样本,称为分类样本,它们的集合即为总体样本。 (4)整群抽样 整群抽样又称聚类抽样或集体抽样,是将总体按照某种标准划分为一些群体,每一个群体为一个抽样单位,再用随机的方法从这些群体中抽取若干群体,并将所抽出群体中的所有个体集合为总体的样本。 (5)多阶段抽样 多阶段抽样又称多级抽样或分段抽样,就是把从总体中抽取样本的过程分成两个或多个 阶段进行的抽样方法。 2.什么是统计学统计学数据分为哪几类数据 统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 3.简述众数、中位数和平均数的特点和应用场合。 表示。它不受极端值影响,具答:众数是一组数据中出现次数最多的变量值,用M 有不唯一性。众数主要用于分类数据的集中趋势,当然也适用顺序数据和数值型数据。数据分布偏斜程度较大时应用。 表示,也不受极端值中位数是一组数据排序后处于中间位置上的变量值,用M e 影响。它将全部数据等分成两部分,一部分数据比中位数大,一部分比中位数小。主要用于测度顺序数据的集中趋势,当然也适用于数值型数据,但不适用于分类数据。数据分布偏斜程度较大时应用。 平均数是一组数据相加后除以数据的个数得到的结果,是集中趋势的最主要测度值。它易受极端值影响,数学性质优良。主要适用于数值型数据,而不适用于分类数据和顺序数据。数据对称分布或接近对称分布时应用。 4.收集数据的基本方法有哪些? 1.自填式 2.面访式 3.电话式 此外收集数据的方法还有观察式,即调查人员通过直接观测的方法获取信息。

统计学简答题答案修订

统计学简答答案 1.一组数据的分布特征可以从哪几个方面进行描述? 数据分布的特征可以从三个方面进行测度和描述: (1)分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度; (2)分布的离散程度,反映各数据远离其中心值的趋势; (3)分布的形状,反映数据分布的偏态和峰态。 2.影响样本量大小的因素有哪些?简述这些因素与样本量的关系。 (1)影响样本量大小的因素有:所要求的置信水平、总体方差和估计时所希望的估计误差。 (2)关系:其他条件不变的情况下: 1)样本量的大小与置信水平成正比。置信水平越大,所需样本量也就越大; 2)样本量与总体方差成正比。总体的差异越大,所要求的样本量也越大; 3)样本量与估计误差的平方成反比,即允许的估计误差的平方越大,所需的样本量就越小。 3.简述统计数据的类型和特点。 类型:(1)按计量尺度:分类数据、顺序数据和数值型数据; (2)按收集方法:观测数据和实验数据; (3)按被描述的现象与时间的关系:截面数据和时间序列数据。 特点:(1)按计量尺度分时:分类数据中各类别间是平等的并列关系,各类别间的顺序是可任意改变的;顺序数据的类别间是可以比较顺序的;数值型数据其结果表现为具体的数值。 (2)按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。 (3)按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。 4.在假设检验中,当不拒绝原假设时,为什么不采取“接受原假设”的表示方式? (1)在假设检验时,当拒绝原假设时,表明样本提供的证据证明它是错误的;当没有拒绝原假设时,也没法证明它是正确的。 (2)采用“接受”原假设的说法,意味着样本提供的证据证明了原假设是正确的。但由于原假设的真实值是什么并不知道,没有足够的证据拒绝原假设并不等于能够证明原假设是真的,它仅仅意味着目前我们还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设。5.什么是判定系数?它在回归分析中的主要作用是什么? (1)判定系数:回归平方和占总平方和的比例。记为R2,公式为:R2,=SSR/SST. (2)在回归分析中,R2,主要是用于测度回归直线对观测数据的拟合程度。取值范围是[0,1]。R2,越接近于1,回归直线的拟合程度就越好;R2,越接近于0,回归直线的拟合程度就越差。若所有观测点都落在直线上,R2,=1,拟合是完全的;如果R2,=0,回归直线对数据完全没有拟合。 6.解释95%的置信区间 如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。 7.说明区间估计的基本原理 区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。与点估计不同,进行区间估计时,根据样本统计量的抽样分布,可以对统计量与总体参数的接近程度给出一个概率度量。 8.测度两个分类变量相关性的统计量有哪些?他们有什么不同? 测度两个分类变量相关性的统计量有以下几个: Φ相关系数、列联相关系数(c系数)、v相关系数 (1)Φ相关系数:描述2×2列联表数据相关程度最常用的一种相关系数且Φ系数没有上限。 (2)列联相关系数(c系数):主要用于大于2×2列联表的情况且c系数小于1.

统计学简答题整理

统计学简答题 第一章 1.统计的含义和本质是什么? 统计一词包含三个含义:统计数据、统计活动和统计学。 统计的本质就是关于“为统计,统计什么和如统计”的思想,就是围绕研究目的和任务,运用科学的统计法,去获取真实客观的有关统计数据,做出必要的统计分析,以了解和认识事物的真相。 2.什么是统计学?有哪些性质? 统计学是关于如收集、整理和分析统计数据的学科。 统计学就其研究对象而言,具有数量性、总体性和差异性的特点;就其学科畴而言,具有法型、层次性和通用性的特点;就其研究式而言,具有描述性和推断性的特点。 3.总体、样本、个体三者的关系如?试举例说明。 概念:总体就是统计研究的客观对象的全体,是由所有具有某种共同性质的事物所组成的集合体,有时也称母体。样本就是从总体中抽取一部分个体所组成的集合,也称子样。组成总体的每个个别事物就称为个体,也称总体单位。 总体与个体的关系: 1.总体的容量随着个体数的增减可变大变小。 2.随着研究目的的不同,总体中的个体可以发生变化。 3.随着研究围的变化,总体和个体的角色可以变换。 样本和总体的关系: 1.总体是所要研究的对象,而样本则是所要观测的对象,样本是总体的代表和缩影。 2.样本是用来推断总体的。 3.总体和样本的角色是可以改变的。 4.如理解标志、指标、变量三者的含义?试举例说明。 标志是用于描述或体现个性特征的名称,如某人是男性,教师。 统计指标简称指标是反映现象总体数量特征的概念以及数值,如09年全国人口13亿。 从狭义上看变量是指可变的数量标志,从广义上看变量不仅指可变数量标志也包括可变的品质标志,因此可变标志就是变量。 5.什么是统计指标体系?有哪些表现形式?试举例说明。 统计指标体系是由一系列统计指标构成,但并不是单个指标的简单组合,而是各个指标之间相互联系,相互制约的。 表现形式:1.数学等式关系 2.相互补充关系 3.相关关系 4.原因、条件、结果关系 第二章 1.概率抽样和非概率抽样有什么本质区别?试举例说明。

统计学简答题

1.解释描述统计和推断统计的概念?(P5) 答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。 2.描述茎叶图和直方图,箱线图的画法,并说明它们的用途(P41、42) 答:茎叶图将数据分为“茎”和“叶”两部分,绘制茎叶图的关键是设计好树茎,通常是以该组数据的高位数值作为树茎,而且树叶上只保留该数值的最后一个数字。通过茎叶图可以看出数据的分布形状及数据的离散状况。直方图的绘制方法:在平面直角坐标系上,将分组标志作为横轴,并将各组次数作为纵轴,绘出的长方形图即直方图。通过直方图可以看出数据的分配特征。箱线图是由一个箱子和两条线段组成的。其绘制方法是:首先找出一组数据的五个特征值,即数据的最大值、最小值、中位数和两个四分位数;然后连接两个四分位数画出箱子;再将两个极值点与箱子相连接。通过箱线图可以看出数据分布的特征。 3.一组数据的分布特征可以从哪几个方面进行测度?具体有哪些测度值? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。 4.设计一张规范的统计表应该注意哪些问题? 答:1、统计表一般为横长方形,上下两端封闭且为粗线,左右两端开口。2、统计表栏目多时要编号,一般主词部分按甲、乙、丙;宾词部分按(1)(2)等次序编号。3、统计表总标题应简明扼要,符合表的内容。4、主词与宾词位置可互换。各栏排列次序应以时间先后、数量大小、空间位置等自然顺序编排。5、计量单位一般写在表的右上方或总栏标题下方。6、表内资料需要说明解释部分,如:注解、资料来源等,写在表的下方。7、填写数字资料不留空格,即在空格处划上斜线。统计表经审核后,制表人和填报单位应签名并盖章,以示负责。 5.简述众数、中位数和均值的特点及应用场合,并说明不同的分布情况下均值、众数和中位数三者之间的关系(P24-31) 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。在对称的次数分配和统计分布中,众数、中位数和均值都是同一数值。在右偏分布中,众数最小,中位数适中,均值最大。在左偏分布中,众数最大,中位数适中,均值最小。 6.简述系统抽样组织方式组织实施的基本步骤(P98) 答:在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个单位,直至抽取n个单位形成一个样本。 7.简述中心极限定理(P101) 答:在抽样推断中,中心极限定理指出,不论总体服从何种分布,只要其数学期望和方差存在,对总体进行重复抽样时,当样本容量充分大,样本均值趋近于正态分布。中心极限定理为均值的抽样推断奠定了理论基础。 8.为什么平均发展速度要用几何平均法计算,计算平均发展速度的几何平均法的特点是什么? 答:现象发展的平均速度,一般用几何平均法计算。平均速度是总速度的平均,但现象发展的总速度不等于各年发展速度之和,而等于各年环比发展速度的连乘积,所以求平均发展速度要用几何平均法。几何平均法的实质是要求从最初水平出发,按所求的平均发展速度发展,计算出的末期水平应等于实际末期水

统计学简答题答案

1.“统计”一词有哪些含义?什么就是统计学? (1)统计工作或统计实践活动:对现象的数量进行搜集、整理与分析的活动过程 (2)统计资料:通过统计实践活动取得的说明对象某种数量特征的数据 (3)统计学:就是关于数据的一门科学 统计学就是一门收集、整理、显示与分析统计数据的科学,其目的就是探索数据内在的数量规律性。 2.一组数据的分布特征可以从哪几个方面进行测度? 一组数据的分布特征可以从以下三个方面进行测度: 集中趋势的测度(众数、中位数、分位数、均值、几何平均数、切尾均值) 离散程度测度(极差、内距、方差与标准差、离散系数) 偏态与峰度测度(偏态及其测度、峰度及其测度) 3.分布集中趋势的测度指标有哪些? 众数、中位数、分位数、均值、几何平均数、切尾均值 4.简述众数、中位数与均值的特点与应用场合。 众数最容易计算,但不就是永远存在,它不受极端值影响、具有不惟一性、作为集中趋势代表值应用的场合较少,数据分布偏斜程度较大时应用,在编制物价指数时,农贸市场上某种商品的价格常以很多摊位报价的中数值为代表。 中位数很容易理解、很直观,它不受极端值的影响,这既就是它有价值的方面,也就是它数据信息利用不够充分的地方; 均值就是对所有数据平均后计算的一般水平代表值,数据信息提取的最充分,数据对称分布或接近对称分布时应用,它在整个统计方法中应用最广,对经济管理与工程等实际工作也就是最重要的代表值与统计量。 5.分布离散程度的测度指标有哪些? 极差、内距、方差与标准差、离散系数 6、常用的概率抽样方法有哪些?各自的含义如何? (1)简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,使得每一个总体单位都有相同的机会(概率)被抽中,这样的抽样方式称为简单随机抽样。 (2)分层抽样:在抽样之前先将总体的单位按某种特征或某种规则划分为不同的层,然后从不同的层中抽取一定数量的单位组成一个样本,这样的抽样方式称为分层抽样。 (3)系统抽样:在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点,每隔一定的间隔抽取一个单位,直至抽取n个单位形成一个样本。 (4)整群抽样:调查时先将总体划分成若干群,然后再以群作为调查单位从中抽取部分群,进而对抽中的各个群中所包含的所有个体单位进行调查或观察。 (5)多阶段抽样:先抽取群,但并不就是调查群内的所有单位,而就是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。 群就是初级抽样单位,第二阶段抽取的就是最终抽样单位。将该方法推广,使抽样的段数增多,就称为多阶段抽样。 7、什么就是抽样分布? 就就是由样本n个观察值计算的统计量的概率分布。 8、什么就是匹配样本? 一个样本中的数据与另一个样本中的数据相对应,这样的样本称为匹配样本。 9、假设检验的思想以及假设检验中的两类错误就是什么? 假设检验的基本思想就是小概率反证法思想。小概率思想就是指小概率事件(P<0、01或P<0、

相关文档
相关文档 最新文档