文档视界 最新最全的文档下载
当前位置:文档视界 › 统计学的发展历程

统计学的发展历程

统计学的发展历程
统计学的发展历程

统计学的发展历程

统计学概述

[编辑本段] 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。

统计学主要又分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。

统计学的发展历程

[编辑本段]

统计学的英文statistics最早是源于现代拉丁文statisticum collegium (国会)以及意大利文statista (国民或政治家)。德文Statistik,最早是由Gottfried Achenwall(1749)所使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。

统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴。

统计学的发展过程的三个阶段

第一阶段称之为“城邦政情”(Matters of state)阶段

“城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十馀种纪要,其内容包括各城邦的历史,行政,科学,艺术,人口,资源和财富等社会和经济情况的比较,分析,具有社会科学特点。“城邦政情”式的统计研究延续了一两千年,直至十七世纪中叶才逐渐被“政治算数”这个名词所替代,并且很快被演化为“统计

学”(Statistics)。统计学依然保留了城邦(state)这个词根。

第二阶段称之为“政治算数”(Politcal arthmetic)阶段

与“城邦政情”阶段没有很明显的分界点,本质的差别也不大。

1690年英国威廉·配弟出版(政治算数)一书作为这个阶段的起始标志.

威廉·配弟用数字,重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。因此,威廉?配弟的(政治算数)被后来的学者评价为近代统计学的来源,威廉?配弟本人也被评价为近代统计学之父。

配弟在书中使用的数字有三类:

第一类是对社会经济现象进行统计调查和经验观察得到的数字.因为受历史条件的限制,书中通过严格的统计调查得到的数据少,根据经验得出的数字多;

第二类是运用某种数学方法推算出来的数字。其推算方法可分为三种:

“(1)以已知数或已知量为基础,循著某种具体关系进行推算的方法;

(2)通过运用数字的理论性推理来进行推算的方法;

(3)以平均数为基础进行推算的方法”;

第三类是为了进行理论性推理而采用的例示性的数字.配弟把这种运用数字和符号进行

的推理称之为“代数的算法”。从配弟使用数据的方法看,“政治算数”阶段的统计学已经比较明显地体现了“收集和分析数据的科学和艺术”特点,统计实证方法和理论分析方法浑然一体,这种方法即使是现代统计学也依然继承。

第三阶段称之为“统计分析科学”(Science of statistical analysis)阶段

在“政治算数”阶段出现的统计与数学的结合趋势逐渐发展形成了“统计分析科学”。

十九世纪末,欧洲大学开设的“国情纪要”或“政治算数”等课程名称逐渐消失,代之而起的是“统计分析科学”课程.当时的“统计分析科学”课程的内容仍然是分析研究社会经济问题。

“统计分析科学”课程的出现是现代统计发展阶段的开端. 1908年,“学生”氏(William Sleey Gosset的笔名Student)发表了关于t分布的论文,这是一篇在统计学发展史上划时代的文章。它创立了小样本代替大样本的方法,开创了统计学的新纪元。

现代统计学的代表人物首推比利时统计学家奎特莱(Adolphe Quelet),他将统计分析科学广泛应用于社会科学,自然科学和工程技术科学领域,因为他深信统计学是可以用于研究任何科学的一般研究方法.

现代统计学的理论基础概率论始于研究赌博的机遇问题,大约开始于1477年。数学家为了解释支配机遇的一般法则进行了长期的研究,逐渐形成了概率论理论框架。在概率论进一步发展的基础上,到十九世纪初,数学家们逐渐建立了观察误差理论,正态分布理论和最

统计学的观念

[编辑本段] 为了将统计学应用到科学,工业以及社会问题上,我们由研究母体开始。这可能是一个国家的人民,石头中的水晶,或者是某家特定工厂所生产的商品。一个母体甚至可能由许多次同样的观察程序所组成;由这种资料蒐集所组成的母体我们称它叫时间序列。

为了实际的理由,我们选择研究母体的子集代替研究母体的每一笔资料,这个子集称做样本。以某种经验设计实验所蒐集的样本叫做资料。资料是统计分析的对象,并且被用做两种相关的用途:描述和推论。

描述统计学处理有关叙述的问题:资料是否可以被有效的摘要,不论是以数学或是图片表现,以用来代表母体的性质?基础的数学描述包括了平均数和标准差。图像的摘要则包含了许多种的表和图。

推论统计学被用来将资料中的数据模型化,计算它的机率并且做出对于母体的推论。这个推论可能以对/错问题的答案所呈现(假设检定),对于数字特征量的估计(估计),对于未来观察的预测,关联性的预测(相关性),或是将关系模型化(回归)。其他的模型化技术包括变异数分析(ANOVA),时间序列,以及资料采矿。

相关的观念特别值得被拿出来讨论。对于资料集合的统计分析可能显示两个变量(母体中的两种性质)倾向于一起变动,好像它们是相连的一样。举例来说,对于人收入和死亡年龄的研究期刊可能会发现穷人比起富人平均来说倾向拥有较短的生命。这两个变量被称做相关的。但是实际上,我们不能直接推论这两个变量中有因果关系;参见相关性推论因果关系(逻辑谬误)。

如果样本足以代表母体的,那么由样本所做的推论和结论可以被引申到整个母体之上。最大的问题在于决定样本是否足以代表整个母体。统计学提供了许多方法来估计和修正样本和蒐集资料过程中的随机性(误差),如同上面所提到的透过经验所设计的实验。参见实验设计。

要了解随机性或是机率必须具备基本的数学观念。数理统计(通常又叫做统计理论)是应用数学的分支,它使用机率论来分析并且验证统计的理论基础。

任何统计方法是有效的只有当这个系统或是所讨论的母体满足方法论的基本假设。误用统计学可能会导致描述面或是推论面严重的错误,这个错误可能会影响社会政策,医疗实践以及桥梁或是核能发电计划结构的可靠性。

即使统计学被正确的应用,结果对于不是专家的人来说可能会难以陈述。举例来说,统计资料中显著的改变可能是由样本的随机变量所导致,但是这个显著性可能与大众的直觉相悖。人们需要一些统计的技巧(或怀疑)以面对每天日常生活中透过引用统计数据所获得的资讯。

统计方法

[编辑本段] 1)测量的尺度

统计学一共有四种测量的尺度或是四种测量的方式。这四种测量(名目,顺序,等距,等比)在统计过程中具有不等的实用性。等比尺度(Ratio measurements)拥有零值及资料间的距离是相等被定义的,等距尺度(Interval measurements)资料间的距离是相等被定义的但是它的零值并非绝对的无而是自行定义的(如智力或温度的测量)。(Ordinal measurements)顺序尺度的意义并非表现在其值而是在其顺序之上。名目尺度(Nominal measurements)的测量值则不具量的意义。

2)统计技术

以下列出一些有名的统计检定方法以及可供验证实验数据的程序

费雪最小显著差异法(Fisher's Least Significant Difference test )

学生t检验(Student's t-test)

曼-惠特尼U 检定(Mann-Whitney U)

回归分析(regression analysis)

相关性(correlation)

皮尔森积矩相关系数(Pearson product-moment correlation coefficient)

史匹曼等级相关系数(Spearman's rank correlation coefficient )

卡方分配(chi-square )

统计学历史中的学派

[编辑本段]

一、18-19世纪——统计学的创立和发展

德国的斯勒兹曾说过:“统计是动态的历史,历史是静态的统计。”可见统计学的产生与发展是和生产的发展、社会的进步紧密相联的。

(1)统计学的创立时期

统计学的萌芽产生在欧洲。17世纪中叶至18世纪中叶是统计学的创立时期。在这一时期,统计学理论初步形成了一定的学术派别,主要有国势学派和政治算术学派。

1、国势学派

国势学派又称记述学派,产生于17世纪的德国。由于该学派主要以文字记述国家的显著事项,故称记述学派。其主要代表人物是海尔曼·康令和阿亨华尔。康令第一个在德国黑尔姆斯太特大学以“国势学”为题讲授政治活动家应具备的知识。阿亨华尔在格丁根大学开设“国家学”课程,其主要著作是《近代欧洲各国国势学纲要》,书中讲述“一国或多数国家的显著事项”,主要用对比分析的方法研究了解国家组织、领土、人口、资源财富和国情国力,比较了各国实力的强弱,为德国的君主政体服务。因在外文中“国势”与“统计”词义相通,后来正式命名为“统计学”。该学派在进行国势比较分析中,偏重事物性质的解释,而不注重数量对比和数量计算,但却为统计学的发展奠定了经济理论基础。但随着资本主义市场经济的发展,对事物量的计算和分析显得越来越重要,该学派后来发生了分裂,分化为图表学派和比较学派。

2、政治算术学派

政治算术学派产生于19世纪中叶的英国,创始人是威廉·配第(1623-1687),其代表作是他于1676年完成的《政治算术》一书。这里的“政治”是指政治经济学,“算术”是指统计方法。在这部书中,他利用实际资料,运用数字、重量和尺度等统计方法对英国、法国和荷兰三国的国情国力,作了系统的数量对比分析,从而为统计学的形成和发展奠定了方法论基础。因此马克思说:“威廉·佩第——政治经济学之父,在某种程度上也是统计学的创始人。”

政治算术学派的另一个代表人物是约翰·格朗特(1620-1674)。他以1604年伦敦教会每周一次发表的“死亡公报”为研究资料,在1662年发表了《关于死亡公报的自然和政治观察》的论著。书中分析了60年来伦敦居民死亡的原因及人口变动的关系,首次提出通过大量观察,可以发现新生儿性别比例具有稳定性和不同死因的比例等人口规律;并且第一次编制了“生命表”,对死亡率与人口寿命作了分析,从而引起了普遍的关注。他的研究清楚地表明了统计学作为国家管理工具的重要作用。

(2)统计学的发展时期

18世纪末至19世纪末是统计学的发展时期。在这时期,各种学派的学术观点已经形成,并且形成了两主要学派,即数理统计学派和社会统计学派。

1、数理统计学派

在18世纪,由于概率理论日益成熟,为统计学的发展奠定了基础。19世纪中叶,把概率论引进统计学而形成数理学派。其奠基人是比利时的阿道夫·凯特勒(1796-1874),其主要著作有:《论人类》、《概率论书简》、《社会制度》和《社会物理学》等。他主张用研究自然科学的方法研究社会现象,正式把古典概率论引进统计学,使统计学进入一个新的发展阶段。由于历史的局限性,凯特勒在研究过程中混淆了自然现象和本质区别,对犯罪、道德等社会问题,用研究自然现象的观点和方法作出一些机械的、庸俗化的解释。但是,他把概率论引入统计学,使统计学在“政治算术”所建立的“算术”方法的基础上,在准确化道路上大大跨进了一步,为数理统计学的形成与发展奠定了基础。

2、社会统计学派

社会统计学派产生于19世纪后半叶,创始人是德国经济学家、统计学家克尼斯

(1821-1889),主要代表人物主要有恩格尔(1821- 1896)、梅尔(1841-1925)等人。他们融合了国势学派与政治算术学派的观点,沿着凯特勒的“基本统计理论”向前发展,但在学科性质上认为统计学是一门社会科学,是研究社会现象变动原因和规律性的实质性科学,以此同数理统计学派通用方法相对立。社会统计学派在研究对象上认为统计学是研究体而不是个别现象,而且认为由于社会现象的复杂性和整体性,必须地总体进行大量观察和分析,研究其内在联系,才能揭示现象内在规律。这是社会统计学派的“实质性科学”的显著特点。

社会经济的发展,要求统计学提供更多的统计方法;社会科学本身也不断地向细分化和定量化发展,也要求统计学能提供更有效的调查整理、分析资料的方法。因此,社会统计学派也日益重视方法论的研究,出现了从实质性方法论转化的趋势。但是,社会统计学派仍然强调在统计研究中必须以事物的质为前提和认识事物质的重要性,这同数理统计学派的计量不计质的方法论性质是有本质区别的。

二、20世纪——迅速发展的统计学

20世纪初以来,科学技术迅猛发展,社会发生了巨大变化,统计学进入了快速发展时期。归纳起来有以下几个方面。

1、由记述统计向推断统计发展。记述统计是对所搜集的大量数据资料进行加工整理、综合概括,通过图示、列表和数字,如编制次数分布表、绘制直方图、计算各种特征数等,对资料进行分析和描述。而推断统计,则是在搜集、整理观测的样本数据基础上,对有关总体作出推断。其特点是根据带随机性的观测样本数据以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的推断。目前,西方国家所指的科学统计方法,主要就是指推断统计来说的。

2、由社会、经济统计向多分支学科发展。在20世纪以前,统计学的领域主要是人口统计、生命统计、社会统计和经济统计。随着社会、经济和科学技术的发展,到今天,统计的范畴已覆盖了社会生活的一切领域,几乎无所不包,成为通用的方法论科学。它被广泛用于研究社会和自然界的各个方面,并发展成为有着许多分支学科的科学。

3、统计预测和决策科学的发展。传统的统计是对已经发生和正在发生的事物进行统计,提供统计资料和数据。20世纪30年代以来,特别是第二次世界大战以来,由于经济、社会、军事等方面的客观需要,统计预测和统计决策科学有了很大发展,使统计走出了传统的领域而被赋予新的意义和使命。

4、信息论、控制论、系统论与统计学的相互渗透和结合,使统计科学进一步得到发展和日趋完善。信息论、控制论、系统论在许多基本概念、基本思想、基本方法等方面有着共同之处,三者从不同角度、侧面提出了解决共同问题的方法和原则。三论的创立和发展,彻底改变了世界的科学图景和科学家的思维方式,也使统计科学和统计工作从中吸取了营养,拓宽了视野,丰富了内容,出现了新的发展趋势。

5、计算技术和一系列新技术、新方法在统计领域不断得到开发和应用。近几十年间,计算机技术不断发展,使统计数据的搜集、处理、分析、存贮、传递、印制等过程日益现代化,提高了统计工作的效能。计算机技术的发展,日益扩大了传统的和先进的统计技术的应用领域,促使统计科学和统计工作发生了革命性的变化。如今,计算机科学已经成为统计科学不可分割组成部分。随着科学技术的发展,统计理论和实践深度和广度方面也不断发展。

6.统计在现代化管理和社会生活中的地位日益重要。随着社会、经济和科学技术的发展,统计在现代化国家管理和企业管理中的地位,在社会生活中的地位,越来越重要了。人们的日常生活和一切社会生活都离不开统计。英国统计学家哈斯利特说:“统计方法的应用是这样普遍,在我们的生活和习惯中,统计的影响是这样巨大,以致统计的重要性无论怎样强调也不过分。”甚至有的科学有还把我们的时代叫做“统计时代”。显然,20世纪统计科学的发展及其未来,已经被赋予了划时代的意义。

统计学现状

[编辑本段]在科学技术飞速发展的今天,统计学广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。今天的统计学已展现出强有力的生命力。在我国,社会主义市场经济体制的逐步建立,实践发展的需要对统计学提出了新的更多、更高的要求。随着我国社会主义市场经济的成长和不

断完善,统计学的潜在功能将得到更充分更完满的开掘。

第一,对系统性及系统复杂性的认识为统计学的未来发展增加了新的思路。由于社会实践广度和深度迅速发展,以及科学技术的高度发展,人们对客观世界的系统性及系统的复杂性认识也更加全面和深入。随着科学融合趋势的兴起,统计学的研究触角已经向新的领域延伸,新兴起了探索性数据的统计方法的研究。研究的领域向复杂客观现象扩展。21世纪统计学研究的重点将由确定性现象和随机现象转移到对复杂现象的研究。如模糊现象、突变现象及混沌现象等新的领域。可以这样说,复杂现象的研究给统计开辟了新的研究领域。

第二,定性与定量相结合的综合集成法将为统计分析方法的发展提供新的思想。定性与定量相结合的综合集成方法是钱学森教授于1990年提出的。这一方法的实质就是将科学理论、经验知识和专家判断相结合,提出经验性的假设,再用经验数据和资料以及模型对它的确实性进行检测,经过定量计算及反复对比,最后形成结论。它是研究复杂系统的有效手段,而且在问题的研究过程中处处渗透着统计思想,为统计分析方法的发展提供了新的思维方式。

第三,统计科学与其他科学渗透将为统计学的应用开辟新的领域。现代科学发展已经出现了整体化趋势,各门学科不断融合,已经形成一个相互联系的统一整体。由于事物之间具有的相互联系性,各学科之间研究方法的渗透和转移已成为现代科学发展的一大趋势。许多学科取得的新的进展为其他学科发展提供了全新的发展机遇。模糊论、突变论及其他新的边缘学科的出现为统计学的进一步发展提供了新的科学方法和思想。将一些尖端科学成果引入统计学,使统计学与其交互发展将成为未来统计学发展的趋势。统计学也将会有一个令人振奋的前景。今天已经有一些先驱者开始将控制论、信息论、系统论以及图论、混沌理论、模糊理论等方法和理论引入统计学,这些新的理论和方法的渗透必将会给统计学的发展产生深

远的影响。

势的发展和计算机技术的迅速发展,统计学的应用领域、统计理论与分析方法也将不断发展,

在所有领域展现它的生命力和重要作用。

学科分支

[编辑本段] 一些学科大量地利用了应用统计学,以至它们自己已经各自独立成为一门学科。

统计学的分支学科有:

统计学史

理论统计学

统计调查分析理论

统计核算理论

统计监督理论

统计预测理论

统计逻辑学

统计法学

描述统计学

推断统计学

经济统计学

宏观经济统计学

微观经济统计学

管理统计学

科学技术统计学

农村经济调查

教育统计学

文化与体育统计学

卫生统计学

司法统计学

社会福利与社会保障统计学生活质量统计学

人口统计学

环境与生态统计学

自然资源统计学

环境统计学

生态平衡统计学

国际统计学

国际标准分类统计学

国际核算体系与方法论体系国际比较统计学

其他

生物统计学

商务统计学

工程统计学

心理统计学

化学统计学

档案统计学

水文统计学

数理统计学

统计语言学

统计物理学

化学统计学

延伸学科

有些科学广泛的应用统计的方法使得他们拥有各自的统计术语,这些学科包括:农业科学

生物统计

商用统计

资料采矿(应用统计学以及图形从资料中获取知识)

经济统计学

电机统计

统计物理学

人口统计

心理统计学

教育统计学

社会统计(包括所有的社会科学﹚

文献统计分析

化学与程序分析(所有有关化学的资料分析与化工科学)

运动统计学,特别是棒球以及曲棍球

车间统计信息系统

1 引言

车间统计信息系统在企业管理系统中,处于一个比较特殊的地位,不但是全厂统计工作的基础也是其他各管理系统的信息源,是我们搞好企业管理的基础工作。要建立企业的计算机管理信息系统,车间统计信息的建设是基础。

计算机应用于车间统计系统,不仅可以使车间各类统计人员以最少的劳动和最短的时间取得足够的。可靠的。准确的信息,而且可以使他们从简单的数据统计、收集、汇总等重复烦锁的事务工作中解脱出来,以更多的精力、更多的时间从事企业管理、统计分析工作,为领导当好参谋。本案例结合具体实际,采用结构化生命周期法,论述一个以计算机为工具的企业车间统计系统的开发与设计过程。

2 车间统计系统的调查与分析

2.1 初步调查

工业企业是与一个复杂的管理系统,统计系统是企业管理系统的一个子系统,系统工作几乎渗透到了企业组织的每一部分,他的特点主要是信息集中、渠道固定、内容变化小,处理量大、时间性强等。在初步调查过程中主要搞清原系统组织和信息的总情况,以及与外部的关系,明确新的新系统应该达到的目标。基于这一目的,应做以下几方面的调查。

1、调查企业概况,包括:企业规模、论历史、人力、技术条件、组织条件等。

2、查阅、收集各种统计报表,了解对填写报表的要求、报表格式、内容,以及对上报报表的时间要求等。

3、调查统计系统的机构设置、业务分工、人员设置。

4、调查统计报表的管理情况等。

以某电机厂为例,通过对全厂初步调查了解到该厂为一年轻在我国曲艺管理中具有代表性的大中型去也。主要产品有中小型交流电机、直流电机、发电机等。年生产能力80万千瓦。现有职工2800多人。车间设置既有以产品为对象的般封闭式的车间,又有以工艺为对象的半成品车间,共有基本生产车间6个,辅助车间4个。该厂生产电机产品有多年,技术力量雄厚,管理机构健全。全厂统计机构分为厂部、车间和班组三级。厂部在计划部门设计专职综合统计员2人,其他科室设专职统计员1人,车间设专职统计员1人,班组在群众管理网中设兼职统计员1人。

。。。。。。。。。

5.2 日常运行管理

一个系统开发设计是否成功,不仅取决于好的设计,更重要的在于运行管理的好坏。“重开发,轻管理”是系统失败的主要原因之一。

日常运行过程中,应做好数据收集,数据分类,数据录入工作。要严格按照系统操作规程完成系统的日常处理,应将系统对数据的处理情况、处理效率、意外情况的发生及处理等,及时准确地、完整地记录下来。运行记录是系统管理和维护工作的基础,也是明确系统工作人员责任的重要依据。应及时的坚持不懈地对各类数据备份,并对备份的数据进行妥善的管理。还应重视机房设施、计算机程序、文档资料、数据的管理及各种规章制度的建立和完善。这些都是系统正常运行不可缺少的因素。

5.3硬件与软件的维护

系统刚建成时所编制的数据很少能一字不改地沿用下去,我们应该根据外界环境的变更和业务量增减等情况及时对系统进行维护。系统维护包括:程序维护、数据维护、机器维护。

1. 程序维护:当某一统计业务发生改变,影响到整个系统,这时相应部分也应及时改变,对相应程序段进行修改,以保证系统的运行。

2. 数据库的维护:此项维护可利用系统的修改功能,但要注意原数据的保护。采取保护措施,可以把旧库内容拷贝到一个空库里,待修改完毕,再拷回原库中。

3. 机器的维护:要求计算机硬件人员对机器加强保养,定期检修并保证在损坏后及时修复。

统计学名词解释

统计学名词解释 第一章绪论 1.随机变量:在统计学上,把取值之间不能预料到什么值的变量。 2.总体:又称母全体、全域,指具有某种特征的一类事物的全体。 3.个体:构成总体的每个基本单元称为个体。 4.样本:从总体中抽取的一部分个体,称为总体的一个样本。 5.次数:指某一事件在某一类别中出现的数目,又称为频数。 6.频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。 7.概率:某一事物或某一情在某一总体中出现的比率。 8.观测值:一旦确定了某个值。就称这个值为某一变量的观测值。 9.参数:又称为总体参数,是描述一个总体情况的统计指标。 10.统计量:样本的那些特征值叫做统计量,又称特征值。 第二章统计图表 1.统计表:是由纵横交叉的线条绘制,并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。一般由表号、名称、标目、数字、表注组成。 2.统计图:一般采用直角坐标系,通常横轴表示事物的组别或自变量x,称为分类轴。纵轴表示事物出现的次数或因变量,称为数值轴。一般由图号及图题、图目、图尺、图形、图例、图组成。 3.简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表,适合数据个数和分布范围比较小的时候用。 4.分组次数分布表:数据量很大时,应该把所有的数据先划分在若干区间,然后将数据按其数值大小划归到相应区域的组别内,分别统计各个组别中包括的数据个数,再用列表的形式呈现出来,适合数据个数和分布范围比较大的时候用。 5.分组次数分布表的编制步骤: (1)求全距 (2)定组距和组数 (3)列出分组组距 (4)登记次数 (5)计算次数 6.分组次数分布的意义: (1)优点:A.可将杂乱无章数据排列成序,以发现各数据的出现次数及分布状况。B.可显示一组数据的集中情况和差异情况等。 (2)缺点:原始数据不见了,从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入,出现误差,即归组效应。 7.相对次数分布表:用频数比率或百分数来表示次数 8.累加次数分布表:把各组的次数由下而上,或由上而下加在一起。最后一组的累加次数等于总次数。 9.双列次数分布表:对有联系的两列变量用同一个表表示其次数分布。

统计学试题库含答案

统计学试题库含答案 Modified by JEEP on December 26th, 2020.

《统计学》试题库 第一章:统计基本理论和基本概念 一、填空题 1、统计是统计工作、统计学和统计资料的统一体,统计资料 是统计工作的成果,统计学是统计工作的经验总结和理论概括。 2、统计研究的具体方法主要有大量观察法、统计分组法、统计推断法和综合指标法。 3、统计工作可划分为设计、调查、整理和分析四个阶段。 4、随着研究目的的改变,总体和个体是可以相互转化的。 5、标志是说明个体特征的名称,指标是说明总体数量特征的概念及其数值。 6、可变的数量标志和所有的统计指标称为变量,变量的具体数值称为变量值。 7、变量按其数值变化是否连续分,可分为连续变量和离散变量,职工人 数、企业数属于离散变量;变量按所受影响因素不同分,可分为确定性变量和随机变量。 8、社会经济统计具有数量性、总体性、社会性、具体性等特点。 9、一个完整的统计指标应包括指标名称和指标数值两个基本部分。 10、统计标志按是否可用数值表示分为品质标志和数量标志;按在 各个单位上的具体表现是否相同分为可变标志和不变标志。 11、说明个体特征的名称叫标志,说明总体特征的名称叫指标。 12、数量指标用绝对数表示,质量指标用相对数或平均数表示。 13、在统计中,把可变的数量标志和统计指标统称为变量。 14、由于统计研究目的和任务的变更,原来的总体变成总体单位, 那么原来的指标就相应地变成标志,两者变动方向相同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。(×) 2、运用大量观察法,必须对研究对象的所有或足够多的单位进行观察调查。(√) 3、统计学是对统计实践活动的经验总结和理论概括。(√)

统计学名词解释

社会统计学 第一章导论 1、统计学是收集、分析、表述和解释数据的科学。 2、社会统计方法是指搜集、整理与分析资料的研究技术或手段。 3、大量观察是就总体中足够多的单位进行调查和综合分析,用以反映社会总体的数量特征,大量观察法是统计调查阶段的重要方法。 4、统计按其内容主要包括两个方面:描述统计和推断统计。 5、描述统计就是讨论范围仅以搜集的资料本身为限,而不予以扩大,是统计分析方法的基础。内容有搜集数据、整理数据、展示数据、描述性分析,目的在于描述数据特征、找出数据的基本规律。 6、推断统计主要是依据概率论,研究如何依据有限资料对总体性质作推断,从而使统计的功能大为扩充。内容有参数估计和假设检验,目的在于对总体特征作出推断。 7、参数估计,即由样本的指标数值推断总体的相应的指标数值,包括点估计和区间估计。 8、假设检验,即就社会研究中提出的某种假设应用抽样方法来加以统计检验。 9、程序是指研究工作的顺序和步骤,是人们根据客观法则和人的认识规律而作出的一种逻辑安排。 10、社会统计工作的程序:①制定计划②统计调查③统计整理④统计分析⑤统计报告 11、统计调查就是按照统计研究所预定的目的和任务,运用各种调查的组织形式,有组织、有计划地向调查对象搜集原始资料的工作过程。 12、统计整理就是根据统计研究的目的和任务,对调查所得的资料进行加工整理,使之条理化、系统化。 13、统计分析是对研究对象进行定量分析。 14、统计报告就是将所得结果用文字报告的形式表达出来。 15、统计数据是对现象进行计量的结果,不是指单个的数字,而是由多个数据构成的数据集,不仅仅是指数字,它可以是数字的,也可以是文字的。 16、统计数据的分类:①按计量层次分:分类数据、顺序数据、数值型数据 ②按收集方法分:观察的数据、试验的数据 ③按时间状况分:截面数据、时序数据 17、分类数据:对事物进行分类的结果,数据表现为类别,用文字来表述,例如,人口按性别分为男、女两类。 18、顺序数据:对事物类别顺序的测度,数据表现为类别,用文字来表述,例如,产品分为一等品、二等品、三等品、次品等。 19、数值型数据:对事物的精确测度,结果表现为具体的数值,例如:身高为175cm、168cm、183cm。 20、观测的数据:通过调查或观测而收集到的数据,在没有对事物人为控制的条件下而得到的,有关社会经济现象的统计数据几乎都是观测数据。 21、试验的数据:在试验中控制试验对象而收集到的数据,比如,对一种新药疗效的试验,对一种新的农作物品种的试验等,自然科学领域的数据大多数都为试验数据。 22、截面数据:在相同或近似相同的时间点上收集的数据,描述现象在某一时刻的变化情况,比如,2002年我国各地区的国内生产总值数据。 23、时间序列数据:在不同时间上收集到的数据,描述现象随时间变化的情况,比如,1996年至2002年国内生产总值数据。

统计学名词解释

1、统计学 统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。 2、指标和标志 标志是说明总体单位属性或特征的名称。指标是说明总体综合数量特征和数量关系的数字资料。 3、总体、样本和单位 统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。简称总体。构成总体的个体则称为总体单位,简称单位。样本是从总体中抽取的一部分单位。 4、统计调查 统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。它是取得统计数据的重要手段。 5、统计绝对数和统计相对数 反映总体规模的绝对数量值,在社会经济统计中称为总量指标。统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。 6、时期指标和时点指标 时期指标是反映总体在一段时期内累计总量的数字资料,是流量。时点指标是反映总体在某一时刻上具有的总量的数字资料,是存量。 7、抽样估计和假设检验 抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。 8、变量和变异 标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。数量标志和指标在统计中称为变量。 9、参数和统计量 参数是反映总体特征的一些变量,包括总体平均数、总体方差、总体标准差等。统计量是反映样本特征的一些变量,包括样本平均数、样本方差、样本标准差等。 10、抽样平均误差 样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。重复抽样的抽样平均误差为总体标准差的1/n。 11、抽样极限误差 抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样误差的可能范围,称为极限误差或允许误差。 12、重复抽样和不重复抽样 重复抽样也称为回置抽样,是从总体中随机抽取一个样本时,每次抽取一个样本单位时都放回的抽样方式。不重复抽样也叫不回置抽样,它是在每次抽取样本单位时都不放回的抽样方式。13、点估计和区间估计 点估计也叫定值估计,就是直接用抽样平均数代替总体平均数,用抽样成数代替总体成数。区间估计是在一定概率保证下,用样本统计量和抽样平均误差去推断总体参数的可能范围的估计方法。 14、统计指数 广义上来说,它是表明社会经济现象的数量对比关系的相对指标。狭义上来说,它是反映不能直接相加对比的复杂总体综合变动的动态相对数。 15、综合法总指数 凡是一个总量指标可以分解为两个或两个以上的因素指标时,将其中一个或一个以上的因素指

统计学试卷及答案

统计学试卷及答案 一、判断题 1.统计学是一门方法论科学,其目的是探索数据的内在数量规律性,以达到 对客观事物的科学认识。() 2.统计研究的过程包括数据收集、数据整理、分析数据和解释数据四个阶段。 () 3.统计数据误差分为抽样误差和非抽样误差。() 4.按所采用的计量尺度不同,可以将统计数据分为时间序列数据和截面数据() 5.用来描述样本特征的概括性数字度量称为参数。() 6.如果数据呈左偏分布,则众数、中位数和均值的关系为:均值<中位数< 众数。() 7.通过散点图可以判断两个变量之间有无相关关系。() 8.所有可能样本均值的数学期望等于总体均值。() 9.影响时间序列的因素可分为:长期趋势、季节变动、循环波动和不规则变 动四种。() 10.狭义的统计指数是用来说明那些不能直接加总的复杂现象综合变动的一 种特殊相对数。() 二、单项选择题 1.为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中样本是()。 A 100所中学 B 20个城市 C 全国的高中生 D 100所中学的高中生 2.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2005年城镇家庭的人均收入数据。这一数据属于()。 A 分类数据 B 顺序数据 C 截面数据 D 时间序列数据

3.某连续变量数列,其首组为50以下。又知其邻近组的组中值为75,则首组的组中值为() A 24 B 25 C 26 D 27 4.两组数据相比较()。 A 标准差大的离散程度也就大 B 标准差大的离散程度就小 C 离散系数大的离散程度也就大 D 离散系数大的离散程度就小 5.在下列指数中,属于质量指数的是()。 A 产量指数 B 单位产品成本指数 C 生产工时指数 D 销售量指数 6.定基增长速度与环比增长速度的关系为()。 A 定基增长速度等于相应的各个环比增长速度的算术和 B 定基增长速度等于相应的各个环比增长速度的连乘积 C 定基增长速度等于相应的各个环比增长速度加1后的连乘积再减1 D 定基增长速度等于相应的各个环比增长速度的连乘积加1(或100%) 7.某企业报告期产量比基期增长了10%,生产费用增长了8%,则其产品单位成本降低了()。 A 1.8% B 2.5% C 20% D 18% 8.用简单随机重复抽样方法抽取样本单位,如果要使抽样标准差降低50%,在其他条件不变的情况下,则样本容量需要扩大到原来的()。 A 2倍 B 3倍 C 4倍 D 5倍 9.如果变量x和变量y之间的相关系数为﹣1,这说明两个变量之间是()。 A 低度相关关系 B 完全相关关系 C 高度相关关系 D 完全不相关 10.合理施肥量与农作物亩产量之间的关系是()。 A 函数关系 B 相关关系 C 没有关系 D 正比例关系 11.在回归分析中,描述因变量y如何依赖自变量x和误差项 的方程称为()。 A 回归方程 B 回归模型 C 估计的回归方程 D 理论回归方程 12.平均指标是用来反映一组数据分布的()的指标。

统计学名词解释及简答题 .

名词解释 一、分类数据(categorical data )是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,使用文字来表述的。 二、顺序数据(ran k data )是只能归于某一有序类别的非数字型数据。 三、数值型数据(metric data )是按数字尺度测量的观察值,其结果表现为具体的数值。 四、系统抽样(systematic sampling )将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机的抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,这种抽样方法被称为系统抽样。 五、非概率抽样(non-probability sampling )是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采取某种方式从总体中抽出部分单位对其实施调查。 六、抽样误差(sampling error )是由于抽样的随机性引起的样本结果与总体真值之间的误差。 七、四分位数(quartile)也称四分位点,他是一组数据排序后处于25%和75%位置上的值。四分位数是通过3个点将全部数据等分为4部分,其中每部分包括25%的数据。 八、离散系数也成为变异系数(coefficient of variation ),它是一组数据的标准差与其相应的平均数之比。其计算公式为: s s v x = 离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。 九、泊松分布(Poisson distribution )是用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的次数的分布。 十、中心极限定理(central limit theorem ):设从均值μ、2σ(有限)的任意一个总体中抽取样本量为n 的样本,当n 充分大时,样本均值X 的抽样分布近似服从均值为μ、方差2σ/n 的正态分布。 十一、置信区间(confidence interval )在区间估计中,有样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信上限。 十二、显著性水平(significant level)是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们根据检验的要求确定的,通常取0.05α=或0.01α=,这表明,当做出接受原假设的决定时,其正确的概率为95%或99%。 十三、方差分析(analysis of variance, ANOV A )就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。 十四、相关系数(correlation coefficient )是根据样本数据计算的度量两个变量之间线性关系强度的统计量。 十五、回归模型(regression model )对于具有线性关系的两个变量,可以用一个线性方程来表示他们之间的关系。描述因变量y 如何依赖于自变量x 和误差项ε的方程称为回归模型。 十六、点估计 利用估计的回归方程,对于x 的一个特定值0x ,求出y 的一个估计值就是点估计。点估计可分为两种:一是平均值的点估计;二是个别值的点估计。 十七、时间序列(time series )是同一现象在不同时间上的相继观察值排列而成的序列。 十八、指数平滑法(exponential smoothing )是通过对过去的观察值加权平均进行预测的一种方法,该方法使t+1期的预测值等于t 期的实际观察值与t 期的预测值的加权平均值。 十九、指数,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法。指数是测定多项内容数量综合变动的相对数。这个概念中包含两个重点:第一个要点是指数的实质是测定多项内容;指数概念的第二个要点是其表现形式为动态相对数,既然是动态相对

统计学名词解释

一、名词解释 总体:指在同一组条件下所有成员的某种状态变量的集合;或者说是某一变数的全部可能值的集合;或性质相同的个体组成的整个集团. 样本:从总体中取出来用作分析、研究的个体称样本。 随机样本:总体中的每个总体单位都有同等的机会被抽取为样本单位,由这种方法抽得的样本叫随机样本.(用随机抽样的方法,从总体中抽出一个部分;等概率抽取的样本。)随机抽样:保证总体中的每一个体在每一次抽样中都有同等的机会被取为样本。 复置抽样:保证总体中的每个个体在每次抽样中都有同等的概率被取为样本。 样本容量:样本中包含的单位数称为样本容量。(样本中变量的个数.) 观察值:每一个体的某一性状测定值叫做观察值。 变数:若干有变异的观察值叫随机变数,简称变数。 连续性变数:指在任意两个变量之间都有可能存在只有微量差异的第三个变量存在,这样一类变数称为连续性变数. 间断性变数:只能取整数的一类变数。 参数:由总体获得的代表总体的特征数.(描述总体的特征数,如μσ .)统计数:由样本获得的代表样本的特征数。(描述样本的特征数。) 数量资料(数量性状资料):以测量或称重的方式获取的试验资料称为数量资料。 计量资料、质量性状资料 次数资料:凡是试验结果以次数表示的资料称为次数资料。 算术平均数、众数 几何平均数:变量对数的算术平均数的反对数, (lg) lg Y G n = ∑ 调和平均数:变量倒数的算术平均数的反倒数, 1 () n H Y = ∑ 中位数:将变量顺序排列,处在中间的变量称中位数,计作M d。极差:一组资料中最大值与最小值的差值为极差. 方差:变数变异程度的度量,对于总体 ()2 2i Y N μ σ - = ∑ ,对于样本 2 2 () 1 Y y s n - = - ∑ 。 (描述变量平均变异程度的统计量.定义为 2 1 2 () 1 n j j Y y s n = - = - ∑ 。) EMS:期望均方,是对均方MS的期望值。 标准差:变数变异程度的度量,总体标准差: () N Y ∑- = 2 μ σ ,样本标准 差: () 1 2 - - = ∑ n y Y s .(变数的平均变异量.) 标准误:统计数变异度的度量,12 y y y s s - == 。(统计数的标准差。)

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错)

统计学名词解释

一、名词解释 总体:指在同一组条件下所有成员的某种状态变量的集合;或者说是某一变数的全部可能值的集合;或性质相同的个体组成的整个集团。 样本:从总体中取出来用作分析、研究的个体称样本。 随机样本:总体中的每个总体单位都有同等的机会被抽取为样本单位,由这种方法抽得的样本叫随机样本。(用随机抽样的方法,从总体中抽出一个部分;等概率抽取的样本。) 随机抽样:保证总体中的每一个体在每一次抽样中都有同等的机会被取为样本。 复置抽样:保证总体中的每个个体在每次抽样中都有同等的概率被取为样本。 样本容量:样本中包含的单位数称为样本容量。(样本中变量的个数。) 观察值:每一个体的某一性状测定值叫做观察值。 变数:若干有变异的观察值叫随机变数,简称变数。 连续性变数:指在任意两个变量之间都有可能存在只有微量差异的第三个变量存在,这样一类变数称为连续性变数。 间断性变数:只能取整数的一类变数。 参数:由总体获得的代表总体的特征数。(描述总体的特征数,如μσ 。) 统计数:由样本获得的代表样本的特征数。(描述样本的特征数。) 数量资料(数量性状资料):以测量或称重的方式获取的试验资料称为数量资料。 计量资料、质量性状资料 次数资料:凡是试验结果以次数表示的资料称为次数资料。 算术平均数、众数 几何平均数:变量对数的算术平均数的反对数,(lg ) lg Y G n =∑ 调和平均数:变量倒数的算术平均数的反倒数,1 ()n H Y = ∑ 中位数:将变量顺序排列,处在中间的变量称中位数,计作M d 。 极差:一组资料中最大值与最小值的差值为极差。 方差:变数变异程度的度量,对于总体()22i Y N μσ-=∑,对于样本22 ()1Y y s n -=-∑。 (描述变量平均变异程度的统计量。定义为 212()1 n j j Y y s n =-= -∑。) EMS :期望均方,是对均方MS 的期望值。 标准差:变数变异程度的度量,总体标准差:()N Y ∑-= 2μσ,样本标准差:()12--=∑n y Y s 。(变数的平均变异量。) 标准误:统计数变异度的度量,12y y y s s -==。(统计数的标准差。)

统计学名词解释汇总

统计学名词解释汇总 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

1什么是统计学?统计方法可分为哪两大类?统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。方法有描述统计和推断统计两类2统计数据可分为哪几种类型?不同类型数据各有什么特点?按采取计量尺度,分类、顺序、数值型数据;按统计数据收集方法,观测、实验数据;按被描述对象与时间关系,截面、时间序列数据 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分;

截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 3举例说明总体、样本、参数、统计量、变量这几个概念:对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 4什么是有限总体和无限总体?举例说明 有限总体指总体的范围能够明确确定,而且元素的数目是有限可数的,如若干个企业构成的总体,一批待检查的灯泡。无限总体指总体包括的元素是无限不可数的,如科学实验中每个试验数据可看做是一个总体的一个元素,而试验可无限进行下去,因此由试验数据构成的总体是无限总体 5变量可分为哪几类? 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 6举例说明离散型变量和连续型变量

统计学试题库(含答案)

《统计学》试题库 第一章:统计基本理论和基本概念 一、填空题 1、统计是统计工作、统计学和统计资 料的统一体,统计资料是统计工作的成果,统计学是统计工作的经验总结和理论概括。 2、统计研究的具体方法主要有大量观察法、统计分组 法、统计推断法和综合指标 法。.__________________________________________________________ _____________________________________________________________________ 3、统计工作可划分为设计、调查、整 理和分析四个阶段。 4、随着研究目的的改变,总体和个 体是可以相互转化的。 5、标志是说明个体特征的名称,指标是说明总体数量特征的概念及其数值。 6、可变的数量标志和所有的统计指标称为变量,变量的具体数值称为变量值。 7、变量按其数值变化是否连续分,可分为连续变量和离散变量,职工人数、企业数属于离散变量;变量按所受影响因素不 同分,可分为确定性变量和随机变量。

8、社会经济统计具有数量性、总体性、社会性、具体性等特点。 9、一个完整的统计指标应包括指标名称和指标数 值两个基本部分。 10、统计标志按是否可用数值表示分为品质标志和数量标志;按在各个单位上的具体表现是否相同分为可变标 志和不变标志。 11、说明个体特征的名称叫标志,说明总体特征的名称叫指标。 12、数量指标用绝对数表示,质量指标用相对 数或平均数表示。 13、在统计中,把可变的数量标志和统计指 标统称为变量。 14、由于统计研究目的和任务的变更,原来的总体变成总体单位,那么原来的指标就相应地变成标志,两者变动方向相同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。(×) 2、运用大量观察法,必须对研究对象的所有或足够多的单位进行观察调查。(√) 3、统计学是对统计实践活动的经验总结和理论概括。(√)

统计学名词解释新

中央广播电视大学2013-2014学年度第一学期"开放本科"期未考试(半开卷) 社会统计学试题 二、名词解释(每题4分,共20分) 11.抽样单位与抽样框 抽样单位就是一次直接的抽样所使用的基本单位。(2分) 抽样框是指一次直接抽样时所有抽样单位的名单。(2分) 12.普查与抽样调查 普查是一种专门的调查,它是为了某种特定的目的而对总体中所有的个体进行的一次全 面调查。(2分) 称为误差减少比例,简称PREa(2分)PRE的取值范围为0→1,PRE值越大,说明用变量X 去预测变量Y是能够减少的误差所占的比例越大,即变量X与变量Y之间的相关性越大;反之,PRE越小、说明变量X与变量Y之间的关系越小。(2分) 13.散点图 散点图是在坐标系中,用X轴表示自变量x,用Y轴表示因变量y,而变量组(x,y)则用坐标系中的点表示,不同的变量组在坐标系中形成不同的散点,用坐标系及其坐标系中的散点形成的二维图就是散点图。(2分) 散点图是描述变量关系的→种直观方法,我们可以从散点图中直观的看出两个变量之间 是否存在相关关系、是正线性相关还是负线性相关,也可以大致看出变量之间关系强度如何乙14.正态分布

连续性随机变量中重要的分布是钟型概率分布,就是正态分布,也称为常态分布,是种 连续型随机变量的概率分布。(2分)正态分布是对称的,且正态分布的中央点最高。(2分) 15.最小二乘法 对于存在线性关系的变量x和y的观察值,我们可以用很多直线去描述,但我们需要选用距离各观测值最近的一条直线,用它来描述x与y之间的关系使实际的误差最小,根据这一思想来确定回归方程中参数的方法就是最小二乘法。(2分)最小二乘法是使因变量的观察值与估计值之间的离差平方和达到最小来求参数的方法。(2分) 二、名词解释(每题4分,共20分) 11.概率抽样 概率抽样就是按照随机原则进行的抽样,(2分)总体中每个个体都有一定的、非零的概率 入选样本,并且入选样本的概率都是已知的或可以计算的。(2分) 分) (2 散点图是描述变量关系的一种直观方法,我们可以从散点图中直观的看出两个变量之间 是否存在相关关系、是正线性相关还是负线性相关,也可以大致看出变量之间关系强度如何。 14.抽样分布 抽样分布是指样本统计量的概率分布,(2分)它是在重复选取容量为n的样本时,由每个样本计算出来的统计量值的相对频数分布。(2分) 15.虚无假设与替换假设 我们将需要通过样本信息来推断其正确与否的命题称为虚无假设,也称为原假设或零假设。(2分) 如果虚无假设不成立,我们就拒绝虚无假设,需要在另一个假设中进行选择,这就是替换假设。(2分〉

统计学-复习试题(含答案)

一. 单项选择题(每小题2分,共20分) 1. 对于未分组的原始数据,描述其分布特征的图形主要有( ) A. 直方图和折线图 B. 直方图和茎叶图 C. 茎叶图和箱线图 D. 茎叶图和雷达图 2. 在对几组数据的离散程度进行比较时使用的统计量通常是( ) A. 异众比率 B. 平均差 C. 标准差 D. 离散系数 3. 从均值为100、标准差为10的总体中,抽出一个50=n 的简单随机样本,样本均值的数学期望和方差分别为( )A. 100和 2 B. 100和0.2 C. 10和1.4 D. 10和2 4. 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量标准之一是使它与总体参数的离差越小越好。这种评价标准称为( )A. 无偏性 B. 有效性 C. 一致性 D. 充分性 5. 根据一个具体的样本求出的总体均值95%的置信区间( ) A. 以95%的概率包含总体均值 B. 有5%的可能性包含总体均值 C. 一定包含总体均值 D. 可能包含也可能不包含总体均值 6. 在方差分析中,检验统计量F 是( ) A. 组间平方和除以组内平方和 B. 组间均方和除以组内均方 C. 组间平方和除以总平方和 D. 组间均方和除以组内均方 7. 在回归模型 εββ++=x y 10中,ε反映的是( ) A. 由于x 的变化引起的y 的线性变化部分B 由于y 的变化引起的x 的线性变化部分 C. 除x 和 y 的线性关系之外的随机因素对y 的影响D 由于x 和y 的线性关系对y 的影响 8. 在多元回归分析中,多重共线性是指模型中( ) A. 两个或两个以上的自变量彼此相关B 两个或两个以上的自变量彼此无关 C 因变量与一个自变量相关 D 因变量与两个或两个以上的自变量相关 9. 若某一现象在初期增长迅速,随后增长率逐渐降低,最终则以K 为增长极限。描述该类现象所采用的趋势线应为( )A. 趋势直线 B. 指数曲线 C. 修正指数曲线 D. Gompertz 曲线 10. 消费价格指数反映了( ) A. 商品零售价格的变动趋势和程度B 居民购买生活消费品价格的变动趋势和程度 C 居民购买服务项目价格的变动趋势和程度 D 居民购买生活消费品和服务项目价格的变动趋势和程度 二. 简要回答下列问题(每小题5分,共20分) 1. 解释总体与样本、参数和统计量的含义。简述方差分析的基本假定? 2. 简述移动平均法的基本原理和特点。解释拉氏指数和帕氏指数。 三. (20分)一种产品需要人工组装,现有三种可供选择的组装方法。为比较哪种方法更好,随机抽取10个工人,让他们分别用三种方 (1) 你准备采用什么方法来评价组装方法的优劣?试说明理由。 (2) 如果让你选择一种方法,你会作出怎样的选择?试说明理由

《统计学》试题及答案

统计学试题及答案 1.女性是品质标志。错 2.指标都是用数值表示的,而标志则不能用数值表示。错 3.数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。错 4.一般而言指标总是依附在总体上,而总体单位则是标志的直接承担者。对 5.统计学是对统计实践活动的经验总结和理论概括。对 6.统计学和统计工作的研究对象是完全一致的。错 1.各种调查方法结合运用,容易造成重复劳动,故不宜提倡。错 2.调查对象是调查项目的承担者。错 3.典型调查中典型单位的选取可以不遵循随机原则。对 4.统计报表中的资料主要来源于基层单位的原始记录、统计台帐和基础的内部报表。对 5.统计报表一般属于经常性的全面调查。对 6.一般而言,全面调查的结果更全面、准确,所以得到普遍应用。错 1.为了了解某商业企业的期末库存量,调查人员亲自盘点库存,这种方法C A.大量观察法大量观察法大量观察法 B.采访法 C.直接观察法 D.报告法 2.第2章对百货商店工作人员进行普查,调查对象是(B) A.各百货商店

B.各百货商店的全体员工 C.一个百货商店 D.每位工作人员 3.重点调查的重点单位在全部总体中虽然数目不多,所占比重不大,但就调查的标志值来说却在总量中占很大的比重。对 4.普查可以得到全面、详细的资料,但需要花费大量的人力、物力、财力及时间,因此在统计调查中不宜频繁组织普查。对 5.对统计总体中的全部单位进行调查称为普查。对 6.由于直接观察法能保证资料的真实性和可靠性,因而在进行大规模调查时,应采用这种方法。错 1.能够对总体进行分组,是由于统计总体中各单位所具有的差异性决定的。错 2.统计整理就是对统计资料进行汇总、加工处理。错 3.次数分布有两种表现方法,一种是用表格表示,另一种是用图表示。错 4.所谓“上限不在内”原则,是指当某单位的标志值恰好等于某组上限时,就把该单位归入该组。错 5.连续型变量只能作组距式分组,且组限只能是重叠组限表示法。对 6.在编制变量数列时,若资料有特大或特小的极端数值,则宜采用开口组表示。对 7.统计表的横行标题表示各组的名称,一般应写在统计表的(B) A.上方 B.左方 C.右方

统计学名词解释汇总-统计学名词解释大全

1什么是统计学?统计方法可分为哪两大类?统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。方法有描述统计和推断统计两类 2统计数据可分为哪几种类型?不同类型数据各有什么特点?按采取计量尺度,分类、顺序、数值型数据;按统计数据收集方法,观测、实验数据;按被描述对象与时间关系,截面、时间序列数据 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 3举例说明总体、样本、参数、统计量、变量这几个概念:对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 4什么是有限总体和无限总体?举例说明 有限总体指总体的范围能够明确确定,而且元素的数目是有限可数

应用统计学试题含有答案

北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 一. 单选题(每题2分,共20分) 1.对工业企业的生产设备进行普查时,调查对象是( C ) A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为, 则该组数据的标准差为( B ) A 50 B 8 C D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为( A) A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为( C ) A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D.1%109%107%1053-(平均定增长速度) 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为( B) A. –5% B. –% C. –% D. % 6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数

b= -表示( B ) A.时间每增加一个单位,产品成本平均增加个单位 B.时间每增加一个单位,产品成本平均下降个单位 C.产品成本每变动一个单位,平均需要年时间 D.时间每减少一个单位,产品成本平均下降个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为( A ) A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x=70件,σ=件乙车间: x=90件, σ=件哪个车间日加工零件的离散程度较大:( B ) A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是( C ) A 用各年的环比增长速度连乘然后开方(定基年增长速度) B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间( C ) A. 相关程度很低 B.不存在任何相关关系 C. 不存在线性相关关系 D.存在非线性相关关系 二. 多选题(每题2分,共14分) 1.○注下列数据中属于时点数的有( ABDE)

统计学名词解释

1 第一章 1.统计数据:即统计信息,是指通过统计工作过程中取得的各项数据资料以及与之相关的其 他资料的总称。 2.统计学:即统计理论,是指系统地阐述统计实践活动基本原理和研究方法的理论。它是 一门研究如何搜集、整理和分析统计资料的理论和方法论科学。 4.统计学的研究对象:客观事物中的数量特征、数量关系和数量变化。 5.统计学包括商务管理统计的研究对象特点:数量性(基本特点)、总体性、变异性。 7.商务管理统计研究方法 大量观察法统计分组法对比分析法综合指标法统计推断法动态测定法8.统计总体。又称“调查总体”简称“总体”,在数理统计中又称母体,与样本相对应。凡是客观存在的、具有共同性质的个体所构成的整体就是统计总体。其形成必须具备以下条件: 客观性:即统计总体必须是客观存在的,并且能实际观察到的。 同质性:即构成统计总体的所有单位至少具有某一个共同性质是统计总体的前提条件。变异性:即构成统计总体的各总单位至少在某一性质上具有共同特征外,在其他性质上应具有差异性,变异性是统计研究的重点。 9.总体单位:构成统计总体的每个基本单位称为总体单位,简称单位或个体,它是各项统计 特征的原始承担者。 10.统计总体分类: 按其包含的单位数是否可计分为有限总体与无限总体按总体单位的形态分为实体总体和行为总体。 11.总体与总体单位的关系: a.总体是由总体单位组成,总体单位是组成总体的个别事物。 b.根据研究目的不同,总体和总体单位是可以相互转化的。 12.标志:表示总体单位特征的名称。如性别、年龄、籍贯、企业所有制、规模等。 13.标志表现:即标志特征在各单位的具体表现。如性别标志的表现有“女”、“男”,年龄标志用“30”岁“50”岁等数量来表现。 14.标志的分类 a.根据标志表现的形式不同。数量标志,表明总体单位数量特征的标志,是可以用数值表 示的。品质标志,表明总体单位属性特征的标志,不能用数值表现。 b.按照各总体单位标志的具体表现是否相同。不变标志:某一标志的具体表现在总体中各总体单位都相同。可变标志:某一标志的具体表现在总体中各总体单位不尽相同。 15.总体单位和标志的关系:总体单位是标志的承担者,标志是对总体单位的特征描述,依 附于某个总体单位的标志可以有多个。 16.统计指标:是反映总体现象具有的数量特征的名称,包括6个构成要素:时间,空间,

统计学名词解释

名词解释 1.统计学:是应用概率论和数理统计的基本原理和方法,研究数据的收集、整 理、分析、表达和解释的一门科学。 2.医学统计学:是应用统计学的基本原理和方法,研究医学及其有关领域数据 信息的搜集整理、分析、表达和解释的一门科学。 3.抽样:是从研那个研究总体抽取少量有代表性的个体,称为抽样。 4.统计推断:是根据已知的样本信息来推断未知的总体,是统计分析的目的, 包括参数估计和假设检验。 5.总体:是根据研究目的确定的同质研究对象的全体。 6.概率:是随机事件发生可能性大小的数值度量。 7.同质:是指所研究的观察对象具有某些相同的性质或特征。 8.变异:是同质个体的某项指标之间的差异,即个体差异。 9.正态分布:频数分布的高峰在中间,两端基本对称,逐步减少,这种分布称 为近似正态分布,如果两端完全对称则称为正态分布。 10.医学参考值范围:又称正常值范围,医学上常将包括绝大多数正常人的某指 标值的波动范围称为该指标的正常值范围。 11.动态数列(dynamic series):是按照一定的时间顺序,将一系列描述某事 物的统计指标依次排列起来,观察和比较该事物在时间上的变化和发展趋势,这些统计指标可以为绝对数、相对数或平均数。 12.人口金字塔:将人口的性别与年龄资料结合起来以图形的方式表达人口的性 别与年龄结构,以年龄为纵轴,人口百分比为横轴,左侧为男,右侧为女,两个对应的直方图,其形似金字塔。 13.负担系数(dependency ratio):又称抚养比或抚养系数,是指人口中非劳 动年龄人数与劳动年龄人数之比。 14.标准化死亡比(SMR):实际死亡人数与期望死亡人数之比称为标准化死亡比。

相关文档