文档视界 最新最全的文档下载
当前位置:文档视界 › 统计学在社会学中的应用

统计学在社会学中的应用

统计学在社会学中的应用
统计学在社会学中的应用

统计学在社会学中的应用

1950-2000:一个简要的回顾

Adrian. E. Raftery1

2001年2月15日

概要

统计学方法在社会学中的运用已经成功地走过了半个世纪,它对提高社会学这门学科的科学研究水平做出了巨大的贡献。根据研究者所使用的数据类型的不同,我将战后统计学方法在社会学中的应用过程分为三个层叠的时期。第一代统计方法起于1940年代晚期,研究者主要运用交互表(cross-tabulations)的方法,同时对关联测量 (measures of association)和对数线性模型(log-linear models)倾注了许多心血,可以说这是社会学对统计学贡献最大的一个领域。第二代统计方法始现于1960年代,这一时期的研究者主要面对的是个体层次的调查数据,同时他们将注意力集中在具有线性结构关系(LISREL)的因果模型和事件史分析(event history analysis)上。第三代统计方法在1980年代晚期就已经初现端倪,研究者所处理的数据已经不能简单地归入上文所述的任何一个范畴。一方面是因为这些数据都具有与众不同的形式,比如文本和口述,另一方面是因为在与空间的和社会网的数据联系时,依赖性已经成为一个至关重要的方面。尽管有许多新的挑战,但用统计学方法研究这一领域的条件已经成熟,最近,几个主要的研究机构已经开始在统计学和社会科学领域展开新的探索。

目录

1 引言 (2)

2 第一代统计方法:交互表(Cross-Tabulations) (6)

1 Adrian. E. Raftery,华盛顿大学统计学和社会学教授,统计学和社会科学研究中心主任。Email: , Web: 。作者感谢Mark Becker, Mark Handcock, Don Rubin, Michael Sobel, Tom Snijders, Rob Warren, Yu Xie以及Kazuo Yamaguchi给予本文的宝贵评价,这些评价对与本文的改进起到了极大的帮助作用。

2.1 分类数据的分析(Categorical Data Analysis) (6)

2.2 潜在类别模型(Latent Class Model) (10)

2.3 假设检验和模型选择(Hypothesis Testing and Model Selection) (10)

3 第二代统计方法:个体层次的调查数据(Unit-Level Survey Data)11

3.1 对职业地位的测量(Measuring Occupational Status) (12)

3.2 结构方程模型的诸多应用(The Many Uses of Structural Equation Models) (13)

3.3 事件史分析(Event History Analysis) (15)

3.4 二分因变量(Binary Dependent Variables) (16)

3.5 其他有限因变量(Other Limited Dependent Variables) (18)

3.6 多层次模型(Multilevel Models) (20)

3.7 缺省数据(Missing Data) (22)

3.8 因果关系(Causality) (24)

4 第三代统计方法:新数据,新挑战,新方法(New Data, New Challenges, New

Methods) (27)

4.1 社会网络和空间数据(Social Networks and Spatial Data) (27)

4.2 文本和定性数据(Textual and Qualitative Data) (29)

4.3 叙述和序列分析(Narrative and Sequence Analysis) (30)

4.4 仿真模型(Simulation Models) (31)

4.5 宏观社会学(Macro-sociology) (32)

5 讨论 (32)

参考文献 (34)

1 引言

为了纪念千禧年的来临,美国统计学会月刊(Journal of the American Statistical Association)刊登了一个由大约50篇短文组成的连载,每篇短文都着力概括统计学中的某一领域在即将过去的一个世纪所取得的进展。这一计划的初衷在于将统计学中一些最优秀的成果做一总结,并且突出未来研究中的具有潜力的领域。我写作了有关统计学在社会学中应用的那篇论文(Raftery,2000)。其他几篇相关的论文或许会对那些对社会学方法论感兴趣的读者有帮助,这些文章涵盖了列联表(contingency table),对数线性模型(Fienberg,2000),因果推理在社会科学中的应用(Sobel,2000),人口学(Xie,2000),政治学方法论(Beck,2000),计量心理学(Browne,2000),经验方法在法律科学中的应用(Eisenberg,2000)等诸多领域。

在我这篇论文的初稿问世后,许多同事都对我的文章发表了评论,其中有许多评论正确地指出了我在文章中不慎遗漏的该领域的一些重要发展。然而,由于美国统计学会月刊给我的篇幅有限,我不可能将这些遗漏的部分全部补充进来。幸运的是,社会学方法论(Sociological Methodology)编辑Michael Sobel和Mark Becker请我撰写一篇在此基础上有所扩展的专题论文,或许这篇论文能够为这一不断发展的研究领域提供一个更为合适的概括。

社会学起源于十九世纪中期,孔德(他首先引进了“社会学”一词),马克思,韦伯和涂尔干围绕着工业革命后新出现的社会,写下了一系列具有奠基意义的著作。社会学从一开始就使用了定量的研究方法。孔德,这位学科的奠基人,清晰的意识到这门学科应该以统计数据为基础。而涂尔干的《自杀论》更是成为了广泛运用统计数据的典范。

然而,在二战以前,可供研究的数据都显得支离破碎,统计方法也比较简单,仅仅停留在描述性统计的层次上。经过仔细的考证Camic和Wilson(1994)认为,Franklin H. Giddings是美国定量社会学之父。Giddings于1894年在哥伦比亚获得社会学教授职务,1931年逝世,他将社会学界定为研究集体层面社会现象的一门学科。他认为在很大程度上社会学中的统计分析是将诸多的个体分成不同的类别,同时发现每一类别的平均特征。从现代统计学角度来看,缺乏对变化的考察是他著作的一个最为显著的特征。

从那以后,研究用的数据变得越来越复杂,同时统计方法也在不断发展,以适应数据分析的需要。这时期的统计学方法的发展,有许多是要归因于社会学家而非统计学家的努力。Clogg(1992)以及他文章的评论者们有力的论证并且记述了这一点。这种情况部分反映了一个事实,即致力于研究社会学问题的统计学家的数量相对较少。更多的统计学家倾向于关注药物学,工程技术以及生物科学方面的问题。这或许反映了在二十世纪后半期不同学科间研究资金分布的不平衡状况。然而,最近有迹象表明这一情况正在发生变化,我将在本文的结尾论述这个问题。

在过去的五十年中,社会学总的趋势是向更为严格、清晰的假设;更大更详细的数据

集合发展;为了拟合数据,统计模型变得越来越复杂;主要社会学期刊所发表文献的统计分析水平也在不断提高。统计方法在社会学领域成功地走过了半个世纪,使得该学科研究的科学水平有了极大的提高。

社会学中广泛的使用了各种各样的统计学方法和统计模型。在这里,我将集中考察那些由社会学家发展的,直接由社会学问题所引致的,或者首先在社会学期刊上发表的那些统计学成就。许多其它的方法,比如逻辑斯蒂回归等适用于有限数量的因变量的方法,虽然也广泛的应用于社会学研究,但是他们是首先在其他的学科中为解决其学科自身的问题而发展出来的。有鉴于此,尽管这些方法很重要,但我们在这里也仅对他们做一简要介绍。

对于从计量经济学而不是从统计学中引入到社会学研究中的统计方法,本文省略了与其相关的讨论。这或许对从另一个角度来讨论这一问题有所帮助。计量经济学对社会学方法论产生了非常重要的影响,甚至有些人说这种影响比来自统计学本身的影响更为强大,但是在这里除了个别情况,我将不对这种重要的影响发表评论。

为了避免引起争论,我将根据社会学中不同的统计方法所针对的数据类型,而不是根据这些方法本身对他们加以分类。我将区分出战后统计学在社会学中应用的三个不同的阶段。每一阶段的划分都是根据他们通常所适用的数据类型做出的:交互表,单位水平的统计数据,以及种种新的数据形式。就像现实中的代际一样,这三代统计方法前后层叠,而且它们之间的界限也并非十分明晰。虽然这些方法代表着不同的成熟水平,甚至关于他们的起点也并没有一个统一的界定,但是今天这些方法都依然保持着活力。

在二战后开始的这一时期,社会学家们所使用的许多数据都是在调查和普查的基础上以交互表的形式呈现的。我在文中所要讨论的第一代统计方法就是以这种方式处理数据的。通常说来,这类交互表都只包含很少的变量,例如性别,年龄组以及职业分类。社会流动表可以称得上是这种方法中的经典之作。这一领域或许是社会学家对统计学贡献最大的地方。实际上,我们可以说是社会学家们主导了这一分支领域,他们发展出来的这些方法已经超出了社会学领域渗透到其他的学科的研究工作当中。Schuessler(1980)所作的调查在

很大程度上反映了第一代方法所取得的成就。

1960年代早期,社会学家已经不必再依赖于计数的交互表了,来自含有多个变量调查的个体层次的数据越来越容易获得。计算能力也已经发展到能够轻而易举地处理这些数据的水平。第二代的统计方法正是针对处理这类数据而发展出来的。Blau和Duncan的有广泛影响力的著作美国的职业结构(The American Occupational Structure),为这一代的统计方法披上了金色的外衣,而1969年《社会学方法论》(Sociological Methodology)以及1972年《社会学方法与研究》(Sociological Methods and Research)等发表窗口的建立,更为这一方法增光添色。Edgar Borgatta一手创立了这两份刊物,当他创立第二份刊物时,《社会学方法论》已经远不能满足日益增多的投稿和发表的需要了。这些发展标志了社会学定量研究方法的新时代的到来。

1980年代晚期,社会学家们勾画了一个雄心勃勃的计划,就是对那些难以符合标准交互表和数据矩阵要求的数据类型进行统计分析(尽管在有些情况下,这些数据也可以被强行归入这些类别中)。这些数据包含了文本(text)或叙述(narrative),以及依赖性很强的数据,比如社会网的数据和具有空间参照特性的数据。这其中还包含了一些含有多类型变量的数据集,比如卫星图片,人种学的纪录和其他一些定量测量数据。第三代的统计方法正是为了处理诸如此类的数据而发展出来的。或许是每一个新事物的优点,迄今为止,这一代方法保持着它们的活力,包含了大量的令人激动的想法和进展,但是他们还未形成前两代统计方法所具有的成熟、完备的形式。

我对社会学中所应用的统计学方法的分类是根据不同方法所处理的数据类型做出的,而不是以方法本身的类型为标准,但这并不意味着目前研究生课程的编排有什么问题。或许为了训练的方便和有效,社会学的主要方法倾向于按照不同的类别组织在一起,比如回归模型(regression model),有限因变量模型(limited dependent variable model),对数线性模型(log-linear model),结构方程模型(structural equation model),事件史分析等等。然而,我发现要分辨统计学方法以往的发展趋势以及构想未来的发展,从最初引

致这些方法产生的数据的类型入手或许是一条捷径。

过去的五十年间,我们已经走过了一条漫长的道路。今天,许多社会学研究都是以巨大的高质量的调查样本为基础进行再分析的。他们较多的利用在公共基金资助下收集的或者是对研究者公开的数据库,这些数据库通常都有着5000到20000,甚至更大的样本规模。这为复证结果提供了一条简便的道路,同时也有助于社会学建立起可以与自然科学或医药科学相媲美甚至高于这些学科的科学标准。或许受以上因素的影响,社会统计学在最近成为了一个迅速扩展的研究领域,许多重要的研究机构也都在最近几年开始了他们对这一领域的探索。

2 第一代统计方法:交互表(Cross-Tabulations)

2.1 分类数据的分析(Categorical Data Analysis)

定量社会学家们分析的许多数据最初都是以交互分类表的形式出现的,所以毫不奇怪这一领域成为了社会学家对统计学贡献最大的地方。交互表分析中的经典的例子是社会流动表,这类表格通常具有两个维度,即应答者的职业类别与应答者父亲的职业类别,而职业类别的数量通常在5个到17个之间。

最初的研究焦点是关联程度的测量,在社会流动领域他们称之为流动指数(Glass, 1954; Rogoff, 1953),然而这些指数不能对结构流动与交互(或称为循环)流动进行区分。为了解决流动表分析中的这一关键问题,研究者需要为这些交互表建立一个清晰的概率模型。为此,Birch 针对观察值{x ij }提出了一个对数线性模型

)(12)(2)(1])[log(ij j i ij u u u u x E +++=, (1)

其中,i 代表行,j 代表列,u 1(i)和u 2(j)分别代表行和列的主效应,u 12(ij)是交互项,用来测量对独立性的偏离。这一模型为所有需要对社会流动表和相似表格进行严格的分析的研究提供了一个总体的框架。然而,模型(1)的原型在分析社会流动和其他相似的交互表时遇到的困难是参数的数量过大,以至于不能进行推论和解释。比如美国的数据库通常使用

的分类有17个,因此交互项中就包含了162=256个参数。

要改进这一模型,就要使模型的交互项尽量简约(即含有较少的参数),同时又使模型能够拟合数据。在这方面,Duncan(1979)和Goodman(1979)提出了一个成功的解决方案,即关联模型(association model):

∑=+

=

M

m

i

m

j

m

i

m

ij

j i

u

1

)

(

)

(

)

( 12

)

,

(

δ

φ

β

α

γ,

(2)

其中,若i=j,则δ(i,j)=1;若i≠j,则δ(i,j)=0。在模型(2)中,αi(m)是第i行在第k个维度上的取值,βj(m)是在第j列的对应值。这些值既可以事先具体化,也可以从数据中估计出来。最后一项允许在对角线方向上有不同的关联强度。(模型(2)是未经确认的书写形式,可能还有各种各样的确认条件)这个模型常被称为RC(M)模型。目前的应用中大多数情况下都是M为1,而在社会学实际应用中最早在模型中取M>1的是Clogg, Eliason 和Wahl(1990)进行的对劳动市场经历和劳动力成果的研究。

Goodman(1979)最初发展这一模型时,是将其作为用本地优比(Local Odds Ratio)描述关联程度的一种方法。Goodman(1985)表明这一模型与规范的相关和对应分析有紧密的联系,并且为这些方法提供了一个颇具发展潜力的框架。在对类别进行排序时,在αi=βi=I 的条件下,这个标准的关联模型是一个有用的分析起点(Haberman,1979)。在这个模型中,所有的2×2子表的优比都相等,因此当Υ=Υk时,这可以被看作二元正态分布的一个非连续的近似。

表1:观察频次来源于美国社会流动最大规模的研究,期望频次来源于自由度为4的Goodman 关联模型。样本规模19,912。来源:Hout(1983)。

子代职业

高级

非体力劳

低级

非体力劳动

高级

体力劳动

低级

体力劳动农业劳动

父代职业Obs.Exp.Obs.Exp.Obs.Exp.Obs.Exp.Obs.Exp.

高级

141414145215343022786436524042非体力劳动

低级

非体力劳动7247165245242542727036984843

高级

体力劳动79879064866285685616761666108112

低级

体力劳动75679491483577181333253325237236

农业劳动4093863574094414051611161718321832表1展示了一个简化后的美国社会流动研究的真实案例,拟合数据都是通过关联模型得到的,该模型解释了表中99.6%关联性,因此它的成功是显而易见的。Hout(1984)扩展了这一模型的适用范围,在职业类别的性质等问题上,他使用模型(2)把取值(score)和对角项(diagonal terms)转换成取值的和或者协变量的积。这是对Birch(1965)的线性交互模型(linear-by-linear interaction model)的一个扩展。

这种方法也将研究者的以简洁和可解读的方式,模拟相对更高维度和类别更多的交互表的愿望变成可能。并且它还成就了许多重要的发现,其中包括Hout(1988)得到的美国社会的流动性近年来在不断增加的发现。这一个细致的发现是在具有复杂性质的数据基础上做出的,如果没有使用关联模型的方法这一成果将是很难获得的。Ganzeboom、Luijkx和Treiman的研究进一步证实和推进了这一实质性的成果,这一研究依据的是从同一时点的不同国家收集的几百个社会流动表,研究者发现,在二十世纪后半期工业化国家的社会流动性在以每年1%的速度增加。

Biblarz和Raftery(1993)以及Biblarz,Raftery和Bucur(1997)将这一模型应用到更高维度的流动表中,用以研究不完整家庭的社会流动性。他们所用的流动表包含有父亲职业、子代职业、性别、种族、年代等5个维度,共计约7000个单元。在这种情况下,标准

的对数线性模型不能获得任何信息,但是使用关联模型并且对以前模型进行扩展后,却可以得到可解读的结果,参数估计和结论。他们的研究表明,不完整家庭(nonintact family)的职业相似性比完整家庭的职业相似性弱,在不完整家庭中,由工作的单亲母亲抚养的子女在职业继承方面平均说来要优于其他类型的不完整家庭中的子女。从1960年代到1990年代,尽管家庭结构,职业分布,两性和种族之间的关系,及其职业和劳动力的地位等方面都发生了许多变化,但是这种流动模式在本质上保持了稳定。其他一些应用对数线性模型和与它相联系的模型的重要案例包括了对性别区隔的分析(Charles and Crusky,1995)和对同等地位群体内部的婚配问题的研究(Kalmijn,1991)。从社会学开始,关联模型的使用已经逐渐扩展到其他的学科中,例如流行病学的研究(Becker,1989)。

对二维以上的交互表进行分析的一个基本原因是要评估二维的关联性如何依照第三个(或其他几个)维度变化的。Yamaguchi(1987)和Xie(1992)提出了高维度关联模型的具体形式,而Goodman和Hout(1998)在此基础上进行了综合和扩展。后一种方法的一个十分吸引人的特点是它能以图形的形式展现结果,这为解读分析中所出现的更为复杂的数据和模型参数提供了方便。

这些模型适用于对不连续的独立变量进行分析。而在分析由连续的独立变量组成的交互分类的依赖性方面,Sobel(1981,1985)的对角流动模型(diagonal mobility models)或许是最为成功的。这一方法被广泛的应用于各个领域,比如对婚姻生育(marital fertility) (Sorensen, 1989),文化消费(De Graaf,1991),和投票行为(Weakleim,1992)的研究。

模型(1)和模型(2)背后所潜藏的基本原理,可以通过另一个直观的方式表达,这一方式是根据边缘分布(marginal distribution)而不是根据模型(1)中的主效应进行的。由此产生的边缘模型(marginal model)为研究边缘分布和优比开辟了道路,这为非对数线性的联合分布提供了一个新的模型(Lang and Agresti, 1994; Becker,1994; Becker and Yang,1998)。这类模型在社会学中的首次应用便是为了模拟社会流动(Sobel, Becker and Minick,1998)。

2.2 潜在类别模型(Latent Class Model)

解决类似的纷繁复杂问题的另一个途径是使用潜在类别模型(Lazarsfeld,1950;Lazarsfeld and Henry,1968;Goodman,1974a,b)。它的基础形式可以被看作是一个有限个分布的集合体,该集合体中每一个分布所包含的不同的变量都是独立的。这种模型被用来分析可观察的多变项离散数据的关联性,这种方法的最初的动机与用因子分析来处理多变项连续数据的想法相类似。

Hagenaars(1988,1990)扩展了潜在类别模型的使用范围,使得在那个多分布集合体中的每一个组成部分都不独立。这一模型的应用实例已经有相当的数量。Clogg(1995)对这一研究领域进行了总结。最近,Roeder,Lynch和Nagin(1999)用这一模型完成了一项有趣的犯罪学方面的研究。

这一基础模型已经在其他的情况中被使用和简化。Chickering和Heckerman(1997)在潜藏了一极后将它简化为Bayesian图示模型。这种简化式使得用潜在类别模型研究多变量关系时比较容易做出估计,同时它可以方便地在某些个体含有缺失数据的情况下对模型进行估计,此外它还能够对缺失的数据做出推断。Celeux和Govaert(1991)使用了同一个基础模型来聚合多变项离散观察值,从而为分析大量变量做好了准备。

2.3 假设检验和模型选择(Hypothesis Testing and Model Selection)

社会学家通常所使用的样本所包含的个案规模都在数千个左右,因此他们较早碰到了一个问题,即标准的p值在样本量相当大的情况下也可能意味着对无差异假设的拒绝,甚至当原模型在理论上看有意义,而对数据考察却不能揭示任何有意义的差异时也是如此。这一问题与下面两个问题结合在一起,首先在通常情况下存在很多模型而不仅是在进行显著性检验时我们所正视的那两个模型。其次我们是用逐步比较法还是用多项比较的方法对模型进行筛选(Goodman,1971)。到1980年代早期,为了解决这一问题,一些社会学家在当基于P值的检验得到的结果看起来有悖于直觉时,索性忽略这一结果。另外一些研究者则

更多地使用模型筛选的方法,而不再对模型和数据之间的不一致进行理论性的思考或非正规的评价(Fienberg and Mason, 1979; Hout, 1983, 1984; Grusky and Hauser,1984)。

后来有人指出,使用模型筛选比用Bayes因素法能更有效的处理这一问题(Ragery, 1986a)。研究者可以通过选择BIC(BIC=Deviance-自由度*log(n))值比较小的对数线性模型,用近似的方法解决这一问题(Schwarz,1978;Ragery,1986b)。对于嵌套的假设,这种做法可以被看作是在确定一个检验的显著性水平,这以显著性水平将会随着样本规模的扩大而减小。从此以后,许多社会学研究在使用对数线性模型时都应用了这一方法。Kass和Wasserman (1995)表明在对模型参数进行估计时使用的Bayes先验分布是个体信息先验分布时,即与一个“典型”观测包含了同样多信息的一个有限分布时,这种近似方法还是十分精确的。而Raftery(1995)则阐明了将这种方法拓展到其他更多的模型中的策略。

Weakliem(1999)对BIC的使用做了批评,他认为在实际中BIC所对应的个体信息先验分布过于分散,如果在此基础上使用BIC的话,将会导致BIC在多数情况下对无差异假设有利。然而,Raftery(1999)指出个体信息先验分布的确为调查者已知的先验信息了一个合理的代表,尤其在当调查者事先有一些,但不是很多关于他所估计模型的参数值信息时更是如此。如果调查者有更多的信息的话他将有一个更为紧凑的先验分布,这样他就有了一个在用BIC不能拒绝无差异假设时,拒绝该假设的基础,但这要建立在先验信息而不是数据的基础上,同时在任何一篇报告中这一点都要被明确的指出来。BIC提供了一个保守的评价标准:人们可以对任何效果的实际意义更有信心,证明这些实际效果存在的信息都受到BIC的有利的支持。Weakliem的论述可以被看作是在暗示如果真实的先验信息确实可资利用的话,它就应该被利用,对此我表示赞同。在先验信息反映实际可用信息的基础上使用Bayes因素法时,这样做可以使对数线性模型以及其他的普通线性模型的应用变得简单。

3 第二代统计方法:个体层次的调查数据(Unit-Level Survey Data)

第二代统计模型是在个体层次的调查数据出现的基础上应运而生的,这些由独立的个

体层次的数据构成巨大的数据矩阵。线性回归模型和由它拓展成的通径模型,结构方程模型,广义线性模型和事件史模型是分析此类数据的大多数成功模型的基础。但是,在仅对变量的分布而不是他们的估计值进行研究时,非参数模型则更为有效(Morris,Bernhardt and Handcock ,1994;Bernhardt, Morris and Handcock,1995; Handcock and Morris, 1998,1999)。我们将从回顾职业地位测量的发展开始,因为这一领域的研究为第二代统计方法的成长提供了强大的推动力。

3.1 对职业地位的测量(Measuring Occupational Status)

职业地位是社会学中的一个重要的概念,这个研究领域的标志性的成就便是发展出一套实用的,对职业地位进行连续测量的方法。这对于社会统计学方法的发展具有十分重要的意义,因为从1960年代开始,一些学者对工作给人们所带来的可资利用资源和社会后果十分感兴趣,他们在研究这一问题时广泛地使用了回归模型和其他相关的模型。这些方法论的取向迅速扩展到该学科的其他研究领域当中。

当1940年代对职业地位的全国性调查刚刚开始时,职业地位这一概念被等同于职业声望。然而,这类调查仅能对每十年进行一次的人口普查中的上百项职业分类中的一小部分进行测量。为了填补1960年的人口普查中其他职业分类的声望值的空白,Duncan(1961)选择了45种职业进行了声望值的回归分析,因为在这些职业类别中能够测量出完成了高中学业的在职者比例和收入在一万美元以上的在职者比例。他发现预测结果非常好(R2=0.91),两个预测因素有着几乎相同的权重值。在此基础上,他对1960年普查中区分的所有职业都赋予了一个声望值,这一数值被称为Duncan社会经济指数(SEI);SEI后来被认为是一个优于声望值本身的,能够衡量各种社会成就(social outcome)的预测值。后来Duncan根据几次人口普查分类数据对他最初的结论做了数次修改(Featherman and Stevens,1982; Nakao and Treas,1994;Hauser and Warren,1997),但是最近这一结论在概念和经验的基础上都受到了批判(Hauser and Warren,1997; Warren, Sheridan, and Hauser, 1998)。

在许多社会科学研究中,尤其是在经济学中,当前的收入被用来作为社会成就的一个预测因素,但是有更多的论据表明应该使用职业地位这一因素进行预测。职业地位已经被证明是一个具有良好性质的预测诸多社会成就的因素。因为工作和职业可以被精确地测量,相比之下收入或者财富的测量因为受到拒答、回忆和可靠性等问题的影响而变得不准确。在职业和代际之间,职业地位比收入更能保持长时期的稳定性。这意味着职业地位在作为指示长期或者永久性收入因素时,比当前收入本身更有代表性。此外,职业地位在时间维度上和在不同的国家之间都保持了相当的稳定性(Treiman,1977)。

3.2 结构方程模型的诸多应用(The Many Uses of Structural Equation Models)

图1展示的是Blau和Duncan(1967)的职业获得(occupational attainment)基本通径模型的核心部分。可参见Duncan(1966)。Wright(1921)引进了通径分析,Blalock(1961)针对社会科学研究的需要对这一分析进行了拓展,插入了因果推理的分析。结构方程模型的一个重要的用途和目的就是将总影响分解为直接影响和间接影响。Alwin和Hauser(1975)在尝试将这一方法应用到对社会学数据的分析的工作中扮演了重要的角色。对这一方法的批评参见Freedman(1987)和Sobel(1998)。下文的第3.8节详细介绍了有关社会科学中因果推理的讨论。

图1:一个著名的通径分析模型,即对1962年美国社会分层的过程的研究。从一个变量指向另一个变量的箭头上的数字是回归系数,V和X之间的相关系数为0.516。没有起点的箭头上的数字是残差。

来源:Blau and Duncan(1967)。

我们常常不能直接观察因果模型中我们所感兴趣的变量,但是其他的可观测的变量可以被视为是那些不可测量变量的间接测量或者结构因素,例如偏见(prejudice),疏离(alienation),保守主义(conservatism),自尊(self-esteem),歧视(discrimination),动机(motivation)或者能力(ability)。Joreskog(1973)用一个含有潜在变量的结构方程模型的最大似然估计来解决这一问题。这通常被称为线性结构关系(LISREL)模型,这一名称来自Joreskog的软件。Duncan(1975)在向社会学界介绍这些想法的工作中扮演了重要的角色,Long(1984a,b)和Bollen(1989)提供了一个适合于社会学家使用的出色文本。图2展示

的便是应用此种方法的一个典型模型;这一分析的目标在于检验和估计图中以粗箭头代表的无法观测的潜在变量间的关系强度。像图1和图2这样的图表已经被证明对社会学家分析理论和假设,建立因果模型来说十分有帮助。

Muthen(1983)将

(longitudinal

Kuo和Hauser(1996)采用来自双胞胎的数据来控制未被观察到的可能影响其社会经济成就的家庭方面的因素,并且他们将得出的随机效果模型(random effects model)插入到一个线性结构关系框架中。

Markov图表模型(graphical Markov model)是在用条件独立性而不是类回归关系(regression-like relationship)的方法对结构方程模型进行简化的基础上产生的。它对于多变量独立性分析十分重要,尽管在社会学家看来它的解释力有限。但在通过一个因变量系统生产其他变量的信息,以得到关于其他不能观测变量的信息方面,这一方法很有帮助。例如,在组建医疗诊断专家系统等一些类似应用中这一方法显得十分需要。但是在社会研究中这些方法至今还很少被应用于推断和建模方面。这或许是由于社会学的假设多是用回归或因果关系,而不是用变量间的条件独立方式表达的原因造成的。

Markov图表模型和结构方程模型之间的关系已经开始为人们所了解(Koster,1996, Spirtes,1998)。同时,线性结构关系看起来也比较适合于Gibbs抽样和马尔可夫链之蒙特卡罗方法(Markov chain Monte Carlo method, MCMC) (Gilks, 1996),这似乎给这一框架的应用提供了一个很大的空间(Raftery,1991; Arminger,1998; Scheines, Hoijtink and Boomsma,1999)。

3.3 事件史分析(Event History Analysis)

个体层次的调查数据通常包含或者允许进行生活史的重构。其中含了某些重大事件,比如结婚,离婚,出生,入狱和出狱,工作变化以及进入和脱离福利保障的发生时间。

1972年以前,在分析一个事件(比如死亡)发生的时间分布和它的影响因素时,通常有两种可用研究方法。一个是从人口学借鉴来的生命表分析,但这种方法很难对影响某一事件发生时间的影响因素进行分析。另一个方法是对某一事件的观察时间进行回归分析,然而这种方法受监测和回答的极端不规律所制约。

Cox(1972)的风险比率模型(proportional hazards model)的引入给这以研究领域带来革命性的进展,它将上述两种方法进行了综合。Tuma(1976)以及Tuma和Hannan(1984)概括了这一方法使它能够分析诸如结婚和离婚这样的重复事件,多重类型事件(multiple type ),以及分析可在不同类型的情况间转换(比如不同的工作类别)的事件。Yamaguchi(1991)和Petersen(1991)提出了这一方法可行性,强调应该在社会学研究中加以应用。Mayer和Tuma(1990)描述了从社会科学中搜集来的一系列的有关案例研究。风险比率模型的一个重要的应用领域是有组织性的出生和死亡过程,这对社会学来说是独一无二的。Petersen(1995)将这一基础模型向更深的层次进行了扩展。在当事件相互联系,即当某一类型的事件发生与否影响其它类型事件发生概率时,对多类型事件进行研究。其中一个例子是研究失业与离婚之间的关系。Xie(2000)讨论了事件史分析在人口学和生命表分析中的起源。

医药学领域对Cox模型进行使用时,倾向于将基准风险(baseline hazard)作为非参数来使用,但是在社会科学领域,将它作为参数来使用有时会十分有效。例如,Yamaguchi(1992)对日本的长期雇佣进行了研究,在这项研究中生存比例和它的决定因素是最主要的兴趣点。他发现协变量同工作变化的时间以及生存比例都有关联。Yamaguchi和Ferguson(1995)将这一方法应用在生育的停止和间隔等问题的研究上。

社会科学中的事件史数据通常是在不连续的时间点上(比如按年)记录的,一方面是因

为事件倾向于在某年的特定的事件中发生,另一方面是因为测量方面的限制。结果,非连续时间上的事件史模型变得十分受欢迎(Allison,1982, 1984; Xie,1994),在某些情况下这种模型比连续时间事件史模型更容易使用。处理多层次事件史数据的方法,平缓的时间变化协变量(smoothly time-varying covariate)和其他因素都逐渐被介绍到这一领域当中(Raftery, Lewis and Aghajanian,1995; Fahrmeir and Knorr-Held,1997)。

这一基础框架被发现可以有效地模拟不同种类的现象:比如创新和社会影响的扩展。Burt(1987)为这一方法提出了一个理论框架,而提出通过扩展事件史模型来模拟这一框架的是Marsden和Podolny(1990),Strang(1991)以及Strang和Tuma(1993)。另一个由Diekmann(1989)和Yamaguchi(1994)发展出来的方法是使用加速失败时间模型(accelerated failure-time model)代替风险比例模型。

伴随社会科学中的事件史数据而产生的一个问题是,中断参与(drop out)常常与我们所感兴趣的事件联系在一起。例如,人们倾向于在离婚前不久中断参与研究,这对于离婚率的估计来说无疑是一个巨大的灾难。乍看起来这一问题似乎无法解决,但是Hill(1997)通过使用Hill,Axinn和Thornton(1993)建立的共享非测量风险因子(Shared Unmeasured Risk Factor, SURF)模型为这一问题构造了一个精美的解决方案。尽管我们不能知道中断参与的人中哪一些人确实会在不久后离婚,但是我们却可以估计哪些人是离婚风险最高的人,这便是这一方法的主要技巧。人们可以用这些信息来修正通过对含有离婚和中断参与等因素进行模拟得到的离婚率的经验值。

3.4 二分因变量(Binary Dependent Variables)

我们常用“有限因变量”(limited dependent variable)来指在某一回归模型中的分等级的因变量,由它的可能值构成的集合因为严重违反普通线性回归(normal linear regression)的假设条件而不能用这种方法进行分析。典型的例子是二分因变量,其他的包含了定类变量、定序变量和复合变量以及仅限取正值的变量。

有限因变量,尤其是二分因变量,在社会研究中不断出现,在顶尖的社会学期刊上有许多文章使用了专门为处理这种情况而发展出的模型和方法。不过这一领域的大多数研究方法的进展都是来自于社会学外的其他研究领域。但是,社会学家在介绍,改造和综合这些方法的工作中扮演了主要的角色。具体的情况可参阅Long(1997)以及Xie和Powers(2000)的著作。

对于二分变量,社会学在过去二十年中所使用的方法是逻辑斯蒂回归(logistic regression)。这一方法的许多早期的成就都是在医学领域中取得的(Cornfield,1951, 1962; Truett, 1967),Cox(1970)的专论则将这一方法介绍给更多的研究者。广义线性模型(generalized linear model)的出现(Nelder and Wedderburn, 1972),人们对逻辑斯蒂回归独特性的认识,以及相关的GLIM软件(Baker and Nelder,1977)的发展,帮助逻辑斯蒂回归成为许多学科,尤其是社会学和健康学中的标准的工具。现在GLIM软件的一些版本或者其衍生程序已经被包含在大多数的主要商业统计软件中。

逻辑斯蒂回归并不是对二分变量进行回归的唯一可用的模型。在大多数概率都分布在0和1中间时(比如在0.1和0.9之间),常规线性回归也可以得出相似的结果。而逻辑斯蒂回归比线性回归更加准确,比如说它将所得出的概率值限定在0和1之间。不过在1970年代和1980年代,围绕逻辑斯蒂回归是否真的有必要这一问题产生了一场辩论,反对者认为用这一模型进行估计太复杂,并且比起线性回归模型来需要更多的时间进行计算机处理。但是随着计算机运算速度的迅速提高,这一方法所需要的额外的运算时间便可以忽略不计,这场辩论最终得出了有利于逻辑斯蒂回归的结论。

另一种方法是逆正函回归(probit regression),在此回归中假设因变量产生于对一个不可观测正态随机变量的截断,这些变量的期望值与自变量呈线性关系。这以方法有着坚实的基础并且容易进行估计,因为它也是一种广义线性模型所以也可以用GLIM来进行估计;它得出来的结果与从逻辑斯蒂回归中的到的结果十分近似。然而,在社会学和其他诸多领域中,这以方法正逐渐被逻辑斯蒂回归所代替,这或许是因为逻辑斯蒂回归系数可以被作

为风险比来解释的缘故。但是在统计学界,近年来对逆正函回归的探讨又出现了一次复兴。这是因为潜在变量被引入这一方法,因此便可以相对容易的作为一个组成因素被包括到更为复杂的Bayes模型,这个模型常用马尔可夫链之蒙特卡罗法(MCMC),来进行估计(Albert and Chib, 1993)。

一个更进一步的模型是互补双对数回归(complementary log-log regression),在这一回归中log(-log(p))被假设为对因变量的一个线性组合,其中p为我们所关心的事件的条件概率。这也是一个广义线性模型并且容易用来进行估计。它可以比逻辑斯蒂回归更好的拟合数据,尤其对于自变量的极值它能给出十分不同的预测概率。这种方法的一个例子是由Raftery和Hout(1985)进行的关于爱尔兰教育变迁数据的讨论。详情可参见Kass和Raftery(1995)的有关著作。

Logan(1996, 1997)的双面对数比率模型(two-sided logit model)是一个重要的发展。这一模型认识到,在社会生活的许多情况中,个体需要在不同的结果之间进行选择,而决定这种选择的是个体倾向和态度以及现有的可能的选择。比方说,在劳动力市场中,个体最终找到什么样的工作,不仅取决于她或他自己的态度、倾向和长处,而且还取决于劳动力市场中其他应聘者、雇主的情况和他所可能获得的工作本身的情况。Logan的方法是将这些过程同时纳入模型中,通过分析他们之间相互作用来解释劳动市场的最终结果。这一模型既可以适用于个体层次的数据也适用于以交互表形式进行综合的数据。

3.5 其他有限因变量(Other Limited Dependent Variables)

逻辑斯蒂回归已经被扩展到对二分类以上的定类因变量的分析中,参见Hosmer和Lemeshow(1989)的著作。对多项逻辑斯蒂回归(multinomial logistic regression)模型的最大似然估计也变得比较直接并且对这一模型进行分析处理的软件也已经问世。Begg和Gray(1984)表明这一方法可以用一个适当的逻辑斯蒂回归来进行良好的近似。详情可参见Hosmer和Lemeshow(1989)。逻辑斯蒂回归也已经被扩展到对定序数据的分析中。见

McCullagh和Nelder(1989)以及Agresti(1990)的著作。

有限因变量的另一个重要的种类是用来分析因变量取值为正,但当它等于零时却对应一个不可忽视的概率值的情况。比如说从工作中取得的收入:一些人虽然失业或退出劳动力群体,他们从工作中获得的收入为零,但是另一些人却都有一定的收入。这种类型的数据通常用Tobin(1958)所创立的Tobit模型分析。在这个模型中,假设那些收入为零的人实际上有一笔未被观察到的取值为负的收入,他的真实收入(现在假定收入可以取所有的正值和负值)可以用常规的线性回归来获得。

Tobit模型的基本形式看起来不能令人满意。首先是因为这种假定的不可观察的值实际上不存在,有时那些收入为零的人实际收入确实为零(如果不考虑测量误差的话),而另一些未被观察到的负收入实际上也不存在。可能更为严重的是,模型中假设的决定人们是否能从工作中得到收入的那些变量,与决定人们有多少收入的那些变量基本相同。然而,如果哪些决定人们是否进入劳动力群体的因素,与那些决定已经在劳动力群体中人们获得多少收入的因素十分不同的话,情况可能会比较简单,但是在Tobit模型中这一点难以区分。

Tobit模型在针对二分因变量进行分析的专用模型出现和广泛传播之前就已经建立了。然而现在已经有了一种简单的办法能够避免Tobit模型的问题。即分两步建立模型。在第一步中,不论因变量值是否为0,都对其进行逆正函回归。第二步中,因变量为收入的数量,而且仅仅包含那些收入为正数的个体。这是一个标准的样本选择模型,它推动了Heckman(1979)二阶估计因素法(two-stage estimator)的发展。Amemiya(1985)将此称为第二类Tobit模型。Winship和Mare(1992)对这一领域的发展过程进行了梳理。

有限因变量的另一个类型从对复合数据(compositional data)的分析中产生的。其中因变量是所有正值之和的一个向量,包含了他们的比例。例如在对家庭开支的分析中,回答是一个向量,其中的每一个因素都是家庭总开销在不同类别上的比例,比如房租,食物,日常开销,教育等等。人们最初的想法是对每一个比例分别进行回归然后建立模型,或者使用一个能够分析不同回答之间相关性的多元回归的方法。但是这些方法都行不通,因为

将回答加总成为一类不满足标准分布假定限制了这些方法的应用。对这些数据的考察基于单一的,与这种三角关系相似的多维度关系,而不是基于完全的Euclidean 空间。Aitchison(1986)对这一问题的研究进行了总结,他的主要见解是首先将p 维的比例向量用多元逻辑斯蒂转换的方法在完全Euclidean 空间中转化成(p-1)维的向量,再用标准的方法进行处理。

3.6 多层次模型(Multilevel Models)

多层次模型将回归模型及其的广义模型扩展到一个新领域,在这一领域中个体层次的结果不仅仅依靠个体层次的共变,而且还依赖于社会情境。在社会科学中这些方法的发展都是在教育研究领域取得的。在一个经典案例中个体层面数据是评分和考试成绩,而情境则为班级,学校,学区,州等等。

人们经常对以下的情况感兴趣,即个体层次特征的影响效果,比如家庭收入,要取决于所处的情境。例如,我们可以假设在某些学校中家庭收入对学生考试成绩差异的影响要小于它在另一些学校中的影响。要检验这一假设的效果并且用模型对其进行估计,最简单的方法是通过固定的多层效果模型(a fixed effects multilevel model)。假设y i 是学生i 在学校s(i)中的成绩,数据代表了s 个学校,x i 是学生的家庭收入。这样一个固定效果模型是

i i i s i x y εβα++=)(, (3)

其中,βs(i)是家庭收入在学生i 的学校中对考试成绩产生的影响,并且),0(~2εσεN iid j 。每

一个学校j 都有一个不同的回归系数βj 。这一模型可以用普通最小二乘回归法进行估计。详细内容可参见Boyd 和Iversen(1979)以及Blalock(1984)的著作。

这一模型面临着一些困难。其中之一是模型中要估计的参数有(s+2)个,如果有许多学校包含在内的话,需要进行估计的参数就很多,因此这一模型就会变得难以进行精确的估计和解释。另一方面,如果来自某一学校的学生数量很少,对这一学校的回归系数的估计

毕业论文.概率统计在生活中的应用Word版

毕业论文 课题 学生姓名胡泽学 系别 专业班级数学与应用数学指导教师 二0 一六年三月

目录 摘要.................................................................... I ABSTRACT................................................................... II 第一章绪论. (1) 第二章概率在生活中的应用 (4) 2.1在抽签和摸彩中的应用 (4) 2.2经济效益中的应用 (8) 2.3在现实决策中的应用 (4) 2.4在相遇问题中的应用 (12) 2.5在预算及检测中的应用 (10) 结论 (13) 参考文献 (14) 致谢 (15)

概率统计在生活中的应用 摘要 随着时代的发展人类的进步,17—18世纪出现了一门新的学科概率论,概率论逐渐成为了为数不多的可以和传统数学相抗衡的学科之一,并一步步的走向了人们的生活,成为了人们生活中不可或缺的部分。 本文先简述了概率论的发展,之后从概率在抽签中的应用、经济效益中的应用、现实决策中的应用、追击相遇问题中的应用、最大利润问题中的应用、最佳配置问题中的应用、经济保险问题中的应用、获奖问题中的应用、概率和选购方案的综合应用、金融界中的应用、设计方案的综合应用、厂矿生产中的如何合理配置维修工人问题、在商品质检中的应用和在运输预算费用中的应用等。多方面论述了概率的应用。 关键词:概率;概率的含义;概率的应用

Abstract

第一章绪论 概率统计是一门和生活关联紧密的学科同样也是一门特别有趣的数学分支学科,17-18世纪,数学得到了快速的发展。数学家们打破了古希腊的演绎框架,社会生活对与自然界的多方面吸取灵感,数学领域涌现了许多新面孔,之后都形成了完整的数学分支。除了分析学这之外,概率论就是同时期能使"欧几里德几何不相上下"的几个伟大成就之一。 概率的发源与赌博有关,伴随着科学技术的发展进步以及计算机普及,它在最近几十年来的社会科学和自然科学中得到了特别广泛的应用,在生活与社会生产中起着很重要的作用。我们生活在一个千变万化千变万化、千变万化的时代里,而我们每个人无时无刻都要直面生活中遇到的问题。而其中很多的问题都是随机的与随机的随机的。如决策时如何获取最大利益,公司要如何组合生产才能取得最大收益,如何加大买彩票的获奖概率,怎样进行误差分析、所购买物品的产品检验,生产质量把控等,当我们在遇到这些问题时应该如何解决它呢?幸好我们如今有了概率,概率是一门探索和揭示随机现象和规律的一门学科。 实践证明,概率是对生活中碰到的问题进行量的解答的有效工具,对经济决策和预测提供了新型的手段。下文就通过列举实例来表述概率在抽签中的应用、经济效益中的应用、现实决策中的应用、追击相遇问题中的应用、最大利润问题中的应用、最佳配置问题中的应用、经济保险问题中的应用、获奖问题中的应用、概率和选购方案的综合应用、金融界中的应用、设计方案的综合应用、厂矿生产中的如何合理配置维修工人问题、在商品质检中的应用和在运输预算费用中的应用等。

教育统计学复习题及答案

《教育统计学》复习题及答案一、填空题 1.教育统计学的研究对象是.教育问题。 2.一般情况下,大样本是指样本容量.大于30 的样本。 3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。 4.统计工作的三个基本步骤是:、和。 5.集中量数是反映一组数据的趋势的。 6.“65、66、72、83、89”这组数据的算术平均数是。 7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。 8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。 9.参数估计的方法有和两种。 10.若两个变量之间的相关系数是负数,则它们之间存在。 11.统计工作与统计资料的关系是和的关系。 12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。 13.总量指标按其反映的内容不同可以分为和。 二、判断题 1、教育统计学属于应用统计学。()

2、标志是说明总体特征的,指标是说明总体单位特征的。() 3、统计数据的真实性是统计工作的生命() 4、汉族是一个品质标志。() 5、描述一组数据波动情况的量数称为差异量数。() 6、集中量数反映的是一组数据的集中趋势。() 7、在一个总体中,算术平均数、众数、中位数可能相等。() 8、同一总体各组的结构相对指标数值之和不一定等于100%。() 9、不重复抽样误差一定大于重复抽样误差。() 10. 一致性是用样本统计量估计统计参数时最基本的要求。() 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( )。 A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( )。 增加1个单位,y增加a的数量增加1个单位,x增加b的数量 增加1个单位,x的平均增加量增加1个单位,y的平均增加量 7.下列统计指标中,属于数量指标的有() A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 四、简答题 1.学习教育统计学有哪些意义?

试析统计学在工程项目管理中的应用

试析统计学在工程项目管理中的应用 摘要:随着时代的不断进步,科技的不断发展,各项领域之间的有机结合也变 得越来越广泛。将分析统计学应用到工程项目管理中,不仅能够使工程项目管理 变得更简单,更快捷,为企业的发展创造更具优势的条件,同时也能够使分析统 计学得到广泛使用的发展空间。本文通过对分析统计学进行概述,进而探讨出分 析统计学在工程项目管理中的应用。 关键词:分析统计学;工程项目管理;应用 工程项目管理是指对工程项目的组织实施全过程或若干阶段的管理和服务, 对于目前的工程建设而言,无论是在设计管理还是各项准备工作方面,工程项目 管理都发挥着不可言喻的重要作用,而在工程项目管理中,统计学占有主要地位。通过统计学的方式,能够将各项数据清晰的展示到项目管理人员面前,项目管理 人员通过进一步分析这些数据,就能够做出更为准确的决策,因此,在工程项目 管理中应用分析统计学是十分有必要的。 一、分析统计学概述 分析统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对 象的本质,甚至预测对象未来的一门综合性科学,在分析统计学中会运用大量的 数学知识和其他专业的相关知识,可以说其是一门综合性学科。人们在高中阶段 就接触过分析统计学的相关知识,其是以简单的概率计算作为运算基础,并随着 科技的进步,逐渐从抽象的知识转变为具体的数学结构模型,再结合对信息的采 集以及对信息的定性分析,利用人为手段对这些信息进行整理分析,从整合出来 的信息中提取有效的数据作为决策前的判断标准。目前,分析统计学无论是在各 个学科中,如物理学,还是在各个有关数据统计的相关部门中都得到了广泛的应用。主要原因是其在使用方法、处理数据上节省了人们一定的时间,并能够提取 到有效信息供人们参考,同时其也符合时代的发展要求,能将现代科技技术完美 的与分析统计学进行结合,因此,分析统计学在目前现代化建设中发挥着重要作用,并在工程项目管理中得到了广泛的应用。 二、分析统计学在工程项目管理中的应用 (一)施工前做的准备工作 在工程项目管理中,工程施工前所做的前期工作往往得不到相关人员的重视,但往往施工前的准备工作会在施工过程中发挥重要的作用。施工前做的准备工作 主要包括搜集技术资料、熟悉施工设计图纸、编制施工方案和应急方案、编制施 工预算以及在施工工程现场预测和设备安排。除了现场施工和设备安置,施工前 所做的准备工作大多都与分析统计学相关。在搜集技术资料方面,技术资料的涉 及面很广,既包括施工现场周围的环境状况,又涉及到供水供电等各项条件能否 成为施工过程中的基础条件,这些资料多而复杂,若堆积在一起难免会丢失,但 这些都将在施工过程中作为重要的参考资料,因此必须要妥善保管,利用统计学 就能很好的将这些繁杂的资料分类整理,并能够将这些重要的资料存在电脑中, 既不会发生长时间破损的现象,也不会造成丢失。图纸可谓是施工过程中一份重 要资料,一旦在施工过程中发生问题,图纸是第一时间所要寻找考证的资料,运 用统计学的方式将图纸等重要资料整理保管起来,统计学还能够针对图纸进行具 体分析,是否图纸中存在大的问题,若在施工过程中发现问题,能够第一时间用 过搜索引擎找到图纸,既方便查找,也不会耽误施工时间。施工预算是决定施工 能否进行下去的重要因素,施工预算既要将市政工程预算定额和相关规定考虑进

应用文-统计学在经济发展中的作用分析

统计学在经济发展中的作用分析 '学在 中的作用分析 引言 统计源于国情调查,后来被 在国家各项 的实际效果分析方面。我们常见的应用在国情调查方面的统计包括统计工作、统计资料和统计科学。本文探讨的统计学,是对统计工作、统计资料和统计科学的结合应用的探索。 一、经济发展中的统计学应用 1.统计学的主要应用领域 统计学应用在政府经济控制中,表现为对 经济发展各个方面的数据收集和统计分析,例如,对工业、 、商业的经济收入增长值的计算、对国家各行业 增长比率的计算等;统计学应用在企业经济发展中通过财务核算和 工作,对企业运营的成本以及利润进行计算,对企业经营过程中的各项业务的盈利情况以及企业在人力资源 等工作方面的投入。 2.统计学应用的特征 统计学包括了统计资料、统计工作和统计科学三个方面,这三个方面的应用是相辅相成的,无论是在政府经济管理中的应用还是在企业经济行为中的应用,统计学的这三个方面的应用都表现出相同的特征。第一,统计学实际的工作对象是数字,通过数字对经济发展状况的总体状态进行描述,能够保证经济情况的客观性;第二,统计学应用的基础是大量的数据调查,一切统计结论的生成都必须是基于大量调查的,科学地编制问卷并选择合适的统计方法,是统计学应用发挥作用的依据。 3.探讨统计学在经济发展中的作用的必要性 无论对于政府经济管理还是企业经济活动,统计学的统计资料、统计工作和统计科学都影响着统计学应用的结果,不同的数据来源、本文由 联盟 收集整理不同的统计方法以及不同的统计员理会形成完全不同的统计结果,所展示出的经济发展状况也就完全不同。政府和企业要充分了解经济发展状况,就必须先明确统计工作对经济发展的影响,对统计学应用加以重视,才能保证社会经济发展的数据是真实的、可靠的,才能保证政府对经济的管理行为和企业实施的经济发展决策是科学的。 二、统计学在经济发展中的作用 1.统计学影响政府的经济政策 统计工作的重要性越来越明显,而且已经成为当前我国政府经济工作中不可替代的存在。当前的统计工作能够将国家生产力发展质量充分地展现出来。其中,既包括广大人民群众的生产与生活状况,又包括城乡居民的人均收入以及出水平等社会广泛关注的经济发展问题;同时,还可以为社会经济的发展提供重要的指导依据,从而使政府的宏观经济决策更加高效。由此可知,统计工作已经涉及到我国社会经济发展的方方面面,并对各领域的经济发展起到了重要的影响作用。 2.统计学为国家和企业的经济决策提供建议 统计学的应用还能够为国家和企业的经济决策提供建议。例如,统计数据表示出一城一乡的民众经济水平的差异,结合城乡发展的战略目标制定以及城市政府的能力,政府就可以根据统计数据表现出城乡差异的原因进行经济决策的制定,以此实现城乡共同进步的执政目

统计学在生产生活中的应用

一、统计学在社会生活中的应用 统计学的出生是研究国家状况的,譬如统计全国人口状况、农业收成、经济情况等数据,对一国经济与社会发展做统计性调查与研究。经过多年的发展,统计学在社会生活中的应用被专家学家们系统化专业化,形成了不同流派不同类别的统计学。而现在的人文社会统计分类便是对社会生活中统计学应用的专业化成果。 前面提到过的人口普查、经济情况调查等都是统计学在社会生活中的应用。早在17世纪,统计学在社会生活中的应用就被提出了。在约翰·格朗特1662年出版了《对死亡表的自然观察和政治考察》一书中,格朗特通过观察客观现象的数量关系,揭示出一系列统计规律,如男婴出生高于女生,男性死亡高于女性等,同时他还用最新颖的方法编制出了死亡率表。18世纪中末叶到19世纪中末叶期间概率论与统计学成功结合,使得统计学在生活中的应用更加被加以重视。 在当代社会,统计学的应用越来越普及,人口学中的统计学应用(进行优生优育)、社会发展与评价、持续发展与环境保护、资源保护与利用、宏观经济监测与预测、政府统计数据收集与质量保证等都依赖于各类科学的统计方法。 二、统计学在企业生产及社会经济生活中的应用 统计学在企业生产、经济生活中的应用很广,其中包括了保险精算、金融业数据库建设与风险管理、宏观经济监测与预测等一系列经济研究应用问题。 在金融业的统计学应用方面,运用统计方法研究金融风险,建立风险监测系统,不仅能够为管理层宏观调控金融市场提供科学的理论依据,而且对投资个人和机构实施风险控制具有重要指导作用。 企业经济管理对统计学的运用也是必不可少的。其中,统计方法在企业质量管理中的应用研究就是一个典型的应用实例。“九五”期间,“ISO9000”认证成为国际贸易中所要求的供方质量保证能力和水平的标志。ISO9000族标准中有许多要素涉及到统计技术与方法的应用,例如紧密结合某企业或某产品的生产过程,运用统计方法,实施产品设计、生产的全过程控制,同时还可将统计学中的“6”质量标准应用于企业的质量管理中。 统计学知识在企业生产管理中的应用当然不只限于企业质量管理。利用统计学知识还可以进行企业财务风险分析、顾客行为分析、

(0282)《教育统计学》网上作业题及答案

(0282)《教育统计学》网上作业题及答 案 1:第一批次 2:第二批次 3:第三批次 4:第四批次 5:第五批次 1:[判断题] 要了解一组数据的离散程度,需计算该组数据的差异量。 参考答案:正确 一、名词解释题 1、自学辅导模式是在教师指导下,学生自己独立进行学习的模式。 2、教学过程就是以师生相互作用的形式进行的,以教科书为主要认识对象的,实现教学、发展和教育三大功能和谐统一的特殊认识和实践活动过程。 3、个别化教学是为满足每个学生的需要、兴趣和能力而设计的一种教学组织形式。 4、微型课程是一种容量很小的课程,它一般是作为短期的选修课程,是建立在教师和学生兴趣的基础上,强调深度而不强调广度的课程。 二、简答题 1、在“教”和“学”这一主要矛盾中,矛盾的主要方面是“学”,即学生的学是教学中的关键问题,教师的教应围绕学生的学展开。在教学过程中,只有通过学生自身的学习活动才能达到教学目标,其他任何人无法替代学生的认知活动和情感体验。学生唯有通过自己的独立思考才能认识客观世界、认识社会,把课程、教材中的知识结构转化、纳入到自身的认知结构中去;学生唯有发挥主观积极性,才能在主动探究的学习中锻炼自己,发挥自己的才能;学生唯有经过自己的体验,才能树立正确的世界观、人生观、价值观。 2、班级教学的不足: 由于学生人数众多,教学活动往往需要教师加强控制,因此学生的独立性、创新精神和创新能力的发展受到限制。 教学面向全班学生,步调一致,难以照顾学生的个别差异,不利于因材施教,不利于发展学生的个性 由于班级教学常常采用教师讲授、学生接受的教学方法,虽然对学生掌握系统的科学文化知识有利,但对于实践能力的培养不利。 3、教学环境具有导向功能、凝聚功能、陶冶功能、激励功能、健康功能、美育功能。 4、布置有意义的学习任务。学习任务应该与学生的知识水平、理解水平、经验水平相适应;学习任务应该与训练目标相关,学生完成学习任务的过程应该是巩固新知识的过程;学习任务应该是积极有效的。 布置学习任务应该注意新旧知识的联系。 学习任务的内容与形式应该多样化。 针对学生不同的能力水平,布置不同的学习任务 三、判断说理题

统计学在工程项目管理中的应用

统计学在工程项目管理中的应用 摘要:工程项目管理中应用统计学工作方法,可以及时、准确、快速反映工程项目施工、生产活动、完成计划等全方位的信息,为企业赢得了有力的竞争条件。本文以统计学知识在工程项目中的运用为主,结合企业实际情况运用统计学知识来指导工程管理工作,提出加强工程管理工作应采取的统计方法和手段,探讨改进管理工作的办法,使工程管理工作更好、更有效地为提高企业经济效益服务。 关键词:统计学;工程项目;应用 统计学在工程项目管理中的应用 摘要:工程项目管理中应用统计学工作方法,可以及时、准确、快速反映工程项目施工、生产活动、完成计划等全方位的信息,为企业赢得了有力的竞争条件。本文以统计学知识在工程项目中的运用为主,结合企业实际情况运用统计学知识来指导工程管理工作,提出加强工程管理工作应采取的统计方法和手段,探讨改进管理工作的办法,使工程管理工作更好、更有效地为提高企业经济效益服务。关键词:统计学;工程项目;应用 一、对工程统计与项目管理的认识 工程统计工作有其自身独特的内涵,是由统计人员对本单位

工程内容的数量进行有计划、有步骤地调查整理和分析研究活动,最终形成统计报表,用来描绘工程项目的进展情况,预算资金使用情况等。便于领导掌握施工进度及工程进度款的拨付情况,为领导的施工决策提供依据;统计报表是依据《统计法》的规定向上级主管部门履行的一种报告制度,是自上而下地统一布置、自下而上地逐级提供基本统计数据的一种方式。 工程项目管理要实施有效的管理,首先要建立一个完善、高效的管理机构。管理机构的职能、组织、结构及制度一系列的选择、筹划和确定均需要统计信息上报的资源来完成,经过数量性和综合性的分析,制定科学合理管理机构,有准备的组织实施对工程项目的管理。 在全面掌握工程项目情况的基础上,应用统计学普遍性原理为管理工作了解必要的足够的细节问题,从而把未知因素降到最低。在关键点设立检查点,使得管理人员能够随时监控,及时发现问题,能对出现的异常现象做出快速反应。即以统计信息为基础,建立项目工程管理基线,进一步分配给各级工作细目,最后建立项目工程的管理沟通网络。综合性在工程项目管理中以统计数字显示或以统计数字为依据结合其它信息对自身进行定量定性分析, 而且对与工程项目管理有联系的劳动力资源、建筑材料、机械设备等的供应来源、价格、条件以及市场预测等情况;并且以统计数字、统计指标

统计在经济和生活方面的应用

统计在经济和生活方面的应用 随着时代的发展,我国的经济已经发生了巨大的改变,广大人民的生活质量日益提高。今时今日,统计与我国的经济以及生活息息相关。 本文主要分析了统计在我国经济以及生活当中的应用情况,从而了解统计学所起到的重要作用。 统计是一种计算的模型,它在我们的日常生活中随处可见,在经济活动中更是频繁使用。目前已经有很多的学科都涉及了统计知识。通过对统计的资料进行整理和分析,本文分别对统计在经济以及生活当中的应用情况进行了分析,望能起到一定的借鉴作用。 一、经济活动中的统计应用 统计在古代的时候就已存在,随着时间的发展逐渐应用于各个领域,包括社会科学、管理以及经济等等。如今,统计已经在这些领域发挥着重要的作用。人们在日常生活中经常需要应用到统计,掌握相关的统计知识,能够让人们更好的制定计划。例如一个股民需要购买或售出股票的时候,就会应用统计知识来作出决策,从而让自己的收益得到增加。

曾经有这样的一句话,说一个发展迅猛的国家,统计工作也将更加的完善和科学。这句话其实是本末倒置了,因为有了完善的统计知识,这样所得到的经济、人口数据都更加的接近实际情况,在这样的基础之上,所作出的决策就更加的合理,公共政策也能够更加符合当前的民生情况。 在决策制定并执行以后,还可以利用统计知识来收集相关的信息,这样能够进一步的监督决策的执行情况,及时的进行调整。就理论上而言,统计是在许多变化的数字当中寻找出一定的规律,从而用来研究这些不断变化的现象。它对于我国的经济有着很重要的作用,除了进行决策,风险评估以及利润效益都和统计有着密不可分的关系。 除此以外,统计在我国经济活动中的重要地位也体现在商业企业,创办商业企业的主要目的是为了让利润最大化,所以作为商业企业主一定会通过多种营销方式来尽可能的获得更多的收益,例如降价促销以及饥饿营销等等,这些营销方式听起来是在亏钱,但是事实上却是为企业创造了更多的利润。什么时候进行降价促销,这些都需要依靠相关的数据来进行决策,此时统计就发挥出了应有的作用。 尽管一个商业企业的利润会受到各种因素的影响,但是在这些因素背后通常都可以寻找到一种规律,通过统计得出这些规律之后,就能够让商家在制定营销手段的时候,有相应的数据支撑,从而做到低产出

Excel在统计学中的应用(doc 16页

Excel在统计学中的应用(doc 16页

《统计学》 实验指导书

学任务,由实验教师指导学生进行数据整理和数据分析。 ⒉适用专业 统计学实验适用的专业是经济和管理类各专业。 ⒊先修课程 概率与数理统计、统计学 ⒋实验课时分配 实验项目学时 实验一中文Excel的概述和基本操作1 实验二Excel在描述统 计学中的应用 2 实验三Excel在推断统 计学中的应用 2 实验四社会调查的数 据处理及调查报告的撰写 3 ⒌实验环境(对实验室、机房、服务器、打印机、投影机、网络设备等配置及数量要求) 本实验按自然班分组,每次实验指导教师指导一个实验小组,为此统计上机实验需设35个座位,实验台上配备Excel统计数据的实际案例,如教科书,教师搜集到的最新的经济管理类相关的统计数据、统计图、统计表并复印给每位学生,

教授学生Excel统计功能的幻灯片及实际操作的随堂作业;××统计调查报告的范本等等。 主要统计调查报告的制作流程图要悬挂在实验室墙壁上,便于学生参阅及按步骤有的放矢的完成调查报告,同时营造良好的实验环境。 ⒍实验总体要求 (1)通过统计学上机实验,进一步巩固课堂所学的理论知识。在实验中,要将理论课所讲的内容与实际操作进行对照,弄清模拟实验资料中全部经济数据的统计处理。 (2)进行操作,提高实际工作能力。在实验中,为学生配备了相关的经济管理类数据分析内容,比如:近几年的居民消费价格指数和分析预测内容,学生要按要求进行图表绘制并根据结果进行适当的定性分析,提高实际分析能力。 (3)通过实验,掌握统计学的基本常识,为进一步处理复杂经济现象形成的数据分析打下良好的基础。 进行统计实验时,一般应遵循下列要求:①动手操作之前,要弄清每个实验的目的和要求,并对教材的有关内容进行认真的复习,以便顺利完成各项实验。

精选-《教育统计学》复习题及答案

《教育统计学》复习题及答案 一、填空题 1.教育统计学的研究对象是.教育问题。 2.一般情况下,大样本是指样本容量.大于30 的样本。 3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。 4.统计工作的三个基本步骤是:、和。 5.集中量数是反映一组数据的趋势的。 6.“65、66、72、83、89”这组数据的算术平均数是。 7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。 8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。 9.参数估计的方法有和两种。 10.若两个变量之间的相关系数是负数,则它们之间存在。 11.统计工作与统计资料的关系是和的关系。 12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。 13.总量指标按其反映的内容不同可以分为和。 二、判断题 1、教育统计学属于应用统计学。() 2、标志是说明总体特征的,指标是说明总体单位特征的。() 3、统计数据的真实性是统计工作的生命() 4、汉族是一个品质标志。() 5、描述一组数据波动情况的量数称为差异量数。() 6、集中量数反映的是一组数据的集中趋势。() 7、在一个总体中,算术平均数、众数、中位数可能相等。() 8、同一总体各组的结构相对指标数值之和不一定等于100%。() 9、不重复抽样误差一定大于重复抽样误差。() 10. 一致性是用样本统计量估计统计参数时最基本的要求。() 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( )。

A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( )。 A.x增加1个单位,y增加a的数量 B.y增加1个单位,x增加b的数量 C.y增加1个单位,x的平均增加量 D.x增加1个单位,y的平均增加量 7.下列统计指标中,属于数量指标的有() A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 四、简答题 1.学习教育统计学有哪些意义? 答:(1)教育统计是教育科学研究的工具; (2)学习教育统计学有利于教育行政和管理工作者正确掌握情况,进行科学决策; (3)教育统计是教育评价不可缺少的工具; (4)学习教育统计学有利于训练科学的推理与思维方法。 2.统计图表的作用有哪几方面? 1)表明同类统计事项指标的对比关系; (2)揭示总体内部的结构; (3)反映统计事项的发展动态; (4)分析统计事项之间的依存关系; (5)说明总体单位的分配; (6)检查计划的执行情况; (7)观察统计事项在地域上的分布。 3.简述相关的含义及种类。 答:相关就是指事物或现象之间的相互关系。

统计学在工程项目管理中的应用.doc

统计学在工程项目管理中的应用- 摘要随着社会项目管理的不断发展,统计学工作方法越来越多的应用到工程项目管理中。统计工作可以及时、准确、快速反映工程项目目施工、生产活动、完成计划等全方位的信息,为企业赢得了有力的竞争条件。为此统计工作的重要性也越来越受到重视。通过对统计学以及项目管理特点的研究,分析统计学在工程项目管理中应用的必要性以及必然性。更多还原关键词统计学工程项目应用 一、统计学概述 统计学(statistics)是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。统计学的基本研究方法有:大量观察法、统计分组法和归纳推断法。统计学与工程项目相结合形成了工程统计学。 二、统计学在工程项目管理中的应用 (一)在工程项目组织管理中的应用 工程项目管理要实施有效的管理,首先要建立一个完善、高效的管理机构。管理机构的职能、组织、结构及制度一系列的选择、筹划和确定均需要统计信息上报的资源来完成,经过数量性和综合性的分析,制定科学合理管理机构,有准备的组织实施对工程项目的管理。在全面掌握工程项目情况的基础上,应用统计学普遍性原理为管理工作了解必要的足够的细节问题,从而把未知因素降到最低。在关键点设立检查点,使得管理人员能够随

时监控,及时发现问题,能对出现的异常现象做出快速反应。即以统计信息为基础,建立项目工程管理基线,进一步分配给各级工作细目,最后建立项目工程的管理沟通网络。 (二)在工程项目施工过程中的应用 在工程项目施工过程中更加要求统计信息及时、详实、完整,随时需要将系统的统计信息,收集、整理、分析、决策、优化决策,优化决策实施过程又是统计信息反馈、调整、优化的过程,说明统计信息不是单纯地罗列数据,如同点连成线,要有机结合,否则只是满纸涂鸦,毫无意义。也不是单纯的技巧和手段,数学技巧往往容易使人们对精确性和可靠性产生错误印象。一切要以科学分析为基础,否则统计信息将失去光辉。 (三)统计学图表在工程项目中的应用 工程项目中我们可以利用统计学理论生成图表,清晰明了的进行管理。例如,控制表是根据时间推移对工程项目管理程序运行结果的一种图表展示,常用于判断管理程序是否“在控制中”进行。当一个程序在控制之中时,不应对它进行调整。管理控制表可以用来监控工程施工中的变量的输出,尽管控制表常被用于跟踪重复性的活动,诸如生产事务,它还可以用于监控成本和进度的变动、容量和范围变化的频率,项目文件中的错误,或者其他管理结果,以便判断“项目管理程序”是否在控制之中。再如,流程图。在工程项目管理中统计流程图应用很广泛,有助于分析问题是如何发生的。 三、统计应用于工程项目中时应注意的问题 将统计学应用于工程项目管理,还需要建立健全相关制度,增强领导对工程统计工作的认识,增强统计工作的独立性,加强员工统计知识培训,以提高相关人员的业务素质,同时将统计技

数理统计在生活中的应用

统计在生活中的应用 统计是从数据中获得信息的科学。统计与实际生活息息相关,在生活实践中有着广泛的应用。从古代的结绳记事到现在的市场调查都是统计的应用。 我国设有国家统计局、地方统计局进行各种统计工作,从数据中获取信息指导我们国家的发展。统计局主要负责的工作有人民的生活、价格指数、就业人员和职工工资、人口、国内贸易、对外经济贸易、农业、工业等统计项目。我们所得到的城乡居民家庭人均收入及恩格尔系数、农产品生产价格指数、各地区居民消费指数及商品零售价格指数、各地区按行业分城镇私营企业和个体就业人数、人民币汇率(年平均价)等等,这些数据我们都可以从统计局的统计结果中获得。国家就是通过统计局人员对各类数据进行统计获取信息,根据信息制定下一年度的工作发展方向。 除了国家需要统计,我们的日常生活也需要统计。买股票,需要对历史的数据进行分析总结得出变化趋势;理财,需要对储蓄和消费进行合理的规划;天气预报,需要到对卫星收集来的数据进行分析得出未来变换趋势;农作物的收成,可以对历史年份产量统计求平均数获得一般收成量近似求出;选择旅游路线,需要对多种路线的路况、历程进行分析获得最优路线??????可以说统计在运用到我们生活的各个方面。 作为学生,我们身边也有很多易于发现的事运用了统计。我们的总成绩、平均成绩、学籍管理、经常参加的发放调查问卷、那个食堂的饭菜好吃、哪里买东西便宜等等都运用到了统计,统计可以说无处不在。 1.平均数与标准差的互补 我们知道:平均数反映的是现象的集中趋势,是现象的一致性结果。而标准差是现象的离中趋势,反映了现象差异性的变化。这两个指标从不同角度描述了现实中事物的对立和统一的情形。 例如:银行办理业务事项。 银行提高服务质量的重点是顾客的等待时间,在工作人员(或窗口)一定的条件下提高银行的服务质量,实际上就是如何缩短顾客的等待时间(平均数)和减少顾客等待时间的差异(标准差)。在缩短顾客的等待时间上,要求银行的工作人员有熟练的业务技巧,使处理的每一笔业务尽可能地在短时间内完成,从而提高整个银行的服务质量。 在这一点上,银行改变了原来由顾客填写单据而造成的不必要的时间上的浪费,也对减少顾客服务时间、减少顾客重复排队和减少顾客或因不了解业务而产主的尴尬,在减少顾客等待的时间差异上来说,就需要银行在管理手段上引入更好的机制。 现在银行已经采用了叫号的方法,每个顾客来到银行后,先在窗口上领一个号,然后,坐在有电视、茶水、报纸旁的座位上等待服务。这种将顾客分别站在每一个窗口等待办理业务改变为顾客都在同一等待线上等待办理业务的做法,从实现和心理两个方面,减少了顾客等待时间上的差异。 首先,以前顾客来到银行后,看到每个窗口都排了很长的队,不知道选择哪个队,可能会离开或者等下次再来。也许留下来的顾客很可能因不知道前面顾客的业务量大小而选择了需要等待时间较长的队,造成排在其他队比他后来的顾客先行办理完业务。这时,本来就因排队而厌烦的顾客又因“错”排了队,而使等待的时问相对较长,所形成的心理上的抱怨就会形成对银行服务质量不好。工作

(完整版)现代心理与教育统计学练习卷3附答案(共八套)

练习3 1.按照数据的获得方式,找出下列数据中与其它不同类的数据。( ) A.72克 B.65分 C.10米 D.3台 2.测量数据10.000的下实限是:( ) A.10.999 B.9.999 C.9.9995 D.10.0005 3.欲从某重点中学720名高一学生中随机抽取120名调查其视力情况。首先按原有视力记录,将他们的视力情况分为上、中、下三等,各等人数分别为108人、360人、252人。若用分层按比例抽样法,则中等视力水平的学生中应抽取:( ) A.18人 B.60人 C.42人 D. 72人 4.某班期末考试,语文平均成绩为82分,标准差为6.5分;数学平均成绩为75分,标准差为5.9分;外语平均成绩为66分,标准差为8分,问哪一科成绩的离散程度大?( ) A.语文 B.数学 C.外语 D.无法比较5.假如某班成绩服从正态分布,在按优、良、中、及格、不及格评定学生成绩时,良等成绩z分数应取值在哪个区间?( ) A.-0.6--0.6 B.-1--1 C.0.6--1.8 D.0.5--2.5 6.在正态分布中,标准差反映了:( ) A.随机变量的波动性 B.正态曲线的对称位置 C.随机变量的平均水平 D.正态曲线的陡峭程度 7.下列数据1,26,11,9,14,13,7,17,22,2的中位数是:( ) A.14 B.13 C.17 D.12 8. 某校1970年的教育经费是10万元,2002年的教育经费是121万元,问该校2010 年的教育经费是多少?( ) A.225.63万元 B.278.32万元 C.321.56万元 D.210.00万元 9. 有研究者调查了358名不同性别的学生对某项教育措施的评价态度,结果如下: 男性拥护66人,反对106人;女性拥护28人,反对158人,那么性别与评价态度的相关系数为( )

数理统计在实际问题中的应用方法

数理统计在实际问题中的 应用方法 Prepared on 22 November 2020

数理统计在实际问题中的应用方法 哈尔滨工业大学,材料科学与工程一班,哈尔滨 150001 摘要:数理统计在自然科学、工程技术、管理科学及人文社会科学中得到越来越广泛和深刻的应用,其研究的内容也随着科学技术和经济社会的不断发展而逐步扩大。随机现象无处不在,渗透于日常生活的各个方面和科学技术的各个领域。概率统计就是通过研究随机现象及其规律从而指导人们从事物表象看到其本质的一门科学。学好概率尤其是能够将学习的概率统计应用于实践中将受益匪浅。 关键词:概率统计;实际问题;应用方法 数理统计是伴随着概率论的发展而发展起来的一个数学分支,研究如何有效的收集、整理和分析受随机因素影响的数据,并对所考虑的问题作出推断或预测,为采取某种决策 和行动提供依据或建议。数理统计以概率论为基础,研究社会和自然界中大量随机现象数 量变化基本规律的一种方法。其主要内容有参数估计、假设检验、相关分析、试验设计、 非参数分析和过程统计等。数理统计学是统计学的数学基础,从数学的角度去研究统计 学,为各种应用统计学提供理论支持。它研究怎样有效地收集、整理和分析带有随机性的 数据,以对所考察的问题作出推断或预测,直至为采取一定的决策和行动提供依据和建议 的数学分支。 1 数理统计的发展 数理统计起源于人口统计、社会调查等各种描述性统计活动。公元前2250年,大禹治水,根据山川土质,人力和物力的多寡,分全国为九州;殷周时代 实行井田制,按人口分地,进行了土地与户口的统计;春秋时代常以兵车多寡 论诸侯实力,可见已进行了军事调查和比较;汉代全国户口与年龄的统计数字 有据可查;明初编制了黄册与鱼鳞册,黄册乃全国户口名册,鱼鳞册系全国土 地图籍,绘有地形,完全具有现代统计图表的性质。我国缺少系统研究,未形 成专门的着作。 在西方各国,统计工作开始于公元前3050年,埃及建造金字塔,为征收建筑费用,对全国人口进行普查和统计。到了亚里土多德时代,统计工作开始往 理性演变。这时,统计在卫生、保险、国内外贸易、军事和行政管理方面的应 用,都有详细的记载。统计一词,就是从意大利一词逐步演变而成。 2 数理分析用途 2-1提供表示事物特征的数据

概率论与数理统计在日常生活中的应用毕业论文

概率论与数理统计 在日常经济生活中的应用 摘要:数学作为一门工具性学科在我们的日常生活以及科学研究中扮演着极其重要的角色。概率论与数理统计作为数学的一个重要组成部分,在生活中的应用也越来越广泛,近些年来,概率论与数理统计知识也越来越多的渗透到经济学,心理学,遗传学等学科中,另外在我们的日常生活之中,赌博,彩票,天气,体育赛事等都跟概率学有着十分密切的关系。本文着眼于概率论与数理统计在我们生活中的应用,通过前半部分对概率论与数理统计的一些基本知识的介绍,包括概率的基本性质,随机变量的数字特征及其分布,贝叶斯公式,中心极限定理等,结合后半部分的事例分析讨论了概率论与数理统计在我们生活中的指导作用,可以说,概率论与数理统计是如今数学中最活跃,应用最广泛的学科之一。 关键词:概率论数理统计经济生活随机变量贝叶斯公式

§2.1 在中奖问题中的应用 集市上有一个人在设摊“摸彩”,只见他手拿一个黑色的袋子,内装大小.形状.质量完全相同的白球20只,且每一个球上都写有号码(1-20号)和1只红球,规定:每次只摸一只球。摸前交1元钱且在1--20内写一个号码,摸到红球奖5元,摸到号码数与你写的号码相同奖10元。 (1) 你认为该游戏对“摸彩”者有利吗?说明你的理由。 (2) 若一个“摸彩”者多次摸奖后,他平均每次将获利或损失多少元? 分析:(1)分别求出“摸彩”者获奖5元和获奖10元的概率,即可说明; (2)求出理论上的收益与损失,再比较即可解答. 20 (5+10)-1=-0.25<0,故每次平均损失0.25元. §2.2 在经济管理决策中的应用 某人有一笔资金,可投入三个项目:房产x 、地产 y 和商业z ,其收益和市场状态有关,若把未来市 场划分为好、中、差三个等级,其发生的概率分别为10.2p =,20.7p =, 30.1p = ,根据市场调研的情况可知不同等级状态下各种投资的年收益(万元) ,见下表: 请问:该投资者如何投资好? 解 我们先考察数学期望,可知 ()()110.230.730.1 4.0E x =?+?+-?=; ()()60.240.710.1 3.9E y =?+?+-?=; ()()100.220.720.1 3.2E z =?+?+-?=; 根据数学期望可知,投资房产的平均收益最大,可能选择房产,但投资也要考虑风 险,我们再来考虑它们的方差: ()()()()222 1140.2340.7340.115.4D x =-?+-?+--?=;

心理和教育统计学课后题答案解析

张厚粲现代心理与教育统计学第一章答案 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量. (2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。(7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。(8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值. 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系.它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。 凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理与教育现象是一种客观存在的事物,它也有数量的表现.虽然心理与教育测量具有多变性而且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与教育统计就是对心理与教育问题进行定量分析的重要的科学工具. ③广大心理与教育工作者学习心理与教育统计学的具体意义. a.可经顺利阅读国内外先进的研究成果。

分析统计学在工程项目管理中的应用

分析统计学在工程项目管理中的应用 分析统计学在工程项目管理中的应用 工程项目管理要实施有效的管理,首先要建立一个完善、高效的管理机构,下面是我搜集整理的一篇相关论文范文,欢迎阅读参考。 摘要:工程项目管理中应用统计学工作方法,可以及时、准确、快速反映工程项目施工、生产活动、完成计划等全方位的信息,为企业赢得了有力的竞争条件。本文以统计学知识在工程项目中的运用为主,结合企业实际情况运用统计学知识来指导工程管理工作,提出加强工程管理工作应采取的统计方法和手段,探讨改进管理工作的办法,使工程管理工作更好、更有效地为提高企业经济效益服务。 关键词:统计学;工程项目;应用 一、统计学概述 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。统计学的基本研究方法有:大量观察法、统计分组法和归纳推断法。统计学与工程项目相结合形成了工程统计学。 - 二、统计学在工程项目管理中的应用 在工程项目组织管理中的应用 工程项目管理要实施有效的管理,首先要建立一个完善、高效的管理机构。管理机构的职能、组织、结构及制度一系列的选择、筹划和确定均需要统计信息上报的资源来完成,经过数量性和综合性的分

析,制定科学合理管理机构,有准备的组织实施对工程项目的管理。在全面掌握工程项目情况的基础上,应用统计学普遍性原理为管理工作了解必要的足够的细节问题,从而把未知因素降到最低。在关键点设立检查点,使得管理人员能够随时监控,及时发现问题,能对出现的异常现象做出快速反应。即以统计信息为基础,建立项目工程管理基线,进一步分配给各级工作细目,最后建立项目工程的管理沟通网络。 在工程项目施工过程中的应用 在工程项目施工过程中更加要求统计信息及时、详实、完整,随时需要将系统的统计信息,收集、整理、分析、决策、优化决策,优化决策实施过程又是统计信息反馈、调整、优化的过程,说明统计信息不是单纯地罗列数据,如同点连成线,要有机结合,否则只是满纸涂鸦,毫无意义。也不是单纯的技巧和手段,数学技巧往往容易使人们对精确性和可靠性产生错误印象。一切要以科学分析为基础,否则统计信息将失去光辉。 统计学图表在工程项目中的应用 工程项目中我们可以利用统计学理论生成图表,清晰明了的进行管理。例如,控制表是根据时间推移对工程项目管理程序运行结果的一种图表展示,常用于判断管理程序是否在控制中进行。当一个程序在控制之中时,不应对它进行调整。管理控制表可以用来监控工程施工中的变量的输出,尽管控制表常被用于跟踪重复性的活动,诸如生产事务,它还可以用于监控成本和进度的变动、容量和范围变化的频率,项目文件中的错误,或者其他管理结果,以便判断项目管理程序

相关文档
相关文档 最新文档