文档视界 最新最全的文档下载
当前位置:文档视界 › 计量经济学--名词解释--简答题--部分汇总

计量经济学--名词解释--简答题--部分汇总

计量经济学--名词解释--简答题--部分汇总
计量经济学--名词解释--简答题--部分汇总

计量经济学

第一部分:名次解释

第一章

1、模型:对现实的描述和模拟。

2、广义计量经济学:利用经济理论、统计学和数学定量研究经济现象的经济计量方法的统称,包括回归分析方法、投入产出分析方法、时间序列分析方法等。

3、狭义计量经济学:以揭示经济现象中的因果关系为目的,在数学上主要应用回归分析方法。

第二章

1、总体回归函数:指在给定Xi 下Y 分布的总体均值与Xi 所形成的函数关系(或者说总体被解释变量的条件期望表示为解释变量的某种函数)。

2、样本回归函数:指从总体中抽出的关于Y ,X 的若干组值形成的样本所建立的回归函数。

3、随机的总体回归函数:含有随机干扰项的总体回归函数(是相对于条件期望形式而言的)。

4、线性回归模型:既指对变量是线性的,也指对参数β为线性的,即解释变量与参数β只以他们的1次方出现。

5、随机干扰项:即随机误差项,是一个随机变量,是针对总体回归函数而言的。

6、残差项:是一随机变量,是针对样本回归函数而言的。

7、条件期望:即条件均值,指X 取特定值Xi 时Y 的期望值。

8、回归系数:回归模型中βo ,β1等未知但却是固定的参数。

9、回归系数的估计量:指用?μ01

,ββ等表示的用已知样本提供的信息所估计出来总体未知参数的结果。 10、最小二乘法:又称最小平方法,指根据使估计的剩余平方和最小的原则确定样本回归函数的方法。

11、最大似然法:又称最大或然法,指用生产该样本概率最大的原则去确定样本回归函数的方法。

12、估计量的标准差:度量一个变量变化大小的测量值。

13、总离差平方和:用TSS表示,用以度量被解释变量的总变动。

14、回归平方和:用ESS表示:度量由解释变量变化引起的被解释变量的变化部分。

15、残差平方和:用RSS表示:度量实际值与拟合值之间的差异,是由除解释变量以外的其他因素引起的被解释变量变化的部分。

16、协方差:用Cov(X,Y)表示,度量X,Y两个变量关联程度的统计量。

17、拟合优度检验:检验模型对样本观测值的拟合程度,用2R表示,该值越接近1,模型对样本观测值拟合得越好。

18、t检验时针对每个解释变量进行的显著性检验,即构造一个t统计量,如果该统计量的值落在置信区间外,就拒绝原假设。

19、相关分析:研究随机变量间的相关形式

20、回归分析:研究一个变量关于另一个(些)变量的依赖关系的计算方法和理论。

第三章

1、多元线性回归模型:在现实经济活动中往往存在一个变量受到其他多个变量的影响的现象,表现为在线性回归模型中有多个解释变量,这样的模型成为多元线性回归模型,多元指多个变量。

2、偏回归系数:在多元回归模型中,每一个解释变量前的参数即为偏回归系数,它测度了当其他解释变量保持不变时,该变量增加1个单位对解释变量带来的平均影响程度。

3、正规方程组:指采用OLS法估计线性回归模型时,对残差平方和关于各参数求偏导,并令偏导数为0后得到的一组方程,其矩阵形式为μ

''

β=

X X X Y

4、调整的多元可决系数:又称多元判定系数,是一个用于描述伴随模型中解释变量的增加和多个解释变量对被解释变量的联合影响程度的量。它与有如下关系:

5、多重共线性:指多个解释变量间存在线性相关的情形。如果存在完全的线性相关性,则模型的参数就无法求出,OLS回归无法进行。

6、联合假设检验:是相对于单个假设检验来说的,指假设检验中的假设有多个,不止一个。如多元回归中的方程的显著性检验就是一个联合假设检验,而每个参数的t检验就是单个假设检验。

7、受约束回归:在实际经济活动中,常常需要根据经济理论对模型中变量的参数施加一定的约束条件,对模型参数施加约束条件后进行回归。

8、无约束回归:无需对模型中变量的参数施加约束条件进行的回归。

第四章

1、异方差性:对于不同的解释向量,被解释变量的随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性。

2、序列相关性:如果对于不同的解释向量,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了序列相关性。

3、多重共线性:如果某两个或多个解释变量之间出现了相关性,则称为多重共线性。

4、随机解释变量问题:如果存在一个或多个随机变量作为解释变量,则称原模型出现随机解释变量问题。

第五章

1、虚拟变量:同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析模型。

2、滞后变量模型:把过去时期的,具有滞后作用的变量叫做滞后变量,含有滞后变量的模型称为滞后变量模型。

3、动态模型:含有滞后解释变量的模型,又称动态模型

4、分布滞后模型:如果滞后变量模型中没有滞后被解释变量,仅有解释变量X的当期值及其若干期的滞后值,则成为分布滞后模型。

5、自回归模型:解释变量仅包含X的当期值与被解释变量Y的一个或多个滞后值的模型。

第二部分:简答题

第一章

1、什么是计量经济学?

答:计量经济学包括广义计量经济学和狭义计量经济学,本课程中的计量经济学模型,就是狭义计量经济学意义上的经济数学模型:计量经济学是经济学的一个分支学科,以揭示经济活动中客观存在的数量关系为主要内容,是由经济学、统计学和数学三者结合而成的交叉性学科。

2、计量经济学方法与一般经济数学方法有什么区别?

答:计量经济学方法揭示经济活动中具有因果关系的各因素间的定量关系,它用随机性的数学方程加以描述;而一般经济数学方法揭示经济活动中各个因素间的理论关系,更多地用确定性的数学方程加以描述。

3、如何理解计量经济学在当代经济学科中的重要地位?当代计量经济学的基本特点?

答:计量经济学自20世纪20年代末30年代初形成以来,无论在技术方法还是在应用方面发展都十分迅速,尤其是经过20世纪50年代的发展阶段和60年代的扩张阶段,计量经济学在经济学科中占据了重要的地位,主要表现在:

①。在西方大多数大学和学院中,计量经济学的讲授已成为经济学课程表中最具权威性的一部分;

②。在1969至2003年诺贝尔经济学奖的53位获奖者中有10位与研究和应用计量经济学有关,居经济学各分支学科之首。此外,绝大多数获奖者的研究中都应用了计量经济学方法。

③。计量经济学方法与其他经济数学方法的结合应用得到了长足发展。

从当代计量经济学的发展动向看,其基本特点包括:

⑴。非经典计量经济学的理论与应用研究成为计量经济学越来越重要的内容;

⑵。计量经济学方法从主要用于经济预测转向经济理论假设和政策假设的检验;

⑶。计量经济学模型的应用从传统的领域转向新的领域,从宏观领域的研究开始转向微观领域的研究;

⑷。计量经济学模型的规模不再是水平高低的衡量标准,人们更喜欢建立一些简单的模型,从总量上和趋势上说明经济现象。

4、建立与应用计量经济学模型的主要步骤有哪些?

答:建立与应用计量经济学模型的主要步骤包括:①设定理论模型,包括选择模型所包含的变量,确定变量之间的数学关系和拟定模型中待估参数的数值范围;②收集样本数据,要考虑样本数据的完整性、准确性、可比性和一致性;③估计模型参数;④检验模型,包括经济意义检验、统计检验、计量经济学检验和模型预测检验。

5、计量经济学模型主要有哪些应用领域?各自的原理是什么?

答:计量经济学模型主要有以下几个方面的用途:

⑴。结构分析,其原理是弹性分析、乘数分析与比较分析;

⑵。经济预测,其原理是模拟历史,从已经发生的经济活动中找出变化规律;

⑶。政策评价,是对不同政策执行情况的“模拟仿真”;

⑷。检验与发展经济理论,其原理是如果按照某种经济理论建立的计量经济学模型可以很好地拟合实际观察数据。

6、模型的检验包括哪些方面?

答:模型的检验主要包括经济意义检验、统计检验、计量经济学检验和模型的预测检验四个方面。

第二章

1、简述相关分析和回归分析的联系和区别。

答:相关分析与回归分析既有联系又有区别。首先,两者都是研究非确定性变量间的的统计依赖关系,并能测度线性依赖程度的大小。其次,两者间又有明显的区别。相关分析仅仅是从统计数据上测度变量间的相关程度,而无需考察两者间是否有因果关系,因此,变量的地位在相关分析中式对称的,而且都是随机变量;回归分析则更关注具有统计相关关系的变量间的因果关系分析,变量的地位是不对

称的,有解释变量和被解释变量之分,而且解释变量也往往被假设为非随机变量。再次,相关分析只关注变量间的联系程度,不关注具体的依赖关系;而回归分析则更加关注变量间的具体依赖关系,因此可以进一步通过解释变量的变化来估计或预测被解释变量的变化,达到深入分析变量间依存关系,掌握其运动规律的目的。

2、一元线性回归模型的基本假设主要有哪些?违背基本假设的计量经济学模型是否就不可以估计?答:假设1、解释变量X是确定性变量,不是随机变量;

假设2、随机误差项m具有零均值、同方差和不序列相关性:

E(m i)=0 i=1,2, …,n

Var (m i)=s m2 i=1,2, …,n

Cov(m i, m j)=0 i≠j i,j= 1,2, …,n

假设3、随机误差项m与解释变量X之间不相关:

Cov(X i, m i)=0 i=1,2, …,n

假设4、m服从零均值、同方差、零协方差的正态分布

m i~N(0, s m2) i=1,2, …,n

假设5:随着样本容量的无限增加,解释变量X的样本方差趋于一有限常数。即

假设6:回归模型是正确设定的

这些假设都是针对普通最小二乘法的。在违背这些基本假设的情况下,普通最小二乘法就不再是最佳线性无偏估计量,因此使用普通最小二乘法进行估计已无多大意义。但模型本身还是可以估计的,尤其是可以通过最大似然法等其他原理进行估计。

3、简述最大似然法和最小二乘法依据的不同原理。

答:对于最小二乘法,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得模型能最好地拟合样本数据;而对于最大似然法,当从模型总体随机抽取n组样本观测值后,最合理的参

数估计量应该使得从模型中抽取该n 组样本观测值的概率最大。

在满足一系列基本假设的情况下,模型结构参数的最大或然估计量与普通最小二乘估计量是相同的。 4、简述最小二乘估计量的性质。 答:(1)线性性,即它是否是另一随机变量的线性函数;

(2)无偏性,即它的均值或期望值是否等于总体的真实值;

(3)有效性,即它是否在所有线性无偏估计量中具有最小方差。

(4)渐近无偏性,即样本容量趋于无穷大时,是否它的均值序列趋于总体真值;

(5)一致性,即样本容量趋于无穷大时,它是否依概率收敛于总体的真值;

(6)渐近有效性,即样本容量趋于无穷大时,是否它在所有的一致估计量中具有最小的渐近方差。 注意:

(1)-(3)准则也称作估计量的小样本性质,拥有这类性质的估计量称为最佳线性无偏估计量(BLUE )。

(4)-(6)准则考察估计量的大样本或渐进性质。

高斯—马尔可夫定理:普通最小二乘估计量具有线性性、无偏性和最小方差性等优良性质,是最佳线性无偏估计。

5、简述变量显著性检验的步骤。

答:(1)对总体参数提出假设: H0:b 1=0, H1:b 110。 (2)以原假设H0构造t 统计量,并由样本计算其值:

(3)给定显著性水平a ,查t 分布表得临界值t a /2(n -2)

(4)比较,判断

若 |t|> t a/2(n-2),则拒绝H0 ,接受H1 ;

1?1

?ββS t =

若 |t|£ t a/2(n -2),则接受H0 ,拒绝H1 ;

对于一元线性回归方程中的b 0,也可构造如下t 统计量进行显著性检验

第三章

1、多元线性回归模型的基本假设是什么?

提示:一般表达式式和矩阵符号表达式。

2、为什么说对模型参数施加约束条件后,其回归的残差平方和一定不比未加约束的残差平方和小?在什么样的条件下,受约束回归与无约束回归的结果相同?

答:模型施加约束条件后进行回归称为受约束回归。而不加任何约束的回归称为无约束回归。对模型参数施加约束条件后,就限制了参数的取值范围,寻找到的参数估计值也是在此条件下使残差平方和达到最小,它不可能比未施加约束条件时找到的参数估计值使得残差平方和达到最小值还要小。这意味着,通常情况下,对模型施加约束条件会降低模型的解释能力。但当约束条件为真时,受约束回归与无约束回归的结果就相同。

3、怎样选择合适的样本容量?

答:(1)必须保证最小样本容量。样本最小容量必须不少于模型中解释变量的数目(包括常数项),即n 3 k +1,因为,无多重共线性要求:秩(X)=k +1。

(2)满足基本要求的样本容量。虽然当n 3 k +1时可以得到参数估计量,但除了参数估计量质量不好外,一些建立模型必须的后续工作也无法进行。所以,一般经验认为,当n330或者至少n33(k +1)时,才能说满足模型估计的基本要求。

第四章

1、不满足基本假定(基本假设违背)的情况有哪些?

000???~(2)

t t n S βββ-==-

答:(1)随机误差项序列存在异方差性;

(2)随机误差项序列存在序列相关性;

(3)解释变量之间存在多重共线性;

(4)解释变量是随机变量且与随机误差项相关的随机解释变量问题;

(5)模型设定有偏误;

(6)解释变量的方差不随样本容量的增而收敛。

2、使用加权最小二乘法必须先进行异方差性检验吗?

答:在实际操作中人们通常采用如下的经验方法:不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。如果确实存在异方差性,则被有效地消除了;如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。

3、简述D.W.检验的步骤。

答:(1)计算DW值

(2)给定a,由n和k的大小查DW分布表,得临界值dL和dU

(3)比较、判断

若0

dL

dU

4-dU

4-dL

当D.W.值在2左右时,模型不存在一阶自相关。

第五章

1.回归模型中引入虚拟变量的作用是什么?有哪几种基本的引入方式,它们各适用于什么情况?

答:在模型中引入虚拟变量,主要是为了寻找某(些)定性因素对解释变量的影响。加法方式与乘法方式是最主要的引入方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。

2.滞后变量模型有哪几种类型?分布滞后模型使用OLS方法存在哪些问题?

答:滞后变量模型有分布滞后模型和自回归模型两大类,前者只有解释变量及其滞后变量作为模型的解释变量,不包含被解释变量的滞后变量作为模型的解释变量;而后者则以当期解释变量与被解释变量的若干期滞后变量作为模型的解释变量。分布滞后变量有无限期的分布滞后模型和有限期的分布滞后模型;自回归模型又以Coyck模型、自适应预期模型和局部调整模型最为多见。

分布滞后模型使用OLS法存在以下问题:(1)对于无限期的分布滞后模型,由于样本观测值的有限性,使得无法直接对其进行估计σ。(2)对于有限期的分布滞后模型,使用OLS方法会遇到:没有先验准则确定滞后期长度,对最大滞后期的确定往往带有主观随意性;如果滞后期较长,由于样本容量有限,当滞后变量数目增加时,必然使得自由度减少,将缺乏足够的自由度进行估计和检验;同名变量滞后期之间可能存在高度线性相关,即模型可能存在高度的多重共线性。

3.请列出分布滞后模型估计的几种主要方法。

答:分布滞后模型的估计主要需解决滞后期长度的问题。其基本的解决思路就是减少模型中解释变量的个数。常用的估计方法有:经验加权法Almon多项式法,以及Koyck方法,前两者主要用于估计有限期分布滞后模型,第三者主要用于估计无限期分布滞后模型。

4.分布滞后模型估计时遇到的主要问题有哪些?自回归模型估计时遇到的主要问题?

答:分布滞后模型估计时遇到的主要问题有:对于无限期的分布滞后模型,由于样本观测值的有限性,使得无法直接对其进行估计。而对于有限期的分布滞后模型,普通最小二乘回归会遇到如下问

题:

(1)没有先验准则确定滞后期长度;

(2)如果滞后期较长,将缺乏足够的自由度进行统计检验;

(3)同名变量滞后值之间可能存在高度线性相关,即模型可能存在高度的多重共线性。

自回归模型估计时遇到的主要问题有:滞后被解释变量的存在可能导致它与随机干扰项相关,以及随机干扰项出现序列相关性。例如,Koyck模型与自适应预期模型就存在着滞后被解释变量Y t-1与随机干扰项的同期相关性,同时,随机干扰项还是自相关的。而局部调整模型则存在着滞后被解释变量Y t-1随机干扰项的异期相关性。

5.模型设定时,如果遗漏了相关变量,OLS估计会出现什么后果?而在包含了无关变量时,后果又如何?

答:如果遗漏相关变量,则OLS估计结果在小样本下是有偏的,在大样本下也不具有一致性,随机干扰项的方差估计?2也是有偏的,同时估计的参数的方差也是有偏的,从而不再能够保证最小方差性。

在多选无关解释变量的情形下,OLS估计量仍是无偏的、一致的,随机干扰项的方差σ2也能被正确估计,但OLS估计量却往往是无效的。也就是说,包含无关变量的偏误主要表现为“错误”模型的OLS估计量的方差一般会大于“正确”模型相应参数估计量的方差。

6.什么是“虚拟变量陷阱”?

答:一般在引入虚拟变量时要求如果有m个定性变量,只在模型中引入m-1个虚拟变量。否则,如果引入m个虚拟变量,就会导致模型解释变量间出现完全共线性的情况。我们一般称由于引入的虚拟变量个数与定性因素个数相同时出现的模型无法估计的问题,称为“虚拟变量陷阱“。

统计学名词解释简答

名词解释 统计总体:指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。统计总体的特征:同质性、差异性、大量性。 总体单位:个体,指构成总体的各个单位。 统计指标:简称指标,用来反映社会经济现象总体的数量特征的概念及其数值。任一概念都包含指标名称和指标数值。特征有总体性、数量性、综合性、具体性。 统计标志:在统计中,总体单位所具有的属性或特征的名称。标志是统计研究的起点,总体单位是标志的载体,是标志的承担者,统计研究是从登记标志开始的,并通过对标志的综合来反映总体的数 量特征。可分为品质标志和数量标志,或不变标志和变异标志。 统计调查:就是根据统计研究的预定目的、要求和任务,运用各种科学的调查方法,有计划、有组织地搜集有关现象的各个单位的资料,对客观事实进行登记,取得真实可靠的原始资料的工作过程。 统计调查是整个统计工作的基础环节。统计调查的好坏,将影响统计资料的正确与否,从而影 响统计质量。统计调查的要求:准确性、及时性、全面性、系统性。 普查:是根据统计任务的特定目的而专门组织的一次性全面调查。调查范围:1.属于一定时点的社会经济现象的总量(如人口普查)。2.反映一定时期现象的总量(如出生人口总数)。优点:所获资料 更详细,有较高的准确性和时效性。缺点:工作量大,花费时间长,耗费大量的人力、物力和 财力。主要作用:在于掌握某些关系国计民生、国情国力的数据,获得比较准确的信息。 抽样调查:指从所要研究的总体中,按照随机原则,抽取部分单位进行调查,并将调查整理得出的数量特征,用以推断总体综合数量特征的一种非全面调查组织形式。特点:随机性、推断性。优点: 经济性、时效性、准确性、灵活性。应用范围:①对总体不可能或不必要进行全面调查,但要 掌握总体某些现象的全面数值②用抽样调查资料修正全面调查资料。作用:①承担全面调查无 法或很难承担的调查任务。如气象调查。②与全面调查结合,可以发挥相互补充、校对的作用。 ③进行生产过程的质量控制。④用来检验总体特征的某些假设,为行动决策提供依据。抽样调 查的组织形式:纯随机抽样、机械抽样、类型抽样、整群抽样、阶段抽样。 典型调查:根据调查目的和要求,在对研究总体作全面分析后,有意识地从中选取少数具有代表性的单位进行深入调查研究的一种非全面调查。优点:节省人力、物力,既可搜集统计资料,又可分析 研究问题。缺点:资料不齐全,缺乏代表性。主要作用:1.弥补全面调查不足(获取其它统计调 查方法不能得到的统计资料;补充完善统计报表;验证全面调查数据的真实性。2.进行估算某些 指标数值。 重点调查:是一种非全面调查,是在调查对象中选择重点单位进行的调查,但这部分重点单位占总体的绝大比重。优点:省事、省力,能用较少的代价及时搜集到总体的基本情况和基本趋势。缺点: 资料受重点单位影响大,资料一般不齐全。 统计整理:就是根据统计研究的预定目的,对所搜集到的资料进行科学加工,使之条理化、系统化,建立统计数据库,以满足多方面、多层次的反复需要的工作过程。作用:统计整理是统计工作过程 的重要阶段,它是实现从个体单位标志值过渡到总体数量特征值的必经阶段,是统计分析的前 提。其质量的好坏会直接影响统计分析的效果。 绝对指标:又称总量指标,有时也称绝对数。是用来说明一定社会经济现象的规模、水平的总量。它包括总体总量和标志总量。 相对指标:又称相对数,是两个相联系指标的比值。作分母的指标为基数,分子为表数。通过相对指标可反映现象间的相互关系和对比关系。一般分为有名数和无名数。种类有:计划完成相对指标、 结构相对指标、比较相对指标、动态相对指标、强度相对数。 平均指标:又称统计平均数,它是度量频率分布集中趋势或中心位置的指标。也是社会经济统计中最常用的综合指标。它是在同质总体内各总体单位某一数量标志的一般水平。一般有两种分类:静态 平均数、动态平均数。

计量经济学试题

06A卷 一、判断说明题(每小题1分,共10分) 1.在实际中,一元回归没什么用,因为因变量 的行为不可能仅由一个解释变量来解释。(×) 4.在线性回归模型中,解释变量是原因,被解 释变量是结果。(×) 7. 给定显著性水平 及自由度,若计算得到 的t 值超过t的临界值,我们将拒绝零假设。 (√) 8.为了避免陷入虚拟变量陷阱,如果一个定性 变量有 m类,则要引入m个虚拟变量。(×) 二、名词解释(每小题2分,共10分) 1.计量经济学:融合数学、统计学及经济理论,结合研究经济行为和现象的理论和实务。 2.最小二乘法:使全部观测值的残差平方和为最小的方法就是最小二乘法。 3.虚拟变量:在经济生活研究中,有一些暂时起作用的因素。如战争、天灾、人祸等,这些因素在经济中不经常发生,但又带有相同特性,经济学家把这些不经常发生的、又起暂时影响作用的称为虚拟变量。 4.滞后变量:用来作为解释变量的内生变量的前期值称为滞后内生变量,简称为滞后变量。 5.自回归模型:包含有被解释变量滞后值的模型,称为自回归模型。 三、简答题(每小题5分,共20分) 1.应用最小二乘法应满足的古典假定有哪些?(1)随机项的均值为零; (2)随机项无序列相关和等方差性; (3)解释变量是非随机的,如果是随机的则与随机项不相关; (4)解释变量之间不存在多重共线性。 2.运用计量经济学方法解决经济问题的步骤一般是什么? (1)建立模型; (2)估计参数; (3)验证理论; (4)使用模型。 3.你能分别举出三个时间序列数据、截面数据、混合数据、虚拟变量数据的实际例子吗? (1)时间序列数据如:每年的国民生产总值、 各年商品的零售总额、各年的年均人口增长 数、年出口额、年进口额等等; (2)截面数据如:西南财大2002年各位教师年收入、2002年各省总产值、2002年5月成都市 各区罪案发生率等等; (3)混合数据如:1990年~2000年各省的人均收入、消费支出、教育投入等等; (4)虚拟变量数据如:婚否,身高是否大于170厘米,受教育年数是否达到10年等等。 4.随机扰动项μ的一些特性有哪些? (1)众多因素对被解释变量Y的影响代表的综合体; (2)对Y的影响方向应该是各异的,有正有负;(3)由于是次要因素的代表,对Y的总平均影响可能为零; (4)对Y的影响是非趋势性的,是随机扰动的。 四、分析、计算题(每小题15分,共45分) 1. 根据下面Eviews回归结果回答问题。Dependent Variable: DEBT Method: Least Squares Date: 05/31/06 Time: 08:35 Sample: 1980 1995 Included observations: 16 Variable Coefficie nt Std. Erro r t-Statist ic Prob . C() INCOME() COST() R-squared Mean dependent var Adjusted R-squared () . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic()Durbin-Wats on stat Prob(F-statisti c) INCOME——个人收入,单位亿美元; COST——抵押贷款费用,单位%。 1. 完成Eviews回归结果中空白处内容。 2. 说明总体回归模型和样本回归模型的区别。

计量经济学简答题及答案

计量经济学简答题及答案 1、比较普通最小二乘法、加权最小二乘法和广义最小二乘法的异同。 答:普通最小二乘法的思想是使样本回归函数尽可能好的拟合样本数据,反映在 图上就是是样本点偏离样本回归线的距离总体上最小,即残差平方和最小 ∑=n i i e 12min 。 只有在满足了线性回归模型的古典假设时候,采用OLS 才能保证参数估计结果的可靠性。 在不满足基本假设时,如出现异方差,就不能采用OLS 。加权最小二乘法是对原 模型加权,对较小残差平方和2i e 赋予较大的权重,对较大2i e 赋予较小的权重,消除异方差,然后在采用OLS 估计其参数。 在出现序列相关时,可以采用广义最小二乘法,这是最具有普遍意义的最小二乘 法。 最小二乘法是加权最小二乘法的特例,普通最小二乘法和加权最小二乘法是广义 最小二乘法的特列。 6、虚拟变量有哪几种基本的引入方式? 它们各适用于什么情况? 答: 在模型中引入虚拟变量的主要方式有加法方式与乘法方式,前者主要适用于 定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。 7、联立方程计量经济学模型中结构式方程的结构参数为什么不能直接应用OLS 估计? 答:主要的原因有三:第一,结构方程解释变量中的内生解释变量是随机解释变 量,不能直接用OLS 来估计;第二,在估计联立方程系统中某一个随机方程参数时,需要考虑没有包含在该方程中的变量的数据信息,而单方程的OLS 估计做不到这一点;第三,联立方程计量经济学模型系统中每个随机方程之间往往存在某种相关性,表现于不同方程随机干扰项之间,如果采用单方程方法估计某一个方程,是不可能考虑这种相关性的,造成信息的损失。 2、计量经济模型有哪些应用。 答:①结构分析,即是利用模型对经济变量之间的相互关系做出研究,分析当其 他条件不变时,模型中的解释变量发生一定的变动对被解释变量的影响程度。②经济预测,即是利用建立起来的计量经济模型对被解释变量的未来值做出预测估计或推算。③政策评价,对不同的政策方案可能产生的后果进行评价对比,从中做出选择的过程。④检验和发展经济理论,计量经济模型可用来检验经济理论的正确性,并揭示经济活动所遵循的经济规律。 6、简述建立与应用计量经济模型的主要步骤。 答:一般分为5个步骤:①根据经济理论建立计量经济模型;②样本数据的收集; ③估计参数;④模型的检验;⑤计量经济模型的应用。 7、对计量经济模型的检验应从几个方面入手。 答:①经济意义检验;②统计准则检验;③计量经济学准则检验;④模型预测检 验。

统计学名词解释

统计学名词解释 第一章绪论 1.随机变量:在统计学上,把取值之间不能预料到什么值的变量。 2.总体:又称母全体、全域,指具有某种特征的一类事物的全体。 3.个体:构成总体的每个基本单元称为个体。 4.样本:从总体中抽取的一部分个体,称为总体的一个样本。 5.次数:指某一事件在某一类别中出现的数目,又称为频数。 6.频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。 7.概率:某一事物或某一情在某一总体中出现的比率。 8.观测值:一旦确定了某个值。就称这个值为某一变量的观测值。 9.参数:又称为总体参数,是描述一个总体情况的统计指标。 10.统计量:样本的那些特征值叫做统计量,又称特征值。 第二章统计图表 1.统计表:是由纵横交叉的线条绘制,并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。一般由表号、名称、标目、数字、表注组成。 2.统计图:一般采用直角坐标系,通常横轴表示事物的组别或自变量x,称为分类轴。纵轴表示事物出现的次数或因变量,称为数值轴。一般由图号及图题、图目、图尺、图形、图例、图组成。 3.简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表,适合数据个数和分布范围比较小的时候用。 4.分组次数分布表:数据量很大时,应该把所有的数据先划分在若干区间,然后将数据按其数值大小划归到相应区域的组别内,分别统计各个组别中包括的数据个数,再用列表的形式呈现出来,适合数据个数和分布范围比较大的时候用。 5.分组次数分布表的编制步骤: (1)求全距 (2)定组距和组数 (3)列出分组组距 (4)登记次数 (5)计算次数 6.分组次数分布的意义: (1)优点:A.可将杂乱无章数据排列成序,以发现各数据的出现次数及分布状况。B.可显示一组数据的集中情况和差异情况等。 (2)缺点:原始数据不见了,从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入,出现误差,即归组效应。 7.相对次数分布表:用频数比率或百分数来表示次数 8.累加次数分布表:把各组的次数由下而上,或由上而下加在一起。最后一组的累加次数等于总次数。 9.双列次数分布表:对有联系的两列变量用同一个表表示其次数分布。

统计学名词解释

1、统计学 统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。 2、指标和标志 标志是说明总体单位属性或特征的名称。指标是说明总体综合数量特征和数量关系的数字资料。 3、总体、样本和单位 统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。简称总体。构成总体的个体则称为总体单位,简称单位。样本是从总体中抽取的一部分单位。 4、统计调查 统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。它是取得统计数据的重要手段。 5、统计绝对数和统计相对数 反映总体规模的绝对数量值,在社会经济统计中称为总量指标。统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。 6、时期指标和时点指标 时期指标是反映总体在一段时期内累计总量的数字资料,是流量。时点指标是反映总体在某一时刻上具有的总量的数字资料,是存量。 7、抽样估计和假设检验 抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。 8、变量和变异 标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。数量标志和指标在统计中称为变量。 9、参数和统计量 参数是反映总体特征的一些变量,包括总体平均数、总体方差、总体标准差等。统计量是反映样本特征的一些变量,包括样本平均数、样本方差、样本标准差等。 10、抽样平均误差 样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。重复抽样的抽样平均误差为总体标准差的1/n。 11、抽样极限误差 抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样误差的可能范围,称为极限误差或允许误差。 12、重复抽样和不重复抽样 重复抽样也称为回置抽样,是从总体中随机抽取一个样本时,每次抽取一个样本单位时都放回的抽样方式。不重复抽样也叫不回置抽样,它是在每次抽取样本单位时都不放回的抽样方式。13、点估计和区间估计 点估计也叫定值估计,就是直接用抽样平均数代替总体平均数,用抽样成数代替总体成数。区间估计是在一定概率保证下,用样本统计量和抽样平均误差去推断总体参数的可能范围的估计方法。 14、统计指数 广义上来说,它是表明社会经济现象的数量对比关系的相对指标。狭义上来说,它是反映不能直接相加对比的复杂总体综合变动的动态相对数。 15、综合法总指数 凡是一个总量指标可以分解为两个或两个以上的因素指标时,将其中一个或一个以上的因素指

计量经济学重点简答论述题

计量经济学重点(简答题) 一、什么就是计量经济学?计量经济学,又称经济计量学,它就是以一定的经济理论与 实际统计资料为依据,运用数学、统计学与计算机技术,通过建立计量经济学模型,定量分析经济变量之间的随机因果关系、。 二、计量经济学的研究的步骤就是什么? 1)理论模型的设计 A.理论或假说的陈述; B.理论的数学模型的设定; C.理论的计量经济模型的设定。 i.把模型中不重要的变量放进随机误差项中; ii.拟定待估参数的理论期望值。 2)获取数据 数据来源:网络、统计年鉴、报纸、杂志 数据类别:时间序列数据、截面数据、混合数据、虚变量数据。 数据要求:完整性、准确性、可比性、一致性 i.完整性:模型中包含的所有变量都必须得到相同容量的样本观察值。 ii.准确性:统计数据或调查数据本身就是准确的。 iii.可比性:数据口径问题。 iv.一致性:指母体与样本的一致性。 3)模型的参数估计:普通最小二乘法。 4)模型的检验:经济学检验;统计学检验;计量经济学检验;模型的预测检验。 5)模型的应用:结构分析;经济预测;政策评价;经济理论的检验与发展。 三、简述统计数据的类别? 时间序列数据、截面数据、混合数据、虚变量数据。 1)时间序列数据:按时间先后排列收集的数据。

采纳时间序列数据的注意事项: A.所选择的样本区间的经济行为一致性问题。 B.样本数据在不同样本点之间的可比性问题。 C.样本数据过于集中的问题。不能反映经济变量间的结构关系,应增大观察区间。 D.模型的随机误差项序列相关问题。 2)截面数据:又称横向数据,就是一批发生在同一时间截面上的调查数据。研究某时 点上的变化情况。 采纳截面数据的注意事项: A.样本与母体的一致性问题。 B.随机误差项的异方差问题。 3)混合数据:也称面板数据,既有时间序列数据,又有截面数据。 4)虚变量数据:又称二进制数据,只能取0与1两个值,表示的就是某个对象的质量特 征。 四、模型的检验包括哪几个方面?具体含义就是什么? 1)经济学检验:参数的符合与大致取值。 2)统计学检验:拟合优度检验;模型的显著性检验;参数的显著性检验。 3)计量经济学检验:序列相关性;异方差检验;多重共线性检验。 4)模型的预测检验:a,扩大样本容量或变换样本重新估价模型;b,利用模型对样本期以 外的某一期进行预测。

统计学名词解释及公式

第1章统计与统计数据 一、学习指导 统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。 概念:统计学,描述统计,推断统计。 统计在工商管理中的应用。 统计的其他应用领域。 概念:分类数据,顺序数据,数值型数据。 不同数据的特点。 概念:观测数据,实验数据。 概念:截面数据,时间序列数据。 统计数据的间接来源。 二手数据的特点。 概念:抽样调查,普查。 数据的间接来源。 数据的收集方法。 调查方案的内容。 概念。抽样误差,非抽样误差。 统计数据的质量。 概念:总体,样本。 概念:参数,统计量。 概念:变量,分类变量,顺序变量,数值 型变量,连续型变量,离散型变量。 二、主要术语 1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 2.描述统计:研究数据收集、处理和描述的统计学分支。 3.推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 4.分类数据:只能归于某一类别的非数字型数据。 5.顺序数据:只能归于某一有序类别的非数字型数据。 6.数值型数据:按数字尺度测量的观察值。 7.观测数据:通过调查或观测而收集到的数据。 8.实验数据:在实验中控制实验对象而收集到的数据。 9.截面数据:在相同或近似相同的时间点上收集的数据。 10.时间序列数据:在不同时间上收集到的数据。

11.抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推 断总体特征的数据收集方法。 12.普查:为特定目的而专门组织的全面调查。 13.总体:包含所研究的全部个体(数据)的集合。 14.样本:从总体中抽取的一部分元素的集合。 15.样本容量:也称样本量,是构成样本的元素数目。 16.参数:用来描述总体特征的概括性数字度量。 17.统计量:用来描述样本特征的概括性数字度量。 18.变量:说明现象某种特征的概念。 19.分类变量:说明事物类别的一个名称。 20.顺序变量:说明事物有序类别的一个名称。 21.数值型变量:说明事物数字特征的一个名称。 22.离散型变量:只能取可数值的变量。 23.连续型变量:可以在一个或多个区间中取任何值的变量。 四、习题答案 1.D 2.D 3.A 4.B 5.A 6.D 7.C 8.B 9.A 10.A 11.C、12.C 13.B 14.A 15.C 16.D 17.C 18.A 19.C 20.D 21.A 22.C 23.C 24.B 25.D 26.C 27.B 28.D 29.A 30.D 31.A 32.B 33.C 34.A 35.A 36.A 37.D 38.B 39.B 40.C 41.C 42.D 43.C 44.D 45.A 46.B 47.C 48.A 49.C 50.D 51.A 52.C 53.D 54.A 55.B

【缩印整理版】医学统计学名词解释及问答题

统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。 总体(population):大同小异的研究对象全体。更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。 样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。 抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。可用标准误描述其大小。 标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。样本均数的标准差称为均数的标准误。均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数 区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。 参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常 置信区间揭示的是按一定置信度估计总体参数所在的范围。t分布法、正态分布法(标准误)、二项分布法。置信区间估计总体参数所在范围 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval,CI)。它的确切含义是:可信区间包含总体参数的可 能性是1- α ,而不是总体参数落在该范围的可能性为1-α 。 参数统计(parametric statistics) 非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。 变异(variation):对于同质的各观察单位,其某变量值之间的差异 同质(homogeneity):研究对象具有的相同的状况或属性等共性。 回归系数有单位,而相关系数无单位 β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。 线性相关系数(linear correlation coefficient):又称Pearson积差相关系数(Pearson product moment coefficient),是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。 参数(parameter):描述总体特征的统计指标。 统计量(statistic):描述样本特征的统计指标。实验设计的基本原则 对照 (control) 对受试对象不施加处理因素的状态。在确定接受处理因素的实验组时,要同时设立对照组 重复 (replication)相同实验条件下进行多次实验或多次观察。整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。作用是估计变异大小和降低变异 随机化(randomization) 采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。 I类错误(假阳性错误)真实情况为H0是成立的,但检验结果为H0不成立,这样的错误称为I类错误。其发生的概率用α表示。在假设检验中作为检验水准。一般取0.05或0.01。 II类错误(假阴性错误)真实情况为H1是成立的,但检验结果为H1不成立,这样的错误称为II类错误。其发生的概率用β表示。由于其取值取决于H1 ,因此在假设检验中无法确定。 变异指标是用于描述一组观察值围绕中心位置散布的范围,即描述离散趋势的统计指标。数值越大,说明数据越离散,反之越集中。极差 (range);四分位数间距(quartile range);方差(variance);标准差(standard deviation);变异系数(coefficient of variation 平均数指标用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。算术均数(arithmetic mean);几何均数(geometric mean);中位数(median);众数(mode) 单纯抽样将调查总体的全部观察单位编号,从而形成抽样框架,在抽样框架中随机抽取部分观察单位组成样本。每个观察对象都有相同的机会被抽中系统抽样又称机械抽样。按照某种顺序给总体中的个体编号,然后随机地抽取一个号码作为第一个调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。最常用的方法是等距抽样 分层抽样先将总体中全部个体按某种特征分成若干“层”,再从每一层内随机抽取一定数量的个体组成样本。分层特征与研究目的有关。按各层比例抽样。为减少抽样误差,要求层内误差最小,层间误 差最大。 整群抽样先将总体分成若干“群”,从中随机抽取 几个群,抽取群内的所有观察单位组成调查样本。 “群”的确定与研究目的无关。为减少抽样误差, 需多抽几个“群”。 方差分析:又称变异数分析或 F检验,适用于对多 个平均值进行总体的假设检验,以检验实验所得的 多个平均值是否来自相同总体。 析因设计(factorial design)实验:凡同时配置两个 或两个以上处理因素,这些因素的各水平又具有完 全组合的实验,统称为析因设计(factorial design) 实验。 随机区组设计(randomized block design)是事先 将全部受试对象按某种可能与实验因素有关的特征 分为若干个区组(block),使每一区组内的受试对 象例数与处理因素的分组数相等,使每个实验组从 每一区组得到一例受试对象。 单向方差分析(one way analysis of variance)是指 处理因素只有一个。这个处理因素包含有多个离散 的水平,分析在不同处理水平上应变量的平均值是 否来自相同总体。 (2)计数资料:将观察单位按某种属性或类别分组, 所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。 其观察值是定性的,表现为互不相容的类别或属性。 如调查某地某时的男、女性人口数;治疗一批患者, 其治疗效果为有效、无效的人数;调查一批少数民 族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性 的不同程度分组,所得各组的观察单位数,称为等 级资料(ordinal data)。等级资料又称有序变量。如 患者的治疗结果可分为治愈、好转、有效、无效或 死亡,各种结果既是分类结果,又有顺序和等级差 别,但这种差别却不能准确测量;一批肾病患者尿 蛋白含量的测定结果分为+、++、+++等。 随机变量(random variable)是指取指不能事先确 定的观察结果。随机变量的具体内容虽然是各式各 样的,但共同的特点是不能用一个常数来表示,而 且,理论上讲,每个变量的取值服从特定的概率分 布。 变异系数(coefficient of variation)用于观察指标单 位不同或均数相差较大时两组资料变异程度的比 较。用CV 表示。计算:标准差/均数*100% 直线回归(linear regression)建立一个描述应变量 依自变量变化而变化的直线方程, 并要求各点与该直线纵向距离的平方和为最小。直 线回归是回归分析中最基本、最简单的一种,故又 称简单回归(simple regression)。 回归系数(regression coefficient )即直线的斜率 (slope),在直线回归方程中用b 表示,b 的统计意 义为X每增(减)一个单位时,Y平均改变b 个单 位。 相关系数r:用以描述两个随机变量之间线性相关 关系的密切程度与相关方向的统计指标。 秩次:变量值按照从小到大顺序所编的秩序号称为 秩次(rank)。 秩和:各组秩次的合计称为秩和(rank sum),是非 参数检验的基本统计量。 方差(variance):方差表示一组数据的平均离散情 况,由离均差的平方和除以样本个数得到。 检验效能:1- β称为检验效能(power of test),它是 指当两总体确有差别,按规定的检验水准a 所能发 现该差异的能力。 百分位数(percentile)是将n 个观察值从小到大依 次排列,再把它们的位次 依次转化为百分位。百分位数的另一个重要用途是 确定医学参考值范围 随机误差(random error)又称偶然误差,是指排 除了系统误差后尚存的误差。它受多种因素的影响, 使观察值不按方向性和系统性而随机的变化。误差 变量一般服从正态分布。随机误差可以通过统计处 理来估计。 一、统计表有哪些要素构成的?制表的注意事项有 哪些? 一般来说,统计表由标题、标目、线条和数字、备 注五部分组成。但备注并不是必需的内容,可以根 据需要出现。 1简明扼要,重点突出:最好一张表突出一个中心, 不易太多中心,如果需要说明多个中心,可分成多 张统计表。 2合理安排主语和谓语的位置:对于表中任意一行, 从左至右,通过简短的连接词,可连成成一句通顺 的句子。 3表中数据要认真核对,保证准确可靠 二、为什么不宜用t 检验对多组均数进行比较? 如果用t检验进行多个样本均数的两两比较,则会 增加犯I 类错误的概率。 经检验得到拒绝H0 ,认为两组之间有差别的结论 可能犯I类错误的概率为α,不犯I类错误的概率为 1- α.每次判断均不犯I类错误的概率为(1- α)k, k为比较的次数,上例α=0.05, k=3,则均不犯错误 的概率为( 1- 0.05)3 =0.86. 至少有一次判断犯I 类错误的概率为1-(1- α)k 三、方差分析的基本思想是什么? 按实验设计的类型,将全部观察值间的变异分解成 两个或多个组成部分,然后将各部分的变异与随机 误差进行比较(每个部分的变异可由某因素的作用 来解释),以判断各部分的变异是否具有统计学意 义,从而推断不同样本所代表的总体均数是否相同。 五、简述直线相关与回归的区别与联系 区别:1.回归说明依存关系,直线回归用于说明两 变量间数量依存变化的关系,描述y如何依赖于x 而变化;相关说明相关关系,直线相关用于说明两 变量间的直线相关关系,此时两变量的关系是平等 的 2.r与b有区别:r说明具有直线关系的两个 变量间相关的密切程度与相关方向; b表示x每改 变一个单位,y平均增(减)多少个单位; 3.资料要求不同:直线回归要求应变量 y是来自正态总体的随机变量,而x可以是来自正 态总体的随机变量,也可以是严密控制、精确测量 的变量,相关分析则要求x,y是来自双变量正态分 布总体的随机变量。 4.取值范围:-∞

计量经济学简答题及答案43378

简答: 1、时间序列数据和横截面数据有何不同? 时间序列数据是一批按照时间先后排列的统计数据。截面数据是一批发生在同一时间截面上的调查数据。这两类数据都是反映经济规律的经济现象的数量信息,不同点:时间序列数据是含义、口径相同的同一指标按时间先后排列的统计数据列;而横截面数据是一批发生在同一时间截面上不同统计单元的相同统计指标组成的数据列。 2、建立计量经济模型赖以成功的三要素。P16(课本) 成功的要素有三:理论、方法和数据。理论:即经济理论,所研究的经济现象的行为理论,是计量经济学研究的基础;方法:主要包括模型方法和计算方法,是计量经济学研究的工具与手段,是计量经济学不同于其他经济学分支科学的主要特征;数据:反映研究对象的活动水平、相互间以及外部环境的数据,更广义讲是信息,是计量经济学研究的原料。三者缺一不可。 3、什么是相关关系、因果关系;相关关系与因果关系的区别与联系。 相关关系是指两个以上的变量的样本观测值序列之间表现出来的随机数学关系,用相关系数来衡量。 因果关系是指两个或两个以上变量在行为机制上的依赖性,作为结果的变量是由作为原因的变量所决定的,原因变量的变化引起结果变量的变化。因果关系有单向因果关系和互为因果关系之分。 具有因果关系的变量之间一定具有数学上的相关关系。而具有相关关系的变量之间并不一定具有因果关系。 4、回归分析与相关分析的区别与关系。P23-P24(课本) 相关分析与回归分析既有联系又有区别。首先,两者都是研究非确定性变量间的统计依赖关系,并能测度线性依赖程度的大小。其次,两者间又有明显的区别。相关分析仅仅是从统计数据上测度变量间的相关程度,而无需考察两者间是否有因果关系,因此,变量的地位在相关分析中饰对称的,而且都是随机变量;回归分析则更关注具有统计相关关系的变量间的因果关系分析,变量的地位是不对称的,有解释变量与被解释变量之分,而且解释变量也往往被假设为非随机变量。再次,相关分析只关注变量间的具体依赖关系,因此可以进一步通过解释变量的变化来估计或预测被解释变量的变化,达到深入分析变量间依存关系,掌握其运动规律的目的。 5、数理经济模型和计量经济模型的区别。 答:数理经济模型揭示经济活动中各个因素之间的理论关系,用确定性的数学方程加以描述。计量经济模型揭示经济活动中各个因素之间的定量关系,用随机性的数学方程加以描述。 6、从哪几方面看,计量经济学是一门经济学科?P6(课本)

医学统计学名词解释复习资料

1. 总体(population):根据研究目的所确定的同质观察单位的全体。只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。假想的,无时间和空间概念的,称为无限总体(infinite population)。 2. (总体)参数(parameter):总体的统计指标或特征值。总体参数是事物本身固有的、不变的。 3. 样本(sample):从总体中随机抽取的部分个体。 4. 样本含量(sample size):样本中所包含的个体数。 5. 变量(variable):观察对象个体的特征或测量的结果。由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。变量的取值称为变量值或观察值(observation)。根据变量的取值特性,分为数值变量和分类变量。 6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。对每个观察单位用定量的方法测定某项指标的数值,组成的资料。 7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。 8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。 9. 抽样误差(sampling error):由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。 10. 误差(error):统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下二种:系统误差和随机误差 。 11. 可信区间(confidence interval, CI):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间,又称置信区间。 12. 总体均数的可信区间:按一定的概率大小估计总体均数所在的范围(CI)。常用的可信度为95%和99%,故常用95%和99%的可信区间。 13. 变异(variation):同质事物间的差别。由于观察单位通常即为观察个体,故变异亦称为个体变异(individual variation)。 16. 平均数(average):也叫平均值,是一组(群)数据典型或有代表性的值。这个值趋向于落在根据数据大小排列的数据的中心,包括算术平均数(arithmetic mean)、几何平均数(geometric mean)、中位数(median)等。 17. 中位数(median):将一组观察值按升序或降序排列,位次居中的数,常用M 表示。适用于偏态分布资料或不规则分布资料和开口资料。所谓“开口”资料,是指数据的一端或两端有不确定值。当n 为奇数时,M=X (n+1)/2;当n 为偶数时,M=[X n/2+ X n/2+1]/2。 18. 百分位数(percentile):是一种位置指标,以P x 表示,一个百分位数Px 将全部观察值分为两个部分,理论上有x%的观察值小于Px 小,有(1-x%)的观察值大于Px 。 19. 变异系数(coefficient of variance, CV):亦称离散系数(coefficient of dispersion),为标准差与均数之比,常用百分数表示。100%X s/CV ?=, 变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 20. 频率(relative frequency):在n 次随机试验中,事件A 发生了m 次,则比值 22. 概率(probability):在重复试验中,事件A 的频率,随着试验次数的不断增加将愈来愈接近一个常数p ,这个常数p 就称为事件A 出现的概率(probability),记作P(A)或P 。 描述随机事件发生的可能性大小的数值,常用P 来表示。 23. 统计量(statistic):由样本所算出的统计指标或特征值。 24. 相关系数(correlation coefficient):用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标,称为相关系数,又称为积差相关系数(coefficient of product-moment correlation),总体相关系数用希腊字母ρ表示,而样本相关系数用r 表示,取值范围均为[-1, 1]。 25. 回归系数(regression coefficient):直线回归方程Y ?= a+b X 的系数b 称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。 26. 参考值范围(reference range):也称为正常值范围(normal range),医学上常把绝大多数正常人的某指标值范围称为该指标的正常值范围。绝大多数:可以是90%、95%、99%等等,最常用的是95%。正常人:不是指健康人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。习惯上是确定包括95%的人的界值。 28. 统计推断(statistic inference):从总体中随机抽取一定含量的样本进行研究,目的是通过样本的信息判断总体的特征,这一过程称为统计推断。 29. 标准误(standard error, SE):在统计理论上将样本统计量的标准差称为标准误,用来衡量抽样误差的大小。据此,样本均数的标准差X σ称为标准误。 30. 参数估计(parameter estimation):由样本信息估计总体参数。它包括两种:点估计和区间估计。 点估计:直接用样本统计量作为对应的总体参数的估计值。 区间估计:按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间(confidence interval, CI ),又称置信区间。这种估计方法称为区间估计。 33. 95%可信区间含义:如果重复若干次样本含量相同的抽样,每个样本均按同一方法构建95%可信区间,则在这些可信区间中,理论上有95个包含了总体参数,还有5个未估计到总体均数。 34.Ⅰ类错误(type Ⅰerror):统计学上规定,拒绝了实际上成立的H 0,这类“弃真”的错误称为Ⅰ型错误或第一类错误,Ⅰ型错误的概率用α表示。 35.Ⅱ类错误(type Ⅱerror):统计学上规定,不拒绝实际上不成立的H 0,这类“存伪”的错误称为Ⅱ型错误或第二类错误,Ⅱ型错误的概率用β表示。 36. 检验效能(power of a test):又称把握度,即两总体确有差别,按α水准能发现它们有差别的能力。 37. 参数检验:总体分布已知,对其中一些未知参数进行估计或检验。这类统计推断的方法叫参数统计或参数检验。 38. 参数检验:假定比较数据服从某分布,通过参数的估计量(x , s)对比较总体的参数(μ)作检验,统计上称为参数法检验(parametric test)。如t 、u 检验、方差分析。 39. 率(rate):又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。其计算公式为: 40. 构成比(proportion):又称构成指标,它说明一种事物内部各组成部分所占的比重或分布,常以百分数表示。 41. 比(ratio):又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百分之几,它是对比的最简单形式。其计算公式为:比=A/B 。 统计学(Statistics ):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达 的科学。 总体(population ):大同小异的研究对象全体。更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。 样本(sample ):来自总体的部分个体,更确切的说,应该是部分个体的观察值。样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。

相关文档
相关文档 最新文档