当前位置：文档视界 › 应用统计学笔记

应用统计学笔记

第一章统计方法

一、统计依其功能分成「理论统计学」（pure statistics）和「应用统计学」（applied statistics）：

(一) 理论统计学：指的是创造出一个可以用于统计的定理或公式、或对于现有统计的定理或公式作更合理

的解释。是偏向理论的推论过程和结果。

(二) 应用统计学：指的是如何正确使用理论统计学者所创造出来的统计定理或公式，达到评估某一事件的

目的，我们只要了解在何种状况下该用那一个数学方程式或定理，以及该如何解出所需要的数学方程

式就可以了。是偏向解决实际问题的推论过程和结果，协助各行各业判断或预测某一特定事件、在未

来产生某种结果的机会有多大，是预测未来的有效工具。

二、统计方法的应用是为了发现或解决某一特定群体的问题，这一产生或需要解决问题的特定群体称为母体

（population）、群体或母群体。母体所包含个体数量通常都很庞大、或数量具有不确定性，在正常的状况下，是不可能让母体内的每一个个体在统计过程中适时出现，因此只能选择某些个体当作评估或研究的对象，选择个体的过程称为抽样（sampling），所抽到的个体称为样本（sample）或样品。

三、搜集资料的方法有很多种，视情况而定，大致上可分为三类：

(一) 直接从样本而又不干扰或影响样本的情况下得到数据的方法，称为调查法（survey）。

(二) 直接从样本而且必须加入干扰或影响样本因素的情况下得到数据的方法，称为实验法（experiment）。

(三) 间接得到所要评估或研究的群体或特性数据的方法，称为文件（docments）应用法。

四、用简短的文字、统计表、统计图或方程式等方式，只能显示样本数据整体分布的特性，但还够具体。所以

最好能用少数几个数据具体表示样本数据的特性，这些能表示样本数据特性的具体数据，就称为统计量（static）或表征数。例如搜集到的作文成绩统计出甲、乙和丙的总人数还算出百分比，或80分以上、70?79、60?69、60分以下的总人数后，还算出平均分数或高低分数之间的差距等，这样才能具体显示样本的整体作文程度。常用的统计量有百分比、平均数、中位数、众数、四分位数、全距、变异数、标准偏差和变异系数等。这样用简短的文字、统计表、统计图、方程式或统计量等来描述或分析样本数据特性的方法，称为描述统计学（descriptive statistics），也就是统计分析的主要内容。由样本得到的群体现象或特性，利用机率分布，预测或判断母体群体现象或特性的方法和过程，称为推论统计学（inferential statistics）。

表示样本群体现象或特性的数值称为统计量，表示母体群体现象或特性的数值称为参数值（paramenters）或母数。

五、一般来说不同的样本，会得到不同的统计量，所以统计量数值的出现是凭运气或机会，运气或机会出现的

可能性大小称为机率（probability），如果把各统计量数值出现的机率按某种规则性加以排列，排列结果称为机率分布（probability distribution）。如果知道某种统计量的机率分布情形，将一次抽样得到的统计量数值，放在机率分布的适当位置上，就能推论出母体具体的群体现象或特性，所以机率分布是样本具体的群体现象或特性、推论出母体具体的群体现象或特性的桥梁。例如，一般人常听到的常态分布是一种常见的机率分布，如果高中生的法律常识测验成绩是常态分布，则由样本得到的平均成绩在常态分布的位置，可以推论出今年高中生的法律常识是否优于往年，其结果可以作为教育改革的参考。

六、推论母数主要有二种方法：估计（estimation）和假设检定（hypothesis testing）：

(一) 估计：是利用统计量，估算出母体相对应的参数值。

(二) 假设检定：是先假设母体的参数值，然后用得自样本的相对应统计量来检定假设的参数值是否正确。

(三) 估计和假设统计最大的不同点就是：估计是用统计量当作推论基础，而假设检定是用所假设母体的参

数值当作推论基础。

(四) 例如，候选人不知道得票率，民调后得到支持度35%（统计量），经推论后，得到误差是3%，预测

其支持度是35% ± 3%（估计母数），这种推论方法称为估计；候选人先预测得票率是40%以上（假

设母数），民调后得到支持度是42%（统计量），经推论后，判断候选人预测得票率可能是正确的，

这种推论方法称为假设检定。

第二章母体与样本

一、当对某群体中的某些事件发生兴趣时，群体已大致形成，这一特定群体在统计上称为母体（population）、

群体或母群体。母体可能是具有某种共同特性倾向的一群人或物，换句话说，母体是由许多个体或基本单元（elements）所组成的。母体依其个体的组成型态，可分为二种：

（一）有限母体（finite population）：母体内的个体数量是固定而且容易计数的，例如村里长选举以村里内的全体合格选民当母体，选民总人数是固定的而且容易计量的。

（二）无限母体（infinite popultion）：母体内的个体数量不是固定的或数量很庞大且不容易计数的，就称为无限母体，例如某快餐连锁店的消费者可能因促销活动而增减，消费者总人数不是固定的而且不

容易计数。再如总统选举以全国的全体合格选民当母体，选民总人数虽固定但是不容易计数，所以

归类为无限母体。

二、对母体内的所有个体搜集数据，以显示母体特性的方法称为普查（census）。例如1995年台湾地区的工

商普查、1990年台湾地区人口普查等。普查的结果将母体的特性用数量表示出来，则称为参数值（parameters）或母数，用以具体表示母体的特性。例如，每次选举可以视为一欠普查，各候选人的得票数或得票百分比是母数，用以具体表示该选区全体选民（母体）的支持倾向，或对某种政见的支持程度，作为将来施政的参考或依据。

三、统计方法的优点是使用最少的人力、财力、物力、时间和金钱，或者只对最少量的个体产生破坏性，就能

预估母数。为了达到这目标，所以只能在母体内选择一些个体作为搜集数据的对象，这些被选到的个体称为样本（sample）。选择样本的过程称为抽样（sampling）。所以统计方法是利用对样本搜集数据取代普查，而又能得到相似母数的最有效方法。抽样依据样本取得的机会是否公平而有二种类型：

(一) 随机抽样法（random sampling）：是母体中每一个个体，在抽之前，并不知道那一个个体会被抽出，

但是每一个个体每一次被抽到的机会是相等的，换句话说，个体被抽到的机会是随机的。

1. 简单随机抽样法（simple random sampling）：将母体中的每一个个体按顺序编上一个识别号码后，

被抽到的号码就是样本，通常是一次直接抽完所需要的样本数。如果母体内个体的数量不大，而且

个体特性类似时，使用简单随机抽样法较为恰当。

2. 系统抽样法（systematic sampling）：将母体中的每一个体按顺序编上一个识别号码后，优先算出

抽样距离（sampling interval），再随机抽出一个号码当起点或首项，然后依照抽样距离的间隔，按

照顺序，一次抽完所需要的样本数的方法，又称等距抽样法。所抽出的样本号码，是以抽样距离为

公差的等差级数。抽出第一个号码时，最好使用抽样距离以下的号码，这样会比较容易处理，例如，

抽样距离是24，则从1到24号中随机抽出一个号码，如果抽出的号码是17号，则第一个样本是

17号，第二个样本是41号（17+24），依此类推，至所需的样本数抽完为止。如果母体内个体的

数量不易确定，则编号困难，母体内个体特性差异很大时，则容易产生抽样误差，抽样误差的大小

受个体特性的分布情形及抽样距离的影响，在这种情况下，较不适合使用系统抽样法。

3. 分层抽样法（stratified sampling）：如果母体中各个体很明显的分成几组不同的性特，为了样本的

代表性，通常将母体中特性相同或相近的个体集中成一个小母体（subpopulation），这个过层称为

分层（stratified）。在这种状况下，母体被分成二个以上的小母体，每一个小母体称为一层（strata）。

层内个体的特性相同或相近，而层与层间个体的特性则明显不同。例如，将母体中的男性集中成一

层，女性集中成一层，也就是将母体按性别分成二个小母体。如果母体中各个体的特性相同或相近，

则不可能分层。分层后以层为单位，再利用简单随机抽样法或系统抽样法，自各层中按各层所含个

体数量的比例的比例抽样法（proportional sampling），抽出各层的样本数，则必须经过加权

（weighting）处理后，才能得到真正代表样本特性的数值，所以最好采用比例抽样法。

4. 整体抽样法（cluster sampling）：如果母体中各个体自然或经过人为因素组成几个特性相同或类似

的次级团体（sub-population），每一个次级团体称为一群（cluster）或一束。在这种情况下，母体

是由为数众多的群或束所组成，群内包含许多特性不同的个体，但群与群间的组织型态则相同或类

似。例如以社会为母体，则家庭可以视为母体里的群或束。分群后以群为单位编号，再利用简单随

机抽样法或系统抽样法，抽出所需的群数当做样本，如果以群的整体特性为研究对象，则一群视为

一个样本，否则所抽取群内个体总数目应等于或大于所需样本数。例如，研究蚂蚁的生态，则每一

蚂蚁窝就是一个样本。总而言之，利用母体内部的组织型态，将母体分成许多类似的群，再抽出其

中一些群当样本的方法，称为整群抽样法，又称为集束抽样法、集群抽样法、丛束抽样法、丛集抽

样法或部落抽样法。特别注意的是通常不再从所抽出的群中再抽出样本。

(二) 非随机抽样法（nonrandom sampling）：是母体中每一个个体，依实际状况故意或任意抽出，每一个

个体被抽到的机会不一定相等，也不一定有被抽到的机会，换句话说，个体被抽到的机会不是随机的。

1. 便利抽样法（convenience sampling）：以最容易得到或遇到的个体当样本的方法，又称偶遇抽样法（accidental sampling）。所得到或遇到的样本不一定具有代表性，而且有些个体可能永远不会得到或遇到，其公平性值得怀疑。例：由所捕获的鱼类，研究该河流或湖泊的生态。

2. 判断抽样法（judgment sampling）：抽样人员主观从母体选取认为适合研究所需样本的方法，称为

判断或判定抽样法，又称立意抽样法（purpose sampling）或依意抽样法。由于是主观认定，所以其公平性和客观性值得怀疑。例如，教师通常认为学业成绩好的学生，其品行一定好，办事能力一定强，所以经常指定担任干部或代表参加各种比赛。

第三章资料搜集与整体

一、使用统计方法的目的，是为了了解母体的某些特性，据以预测或判断某些事件将来发生的可能性或机率，

作为决策的参考或依据。资料指的是将这些特性以简单的文字或数据（data）表示出来，每一种特性称为一种变项（variable），所以数据是由一种以上的变项所组成的。如果是文字变项的数据，通常称为质性资料（qualitative data），指的是从不同的角度，用不同的简短文字来描述某一种特性，所以质性研究通常包含许多不同文字描述的内容，例如满意度和支持度等。如果是数字变项的数据，通常称为量性数据（quantitative data），指的是使用相同的单位，用不同的量度数据来描述某一种特性，所以量性数据通常包含许多不同单位的数据，例如身高和所得等。总而言之，数据报含质性数据和量性数据，通常为了处理上的方便，会将质性数据量化成量性数据，所以数据通常是数量化的大量数据。

二、使用统计方法得到的结果，用以预测或判断某些事件将来发生的可能性或机率的准确性，取决于所搜集资

料的准确性，所以资料搜集过程就很重要。资料就其搜集所得来源的不同，或是经过整理分，分为以下：

(三) 原始资料（primary data）：直接由样本或原始来源处搜集得到，而且没有经过整理的资料，又称初级

数据或直接数据，通常是一堆杂乱无章的答案或数据。例如由受访者直接填写的问卷调查表，或某公司人事档案里每一位员工个人的基本数据等。

1. 原始数据的量度层次（测量尺度）：原始数据的搜集，不论使用何种方法，都必须经过量度的过程。

所谓量度，指的是按照所需数据的特性，使用恰当的工具或仪器，对样本进行观测，把观测到的结

果记录下来的过程。所以如何得到适当而合用的数据，必须考虑各种不同的变项的量度层次（level）

或尺度（scale）问题，也就是数据的繁简程度问题，才能使用适当的工具或仪器对样本搜集数据。

为了让使用者有所依循，一般而言，任何一种变项在量度前，都必须考虑是搜集到类别（nominal）、

序位（ordinal）、等距（interval）或等比（ratio）等四种量度层次中的那一种层次，这四个层次（尺

度）依序有「迭床架屋」的情形【也就是说后面的量度层次（测量尺度）具有前面的那个特性】，

再加上一些额外的特性。变项的量度层次又称为变项的测量尺度（scale of measurement）。

(1) 类别层次（名目尺度）：变项的内容是文字型态，属于质性数据。将样本依性质分成不同的类型，

类型之间有明显的差别，而且彼此之间可能没有关联，每一个样本只能属于其中一种类型，称为

类别层次，是最基本和最低层次的量度方式。例如，搭乘公交车依据门上的画线高度分成要买票

和不要买票，将性别分别男性和女性，将血型分成A型、B型、O型及AB型，将职业分成军、

公、教、工、商、农、医和其他等。有时候为了方便数据的整理，尤其是使用计算机整理数据，

通常会将质性数据转换成量性数据，转换的过程是将各种不同的类型，各给予一个任意不同的代

号或数据，例如：

A. 用01代表A型、

B. 02代表B型、

C. 03代表O型、

D. 04代表AB型等，代号或数量可以随实际需要而设定。

(2) 序位层次（顺序尺度）：变项的内容是文字型态，通常是属于质性数据。样本除了可以依性质分

成明显不同的类型外，类型之间还能够分出等级或排出顺序，但不容易以数字确实表达出等级或

顺序之间的差距，或能以数字确实表达出等级或顺序之间的差距，但并没有实用上的价值，也就

是不能或没有必要量出其差距，称为序位层次，是次低层次的量度方式。一般问卷设计常用李克

特量表（Likert scale）或偏好排序；例如，对顾客满意度调查通常分为很满意、满意、普通、

不满意和很不满意等五种等级，但等级之间的差距，因人而异，并没有一定的标准，因此不能以

确定的数字来表示等级间的差距；举行赛跑时，最先到达的称为第1名，第二到达的称为第2

名，第三到达的称为第3名，与到达时间差距无关，皆可以得到预设的奖励，类似这样的问题，

只要得到序位层次的量度结果就可以了。有时候为了方便数据整理，尤其是使用计算机整理数据

时，通常会将质性数据转换成量性数据，转换的过程是将各种不同的等级或顺序，各给予一个任

意不同的数值，例如，

A. 用5分代表很满意。

B. 用4分代表满意。

C. 用3分代表普通。

D. 用2分代表不满意。

E. 用1分代表很不满意。

又如运动会拿到

A. 第1名得5分。

B. 第2名得3分。

C. 第3名得1分。

D. 总分最高分可以得到总锦标。

(3) 等距层次（区间尺度）：变项的内容是数字型态，属于量性数据。样本除了可以依性质或数据分

成明显不同的类型外，类型之间还能够分出等级或排出顺序，而且有必要能够以数字确实表达出等级或顺序间的差距，称为等距层次，是次高层次的量度方式。这层次的量度结果通常包含数字和单位，例如：

A. 日夜的温差是5℃，

B. 学业成绩第1名与第2名相差2.5分，

C. 赛跑第1名与第2名相差1.3秒等。

(4) 等比层次（比率尺度）：变项的内容是数字型态，属于量性数据。样本除了可以依性质或数据分

成明显不同的类型外，类型之间还能够分出等级或排出顺序，能够以数字确实表达出等级或顺序之间的差距，而且有必要且能够以数字确实表达出等级或顺序之间的比例，称为等比层次，是最高层次的量度方式。这层次的量度结果因为是比值，所以通常只有数字没有单位，例如：

A. 这颗树的高度是那颗树高度的2倍，

B. 他的钱只有他的1/10，

C. 他的得票数是他的1/2等。

(5) 层次间的关系：

A. 类别和序位层次的数据通常用文字表达其结果，属于质性数据，例如：

(A) 用男人比女人多，

(B) 他是第1高票，他是第2高票，他是第3高票

等来表达，而不用或不能用数字来表达的数据皆属之。通常序位层次量度的结果，可以化简成类别层次的数据，但是类别层次量度的结果，则很不容易推展成序位层次的数据，例如，可以把满意度里的很满意、满意和普通合并成满意，把不满意和很不满意合并成不满意，就是把序位层次量度化简成类别层次的数据，反之，则行不通。

B. 等距和等比层次的数据通常用数字表达其结果，属于量性数据，例如：

(A) 中午的气温比早上高3℃，

(B) 讲桌的高度是课桌高度的2倍

等，可以用数字来表达差距或比率的数据皆属之。通常等比层次量度的结果，可以化简成序位或类别层次的数据。但是类别、序位或等距层次量度的结果，也很不容易推展成等距层次的数据。例如高度可以算出比值或差距，可以排出高度顺序，或分出高与矮；如果只知道上公交车要不要买票的高与矮，则很难对顾客身高排出高度顺序，算出比值或差距。

C. 等距和等比层次的量度，有其实质上的限制，换句话说，有些变项只能得到等距的量度层次，

主要的分别在量度起点「0」值的真实意义，如果量度工具起点「0」值是真正表示「没有」，才能作等比层次的度量，例如高度是0cm表示没有高度，重量是0kg表示没有重量，所以身高和体重可以作等比层次的量度；如果量度工具起点的「0」值是随需要指定的，不是也不能用来表示「没有」，则只能作等距层次的量度，例如摄氏0度和华氏0度的「0」值，是分别视实际需要订定的，而且0度也不是表示没有温度，所以温度只能量到等距的层次。

D. 总而言之，

(A) 等比包含等距、序位和类别层次的数据，所以包含的讯息（information）最多，在等比层

次时，可以作加、减、乘或除的运算；

(B) 等距包含序位和类别层次的数据，所以包含的讯息是次多，在等距层次时，只能作加或减

的运算。

或大小。

(D) 类别层次包含的讯息是最少，只能分出同或异。

(E) 当等比或等距的数字数据，转换成序位或类别的文字数据时，通常可以顺利转换。

(F) 当序位或类别的文字数据，转换成等比或等距的数字数据时，必须设定成数值，如果设定

值不同，可能得到不同的结果，这是作转换时必须特别注意的地方。

2. 原始资料的搜集方法：抽出样本，确定了变项及其量度层次之后，就要考虑用什么方法搜集资料了。

通常使用调查（survey）或实验（experiment）的方法搜集资料，调查通常是在最自然的情况下进行，而实验是在控制某些因素下进行，依实际需要选择使用方法，必要时也可能同时进行。

(1) 调查：使用调查方法搜集的目的，是为了得到最自然和最真实的原始数据，所以在搜集数据的过

程中，必须对样本不产生任何控制或干扰，使其在最自然的状况下，提拱所需的数据。例

如私家侦探的暗中调查或者在闲聊中取得某些资料等。调查通常使用访问（interview）或

观察（observa-tion）二种方法搜集资料。

A. 访问：如果调查的对象是人，通常会利用访问的方法。访问前必须根据样本和变项的特

性，设计一份问卷调查表，如果只有问题而没有指定答案，称为开放式（open ended）

或非限制式问卷；如果所有问题皆指定答案，称为封闭式（close ended）或限制性问

卷。开放性问卷较容易搜集到完整的数据，但整理数据的过程较为复杂，而且有可能得

不到具体的结论；封闭式问卷搜集到确定答案的数据，整理数据的过程较为简单，但有

可能得不到真实的答案。为了实际上的需要，可能同时采用部分开放和封闭式的混合式

问卷。新设计的问卷应该符合简单、明了、容易回答、容易使用和容易处理为原则，而

且必须经过预测的过程，做适当的修订，以确定问卷的适用性和准确性。访问因为采用

问卷以问答方式进行，通常称为问卷调查。访问方式有当面访问、电话访问和邮寄（派

人分发）问卷访问。

B. 观察：如果样本不能回答问题或不必回答问题，通常会使用观察的方法搜集资料，换句

话说，所搜集的是有关样本行为或现象的数据。例如，暗中观察偷窃者的动作或表情，

恐布电影观众的表情等。观察项目（变项）、观察方法、量度方法和记录方法，均须事

先设定，并据以设计标准化的表格。表格并没有一定的格式，以观察人员容易填写不会

产生偏差，以及事后容易处理为原则。观察法通常是在最自然的情况下进行

(A) 但仍然有让被观察者知道的正面观察法，

(B) 不让观察者知道的暗中观察法，

(D) 以现在行为或现象推测过去行为或现象的间接观察法，

(E) 用观察员进行的人为观察法，

(F) 以及使用特定仪器的仪器观察法等。

观察法不受样本是否有被调查意愿的影响，所以较能客观和正确的记录各种外在行为或

现象，而且适合使用于人以外的样本上。但观察法通常会受时间和地点的限制，观察时

间长且成本高，而且不能观察内在的和过去的行为或现象。

(2) 实验：如果想知道统计结果会受那些因素的影响？通常会针对这些因素，经过特别设计，然后对

样本进行观察或量度（measurement），这种方法称为实验。这些因素通常会被分为：

A. 自变项（independent variable）又称为实验变项（experimental variable）、因（cause）

或处理（treatment）。

B. 应变项（dependent variable）又称为标准变项（ criterion variable）、果（effect）或

后测（posttest）。

实验的目的是为了了解二者之间的因果关系，在实验过程中，是操控自变项，然后记录应

变项的结果。实验法通常会受样本参加意愿，样本是否会受伤害，有些自变项可能不容易

加以操控，以及不能大规模或长期实验等因素的影响。

3. 原始数据的完整性：设计问卷调查表、观察表或实验表时，必须考虑其周延性（inclusion）（收敛

效度探讨的问题）和互斥性（exclusion）（区别效度探讨的问题）。以利后续的资料整理和统计推论。

(1) 周延性：就是任何依据变项搜集的数据，都必须包含所有可能出现的答案。例如，使用「其他」、

「180公分以上」或「2000元以下」等，以概括不容易划分清楚或可能很少出现的答案。(2) 互斥性：就是变项与变项之间要有明显的区隔或差异，而答案与答案之间也要有明显的区隔或

差异，不能模糊不清或重复出现，也就是任何数据只能有唯一的归属。例如不要在问卷同一题中同时出现「普通」、「差不多」和「还可以」的答案，以免难以决择，并造成统计推论的困扰，所以变项或答案之间要有互斥性。

4. 原始资料的正确度（信度）和精度（效度）：在搜集数据的过程中，可能会产生两种类型的误差，

影响数据的正确度（accuracy）和精度（precision）：

(1) 抽样误差（sampling error）：属于随机性误差（random errors），其出现是随机的，没有一定

的规律或方向，只要使用随机抽样，就一定出现这类误差，所以是不可避免的误差，但可以用统计方法估计其大小，也可以用增加样本数来降低误差值。随机误差出现的机率愈高，量度结果的正确度愈低。正确度是指重复抽样后（样本可能不同），量度结果的一致性或偏差程度，可以用统计量和母数的差异程度来表示，又称为信度（reliability）。

(2) 非抽样误差（non-sampling error）：是由于人为或测量仪器不准确所造成的误差，通常会有一

定的规律或方向，所以又称为系统性误差（systematic error）。人为误差包含调查（实验）员和被调查（实验）者所引起的误差。测量仪器的误差可以经由提高测量仪器的精密度而改善。

非抽样误差出现的机会愈高，量度结果的精度愈低。精度是指对相同样本重复量度时，结果的差异程度，也就能得到正确量测答案的程度，又称为效度（validity）。

5. 原始资料的整理：整理的方法有二种，分别是人工整理法和计算机整理法。

6. 原始资料的分类：数据报含文字数据和数字数据，而且数据通常与时间、地区或空间有关，因此，

整理数据时，必须依据简单化和系统化的原则，按照数据的特性，分别依序排列成一串数字，称为

统计数列。换句话说，就是将原始资料整理成统计数列。常用的统计数列有下列四种：

(1) 性质数列（series of attributes）：类别或序列层次量度得到的文字数据，属于分类变项

（categorical variable）、定性变项（qualitative variable）或性质变项，这类变项量度的结果不

能用数量表示，只能用文字描述特性。但通常为了方便计算机处理，会将量度的结果加以数量

化。将相同时间、相同地区所量得的性质变项，按数量化后的特定顺序或重要性排列的数据或

统计量，称为性质数列或属性数列，例如八月份台北市民对交通状况的满意度数列。

(2) 数量数列（series of variates）：等距或等比层资量度得到的数字数据，属于数值变项（numerical

variable）、计量变项（quantitative variable）或定量变项，这类变项量度的结果使用数量来表

示，其数量可能是得自量度仪器的读数，或者是由量度者依据主客观条件自行设定的值。数值

变项依其数字表现方式，又分为以下两种：

A. 间断变项（discrete variable）：得自可以一个一个数出来的点计（conting或enumerating）

结果，二个点计之间不可能再出现任何数值，点计值数量是有限个体数的，所以又称为有限

变项，例如，消费次数、投票人数、搭乘公交车次数和转车次数等。

B. 连续变项（continuous variable）：得自测量（measurement）的结果，二个测量值之间可能

再出现其他测量值，测量值数量是无限个数的，所以又称为无限变项，例如，身高、体重、

得票率和人口密度等。

(3) 时间数列（time series）：相同地区相同特性的性质变项或数值变项，按发生时间的先后顺序排

列的数据或统计量，称为时间数列或历史数列，例如，民国80年至89年，某公司在台北市的

营业额。

(4) 空间数列（spatial series）：相同时间相同特性的性质变项或数值变项，按不同地区的特定顺序

排列的数据或统计量，称为空间数列或地理数列，例如民国88年，台湾地区各县市的交通事故

件数。

(四) 次级资料（secondary data）：他人搜集的原始资料，经过整理分析或简化后，得到明确、简单而具体

的答案或数据，称为次级数据、现成数据、二手数据或间接数据。通常次级资料是得自内部报告或已刊登文献的结果，例如侯选人经常利用整理后的民调或传播媒体刊登的民调，了解支持度或满意度；

经销商告知顾客各厂牌小客车每公里的平均耗油量等。搜集次级资料的过程，通常是先确定所需的数据，然后寻找数据的可能来源，再着手搜集数据，最后是判断数据的适用性。次级数据的应用也称为文件（documents）或文献的应用。

1. 次级数据通常可以免费取得，可以节省再度搜集类似原始资料的时间和金钱。而某些原始数据不可

能或不易搜集，经由次级数据，仍然可以得到答案。例如政府公布的户口普查结果，是属于不可能

得到的原始数据的次级数据。

2. 次级数据是为了其他目的而整理出来的数据，其使用单位、整理方法和数据时间，是否适合使用，

是值得考虑的问题，而次级数据的正确性往往难以评估，更使得次级数据的价值受到限制。但次级

数据可由其来源，发表目的或过程的细节是否清楚，判断其正确性与适用性。

补充说明：李克特量表为一种量表设计方法，其利用陈述性语句，配合衡量受测量态度或意见的选项及分数，来衡量属质变量。其步骤如下：

(一) 针对研究命题搜集大量的论点。（例如：开放三通将有利于台湾经济发展）。

(二) 针对每一个论点设定其反映的类别及分数（由同意至不同意可以设定几点尺度，尺度的数目依

研究目的及变数性质而定。

(三) 将论点随机排列。

(四) 由研究对象中选取小样本，建立基本的数据组，将样本依总分数由大至小排列、分组，计算各

组、各论点的平均值。

(五) 选择组间平均值差异大的论点为问卷题目。

第五章统计量

二、利用统计图、表和统计量来显示和描述样本数据特性的方法，称为叙述统计学或描述统计学（Descriptive

Statistics ），而叙述统计学是推论统计学的基础，换句话说，必须先算出统计量，少能据以推论相关的母数。统计量如何显现样本的特性，这必须从原始数据着手。分析和观察所搜集的原始数据后，发现原始数据通常可以用二种具体方式来描述其特性：集中趋势（central tendency ）是位置的测量和离散趋势（dispersive tendency ）是散布的测量。通常利用原始资料的本质，分别定义出一个具有代表性的统计量，用以说明集中趋势和离散趋势的具体情形。定义和计算出统计量的过程和方法，称为统计量的测量（measure ）或统计量的计算。

三、数学运算符号：求总和的数学符号是Σ（sigma ），求总乘积的数学符号是Π（pi ）

如果看到ΣX 则表示

n n i I X X X X X X ++++==∑∑=...3211 i = 1,2,3,….,n

如果看到ΠX 则表示 n n i I X X X X X

X ++++==∏∏=...3211 i = 1,2,3,…,,n

四、位置的测量：每次考试，在正常的情况下，高分占少数，低分也占少数，大部份人是集中在中间分数，身

高、体重、所得和消费额都有这种情况，而这些都是常见的统计资料。可见原始资料的量度值，会向某一中间值集中，这种特性称为中心趋势或集中趋势（central tendency ）。但中间值的范围大小不一，难以界定，因此找出其中心位置（central location ）的中心值，当作集中趋势或中间值的代表值，这中心值在统计上称为集中趋势量数（measures of central tendency ）、中心位置量数（measures of central location ）或平均数（means or averages ）。常用的集中趋势量数有算术平均数（arithmetic mean ）、加权平均数（weighted mean ）、几何平均数（geometric mean ）、中位数（median ）和众数（mode ）等。

（一）算术平均数又称样本平均数（arithmetic mean ）：从样本得到的量度值，其出现的机率或所占的份量

是相同的，在这种状况下，通常会将量度值平均分配，每个样本会分配到相同的数值，这数值称为

算数平均数，简称平均数，通常位于量度值的中心位置，是最常用的集中趋势量数。算术平均值是在均匀分配情况下，得到的中心值，如果数据中出现异常的极大值或极小值时，算术平均值会偏离正常的中心位置，产生误差，因而影响其代表性。操作型（计算上）的定义是：将所有量度值X 的

总和ΣX ，除以样本数n ，得到的商称为算数平均数X ，写成公式是：X X ∑=

答：平均消费额66.5元10

95...6553n X X =+++==∑ （二）加权平均数（eeighted mean ）：如果从样本得到的量度值，其出现的机率或所占的份量是不相同的，

在这种情况下，必须先依据各量度值出现的机率或份量定出权数w （weighted number ），再求出权

数的平均值，而不是样本的平均数，这种平均数称为加权平均数。如保险费会随年龄或职业的不同，

而有不同的保费，年龄或职业是权数；成绩会随着平时成绩、期中成绩和期末成绩所占比例的不同

而改变，所占比例是权数；学期总平均成绩会随学分数不同而改变，学分数是权数；计算各种机率

分布的期望值或变异数，会随量度值的出现机率而改变，出现机率是权数。。操作型（计算上）的定

义是：将各量度值x ，分别乘其权数w ，算出各乘积的总和Σwx ，再除以权数的总和Σw 、得到的

商称为加权平均数∑∑=w

wx X W ，

答：（1）算术平均数分25.85490758088=+++==

∑n

X X （2）加权平均数分2.8312341*902*753*804*88=++++++==∑∑w wx X w 由于受艺术概论学分数及成绩的影响，所以算术平均数大于加权平均数。

（三）几何平均数（geometric mean ）：如果样本的量度值由小到大排列后，有成为几何级数，或称为等比

级数的倾向，则其中心值以使用几何平均数较具代表性。人口或细菌的增加率、物价的变动率（price

ratio ）以及滴定的浓度等，通常具有等比级数的倾向，所以使用几何平均数当作中心值，较为具代

表性。在实际应用上，等级比数的比值很难完全相等，所以其比值只要在某一范围就可以；若量度

值中有负值或零值，则不能使用几何平均数来运算。操作型（计算上）的定义是：将n 个量度值连

续相乘，得到总乘积ΠX ，再对总乘积开n 次方根，称为几何平均数G ，写成公式是n n i i x

G ∏==1

答：（1）算术平均数元205

2522201815=++++==∑n

X X （2）几何平均数元7.19)25*22*20*18*15(51===∏=n n i I X

（四）中位数（median ）：如果样本的量度值中出现异常的极大值或极小值时，通常会用量度值的中项表

示中心位置，中项的值称位中位数或二分位数，是一个重要性仅次于算术平均数的集中趋势量数。

由于中位数字于数项的中项，也就是中心位置，如果量度值没有重复出现，则有一半的量度值比中

位数大，另一半的量度值比中位数小，中位数通常用以表示薪资所得或产品的寿命等。中位数的求

算步骤如下：

1. 将n 个量度值按顺序由小到大重新排列。

2. 用下列公式求出中项：

12)(+=n md O 3. 求出中项的对应值，就是中位数，通常用me 或md 来表示，如果是奇数，则O(md)是整数，可

以直接得到对应值；如果n 是偶数，则O(md)是小数，假设O(md) = k.r ，k 是整数也是项数，r

是小数点后的整数，必须用下列公式才能得到中位数：

r x x x md k k k .0*)(1-+=+ 这个方法称为数学的内插法。

答：（1）算术平均数千元7.10910

86...98110=+++==∑n x x

（2）将量度值按顺序由小到大重新排列：

86,89,94,98,105,107,110,117,123,168

求出中项 5.52

11021)(=+=+=n md O 中位数在第5.5项，其值是

千元1065.0*)105107(105.0*)(1=-+=-+=+r k k k x x x md

由于受到极大值的影响，中位数比算术平均数更具代表性。

（五）众数（mode ）：如果样本的量度值会有种复出现的情形，则以出现次数最多次的值当作中心值，称

为众数，以mo 表示。众数不一定位于中心位置，只能说是最多数值的集中或串集位置。如果量度

值没有重复出现的情形，就没有众数。如果有重复出现的情形，而且有好几个是出现相同的次数，

就有好几个众数。众数通常用以表示满意度或得票率等质性资料的集中趋势。众数的求算步骤如下：

1. 将n 个量度值按顺序由小到大重新排列。

答：（1）将量度值按顺序由小到大重新排列：

1,1,1,1,1,1,2,2,2,2

众数mo = 1 ，也就是男性较多。

（2）将量度值按顺序由小到大重新排列：

1,1,1,1,2,2,2,3,3,4

众数 mo = 1 ，也就是A 型最多。

（3）将量度值按顺序由小到大重新排列：

151,154,155,156,160,163,166,168,170,172

没有众数。

五、散布的测量（measures of spread ）又称离势（dispersion ）或变异性（variability ），如果要比较二个以上

母体的差异情形，必须使用相对分散量数（measures of relative dispersion ）或相对离势量数。包括了变异数（variance ）、标准偏差（standard deviation ）、全距（range ）、四分位距（interquartile range ）及四分位差（quartile deviation ）。在相对分散量数里，最常使用的是变异系数C.V.，操作型定义是：标准偏差和算术平均数的比值。变异系数没有单位，变异数大的，表示其母体内个体特性分散程度或差异性较大。

(一) 统计学中有一个重要的概念，就是平均数并不能显示统计数据真正的分布状况，例如下表所示，是

A,B,C ,D,E 五组分布不同的数据，但平均数却都是4，换言之，平均数不能表示真正的分布状况。大多数统计数据的一个重要的特征，就是所包含的数值，并不都是一样的，这些数值互相不一样的程度，也就是数值之间变差的情形，十分重要。

数值

A B C D E 1

5 5 4 7

6 2

4 6 4 6 3 3

3 0

5 3 4

4 6 4 4 2 5

3 0

4 3

5 6

4 6 4 2 3 7

5 5 4 1

6 平均数 4 4 4 4 4

應用統計學筆記

我们再进一步举实例说明，假若有一位不诚实的土地开发商，声称他所开发的地均平均气温是很舒适

的24℃，这个数字可能是正确的，但是实际上该区每年有相当长的时间，只有2℃，当然很冷，而全年有几个月又很热，最高气温接近38℃，此处我们所需要的不只是平均数，也须要知道气温波动的大小，也就是气温变差的量数。

变差英文叫做variation ，亦称变异，变差的概念在统计推论中特别重要，例如我们掷一个均衡的硬币100次，虽然我们会期望正面50次，反面50次，要是结果正面54次，反面46次；或正面49次，反面51次，我们当然不会觉得奇怪，我们很可能将这种情形归究于机会的原因，为了研究所谓的“机会”这一个现象，假若我们掷一个均衡的硬币，重复掷100次，在10次这样的「实验」中，我们得到正面的次数分别是48,56,50,53,49,46,51,48,44及56，这表示由机会产生之波动，也就是变差的大小，这种知识很重要，例如我们可能须要知道决定硬币或掷硬币的人，是否有问题。

变异数分析法可以视为二母体平均数差t 检定的延伸，如果采用二平均数差的t 检定，以三组独立样本为例，就得比较三次，而最重要的是，经过三次比较后，显著水平α就会变大，以α=0.5为例，其信

赖系数会变成（0.95）3 =0.875，因此α=1-0.875=0.143。这是多组独立样本采用二平均数差t 检定时

必须注意的地方，否则可能得到错误的推论结果。 (二) 要是各个数值很靠近其平均数，这些数值的变差便很小，要是数值距离其平均数分散的相当远，其变

差便很大，利用数值离开平均数的距离来表示变差，好像是很合理，假设我们有一组数值X 1,X 2,X 3…Xn ，其平均数是x ，这些数值与平均数的差，便是)(),...,(),(21x x x x x x n ---，

这就是离均差（deviation from the mean ），我们似乎可以用离均差的平均数，作为度量这些数值变差的数量，这也许不是个坏主意，但是离均差的平均数等于零，不管数值怎样的分散，离均差的平均数总是等于零，即

∑=-0)(x x ，离均差有些是正的，有些是负的，平均消化掉了，也就是说，离均差的总和是零，当然其平均数也是零。实际上我们所观注的是这些离均差的大小，而不管它们是正的或是负的，我们可以干脆「不管」正负号，用离均差的绝对值来作变差的数量，叫做平均差（mean deviation ），不幸，这个量数有个缺点，由于是绝对值，不易作理论上的处理，例如，很难作数学的研究，也就是在抽样中，机会如何影响平均差的问题。不过，有一个办法，可以消掉离均差的正负号，在理论上，离均差的平方不可能是负的，除非数值与平均数相等，离均差的平方都是正的，数值与平均数相等，则

2)()(x x x x --和都等于零。是以，假设我们将离均差平方的和，除以n ，然后再开方，以补偿离均差的平方，我们便得到n x x ∑-2)(，这就是标准偏差（standard deviation ），所以也叫做均方根离差（root-mean-square deviation ）。大多数统计学者和其他研究人员，习惯上都对这个公式略加修正，用（n-1）来除离均差平方的总和，而不是用n ，所以，样本的标准偏差（sample standard deviation ）的计算公式是：1)

(2--=∑n x x s 。X =样本平均数，n = 样本大小。

第六章卡方检定

一、本章是推论多项分布母体的母数，较实际的说法是推论二组以上独立样本的母数，重点是推论独立样本的

适合度（test of goodness of fit ）、独立性（test of independence ）或齐一性（test of homogeneity ）。

(一) 在多项分布的情况下，其数据是得自类别或序位量度尺度的性质数列，通常是利用点计的次数来表

示结果，或利用分组数据在各组出现的次数，换句话说，经过整理的数据是以次数分配表的型态出

现，其推论的重点是推论独立样本所显现的特性是否符合理论值，或符合想象中的分布型态，这种

目的的推论称为适合度检定（test of goodness of fit ）。

(二) 如果是推论独立样本间所显现的特性是否有相关性，这种目的的推论就称为独立性检定（test of

independence ）。

(三) 如果是推论独立样本间所显现的特性是否有一致或相似性，这种目的推论就称为齐一性检定（test of

homogeneity ）。

(四) 而这些检定都是次X 2分布当作推论依据，所以统称为卡方检定（X 2 test 或 Chi-square test ）。卡

方检定的每组样本最好皆大于5，否则就必须考虑合并或利用其他适当方法，以降低误差。卡方检

定不必考虑母体是否常态分布或其他特定分布，所以是属于无母数检定法中的一种最常用检定法。

二、卡方适合度检定：

(一) 卡方适合度检定适合时机：

1. 卡方适合度检定（chi-square goodness-of-fit test ）主要是推论单一多项母体里，类别随机变项所

占的百分比或机率的分布情形，例如是否符合常态分布，或其他特殊型态的分布，或与某特定分布

的情形是否相同等。

2. 多项母体的每一个类别随机变项皆视为一个独立的小母体（分层）。

3. 每一个类别随机变项样本出现的次数或频率（frequency ），原则上不得少于5个(次)，期望值也不得少于5个(次)。如果少于5个(次)，则可行的方法是考虑用合并的方法，使其达到5个(次)以上。

(二) 卡方适合度检定的步骤：

1. 选定显著水平α，通常由0.01、0.05和0.1三者中择其一，习惯上是选择0.05。

2. 设定多项母体随机变项的分布型态。

3. 只能使用X 2分布的右尾检定，建立对应的虚无假设H 0和对立假设H 1，其型态如下：

H 0：符合某种特殊分布形态。

H 1：不符合某种特殊分布形态。

4. 由样本搜集得到，且经过整理的数据，依据随机变项或分组组数k ，算出各项或各组出现的样本数或次数O i ，或计算各项或各组样本数或次数出现的百分比或机率Pi ，i = 1,2,…,k 。

5. 依据步骤2所设定多项母体随机变项的分布型态，算出各项或各组的机率值Pi 或期望值Ei ：

Ei = nPi n 是样本总数。

6. 将各项或各组出现的样本数或次数Oi ，各项或各组的期望值Ei ，代入下列公式：

i i i E E O x ∑-=

220)( df = k – 1 得到20x 的值。上式称为Pearson 近似式也可以用机率值计算。

7. 查表得到大于20x 而df=k-1的机率函数值，也就是)(202x x

P >而df=k-1的机率值。 8. 依据所选定的显著水平α、X 2分布和右尾检定，查表得到临界值U （critical values ）并订出接受

区或拒绝区。由于X 2分布是单峰右偏分布，在显著水平α的情况下，右尾检定临界值U 是：

2),1(df x U α-=

9. 如果20x 的值或其对应的机率函数值)(202x x

P >在接受区，则接受虚无假设H 0；如果在拒绝区，

则拒绝虚无假设H 0，接受对立假设H 1。X 2右尾检定的决策法则，也就是拒绝虚无假设H 0的条件

是：U x >20 α<>)(202x x P 10. 依据所接受虚无假设H 0或对立假设H 1的条件作成结论。

第七章变异数分析

一、变异数分析(Analysis of Variance,ANOVA)，其分析的重点并不在于检验「变异数」。究其功能，其实是平

均数检定的一种延伸技术，主要是用来检验二组以上样本平均数的一种方法。所以严格说来，变异数分析应当称为多元平均数检定（multiple mean hypothesis testing）方法，或许会更恰当些。

二、变异数分析内容：

(一) 一因子单变量变异数分析（one-factor ANOVA）与多元比较（multiple comparisons）。

(二) 多因子单变量变异数分析（multi-factor ANOVA）以及其交互作用（interactions）的探讨与回顾。

(三) 多变量一因子变异数分析（one-factor MANOVA）与多元比较部分。

(四) 多变量多因子变异数分析（multi-factor MANOVA）以及其交互作用。

三、因子（factor）是用来分析或区隔我们想要观测的依变量所使用的「解释」或「控制」方法（treatment）。

这些因子的出现，其特性往往都是一种不连续的观测值。举例而言，例如我们对于人类身高（观测变量1）或者体重（观测变量2）的测度，试问是否可以使用一些其他的解释变量，来解说人类身高的差异现象？

于是想到，我们或许可以使用性别（解释变量1）、或者人种（解释变量2）、或者血型（解释变量3）来作人类身高差异上的说明。值得注意的是，这些解释变量（因子）都不是连续的，而是类别式（categorical）的性质，或称为名目尺度（nominal scale）。

四、所以或许可以这么说，变异数分析的基本想法在于将一群抽样的样本数据，依据某种标准划分成数个群组，

其中作为分群的依据，称之为因子。至于分析几个不同的群组或水平（level），称之为「处理」（treatment）。

如果仅使用「性别」一项，来解释人类在「身高」上的差异时，依据「性别」这样的分群方式称之为「因子」，区隔之后的子群体：「男性」与「女性」，称之为「处理」。

五、一因子单变量变异数分析－以前述例子是使用单一因子（性别），来分析单一变量（身高）的分析方式。

二因子单变量变异数分析－同时使用「性别」与「人种」二者，共同来解释单一变量（身高）的分析方式。

多因子单变量变异数分析－由此类推我们可以持续增加许多其他可以解释身高的因子，例如加上「年龄」、「基因」、「营养」、「环境」、「运动量」等等多种因素，用来解释人类在身高这单一变量上的差异之处。这时由于使用解释因子不是只有一两个，这种方法即称之为「多因子单变量变异数分析」。

暂且不论因子的个数多寡，由于所需要分析的观测变量一直只有一个（身高），所以这一类的分析方法，将一直维持在单变量变异数分析的范畴之内。

六、但是，倘若有人想要「同时衡量」人类的身高与体重二者，在不同的情况之下有何差异，这样的想法，将

脱离单变量的范畴，因为这时所衡量的依变量已经不只有一个，而是「同时衡量」身高与体重二者。

一因子多变量变异数分析－我们使用单一的解释变量（例如性别），来同时衡量「身高」与「体重」二者。

二因子多变量变异数分析－同时使用二个解释变量「性别」、「人种」，来衡量「身高」与「体重」二者。

多因子多变量变异数分析－如果使用更多的解释变量，来同时分析「身高」与「体重」二者。

七、