文档视界 最新最全的文档下载
当前位置:文档视界 › 语言研究方法和统计语言学--必背

语言研究方法和统计语言学--必背

语言研究方法和统计语言学--必背
语言研究方法和统计语言学--必背

语言研究方法

一、选题步骤

文献调研科学分析提出选题初步论证评议和确定课题

1、课题调研调研与考察是对有关课题的历史、现状及发展趋势进行调查研究,要掌握前人对有关课题已做了哪些工作,还存在什么问题,问题的关键在哪里,已经得出什么结论,有什么经验和教训,以便在新的起点上选择课题。

2、课题选择根据调研和实际考察的结果,初选出诸个科学问题,认真分析其在科技发展中的地位、作用、社会经济效益以及制约科研能否顺利进行的其他因素等。

3、课题论证论证是指对课题进行全面的评审,看其是否符合选题的基本原则,并分别对课题研究的目的性、根据性、创造性和可行性进行论证,以确定选题的正确性。课题论证一般采取同行专家研究评议与管理决策部门相结合的方式进行。

4、课题确定经过课题论证之后,该课题若通过,即课题确定。若没通过,该课题则被淘汰,需再按照选题的程序和原则,另行选定其他课题。

二、文献检索方法

1. 常用法:是利用文摘或题录等各种文献检索工具查找文献的方法。按时间顺序查找,可顺查、倒查和抽查。

(1) 顺查法。这是一种以课题起始年代为起点从远到近按时间顺序的查法。查找前要摸清该课题提出的背景和大致时间,从问题发生的年代查起,这样一卷卷或一年年地查找,直到认为文献够用为止。这种逐年顺查的方法是有利于查全,不遗漏;缺点是比较费时间,检索效率低。

(2) 倒查法。与顺查法相反,就是由近而远地按时间逆序查找。这种方法适用于一些新的课题或有新内容的老课题。查找时效率高,省时省力,但容易遗漏有用的文献。

(3) 抽查法。这是一种针对学科发展特点,抓着该学科发展迅速、文献发表较多的年代,抽出一段时间,逐年检索。

2. 引文法:也叫追溯法或扩展法。这是一种传统的获取文献的方法。即利用已知的有关文献后所附的“引用参考文献”进行追溯查找。

综合法:也称“循环法”或“分段法”,就是将上述两种方法结合使用,即先通过选定的检索工具查找出一批文献,然后再利用文献所附的参考文献来追溯查找,如此交替地往前推移。这种方法兼有常用法和引文法的优点,可以查得全而准,检索效率高。

三、西方现代哲学思潮和流派

“现代西方哲学流派”是指马克思主义哲学产生以后西方流行的各种哲学派别,是近代西方哲学的继续。现代西方流行的哲学流派虽形形色色,但大致分属科学主义(实证主义)与人本主义(非理性主义)两大思潮。

现代西方的科学主义哲学思潮渊源于近代英国的经验主义,强调归纳、实证、逻辑、实用,关注自然科学的哲学问题。十九世纪三十年代,第一代是孔德的实证主义;第二代的马赫主义,第三代的逻辑实证主义,第四代的波普尔的批判理性主义;及后来的历史主义或科学哲学的历史学派。

现代西方的人本主义哲学思潮则渊源于欧洲大陆的唯理主义,强调演绎、普遍、绝对、直觉、关注人的存在意义。第一代是叔本华、尼采的意志主义;第二代是狄尔泰、柏格森等人的生命哲学;另一个哲学流派是胡塞尔的现象学;第三代是海德格尔、萨特尔的存在主义和法兰克福学派。在当今西方流行的人本主义的哲学流派中,比较特殊的是新托马斯主义和人格主义。

二十世纪六十年代以后,西方还出现了一种反人本主义的哲学流派--结构主义。在现代西方哲学中,与上述两大思潮密切相联系的是“西方马克思主义”。“西方马克思主义”是现代西方各种哲学流派与马克思主义革命理论相“结合”的产物。

四、科学的研究方法的特点

科学研究方法的特征是(数学方法和实验方法的结合)、(假说方法与一套严密的逻辑推导规则相结合)、系统的经验观察和自我校正。

1、理想实验方法的凸现。在近代 , 人们对实验方法进行了自觉和广泛的运用,并取得了一系列成就。

2、数学方法和实验方法的结合是近代科学研究方法的最显著特征。实验方法作为检验认识事物标准,保证了

经验科学的确定性;数学方法又保证了科学的精确性。

3、假说方法与一套严密的逻辑推导规则相结合也是近代科学研究的方法特征。科学假说在近代后期成为了一种重要的研究方法,同时带动了分析、比较、分类、归纳、演绎等逻辑规则的运用与发展,为辩证法的发展奠定了基础。

一、定性和定量的研究方法

定量研究——是通过对研究对象的特征按某种标准作量的比较来测定对象特征数值,或求出某些因素间的量的变化规律。由于其目的是对事物及其运动的量的属性作出回答,故称定量研究。

定性研究方法是根据社会现象或事物所具有的属性和在运动中的矛盾变化,从事物的内在规定性来研究事物的一种方法或角度。它以普遍承认的公理、一套演绎逻辑和大量的历史事实为分析基础,从事物的矛盾性出发,描述、阐释所研究的事物。进行定性研究,要依据一定的理论与经验,直接抓住事物特征的主要方面,将同质性在数量上的差异暂时略去。

定性研究有两个不同的层次,一是没有或缺乏数量分析的纯定性研究,结论往往具有概括性和较浓的思辨色彩;二是建立在定量分析的基础上的、更高层次的定性研究。

在实际研究中,定性研究与定量研究常配合使用。在进行定量研究之前,研究者须借助定性研究确定所要研究的现象的性质;在进行定量研究过程中,研究者又须借助定性研究确定现象发生质变的数量界限和引起质变的原因。

定性研究与定量研究有下列一些不同点:

①着眼点不同。定性研究着重事物质的方面;定量研究着重事物量的方面。

②在研究中所处的层次不同。定量研究是为了更准确地定性。

③依据不同。定量研究依据的主要是调查得到的现实资料数据,定性研究的依据则是大量历史事实和生活经验材料。

④手段不同。定量研究主要运用经验测量、统计分析和建立模型等方法;定性研究则主要运用逻辑推理、历史比较等方法。

⑤学科基础不同。定量研究是以概率论、社会统计学等为基础,而定性研究则以逻辑学、历史学为基础。

⑥结论表述形式不同。定量研究主要以数据、模式、图形等来表达;定性研究结论多以文字描述为主。定性研究是定量研究的基础,是它的指南,但只有同时运用定量研究,才能在精确定量的根据下准确定性。

二、学术论文写作方法

学术论文是对某个科学领域中的学术问题进行研究后表述科学研究成果的理论文章。

学术论文应具备以下四个特点:科学性、创造性、理论性、平易性。

步骤有:确立选题,制订方案,收集资料,组织素材,撰写初稿,修改定稿

1确立选题

①从作者自身的知识、兴趣、专业背景考虑②选题内容有较多的文献资料可供参③在理论和实践上有一定的价值和意义④比较容易进行学术创新⑤尽量使用问题细化、大处着眼,小处落笔

2制订方案

要明确研究什么?为什么做此研究?如此对此进行研究?按怎样的程序进行?需参阅哪些资料,采用什么样的分析手段和工具?存在哪些局限性?研究在理论和实践上存在的价值和意义

3收集资料

查阅文献备案文献实地调查观察实验

4组织素材

理清思路拟定提纲构建框架

5撰写初稿

紧扣主题注意逻辑标注疑问,留出修改空间

6修改定稿

通盘考虑反复斟酌(理论依据是否可靠;概念的使用是否准确;论据数据是否可靠;逻辑是否严密;文字标点是否正确)最准定稿

统计语言学

1统计分析方法选择的主要依据

①根据研究的目的,明确研究试验设计类型、研究因素与水平数;②确定数据特征(是否正态分布等)和样本量大小;③正确判断统计资料所对应的类型(计量、计数和等级资料),同时应根据统计方法的适宜条件进行正确的统计量值计算;最后,还要根据专业知识与资料的实际情况,结合统计学原则,灵活地选择统计分析方法。

2为什么进行显著性检验

显著性检验即用于实验处理组与对照组或两种不同处理的效应之间是否有差异,以及这种差异是否显著的方法。

第一类错误是“以真为假”的错误,即原假设是正确但却被拒绝的错误,也称“弃真错误”;第二类错误是“以假为真”的错误,即原假设不正确却被接受的错误,也称“纳伪”错误。

进行显著性检验是为了消除Ⅰ类错误和Ⅱ类错误,显著性检验是针对我们对总体所做的假设做检验,其原理就是“小概率事件实际不可能性原理”来接受或否定假设

3、进行协方差分析需要满足哪些条件?

协方差分析:将线性回归与方差分析结合起来,检验两组或多组修正均数间有无差异的一种统计方法,用于消除混杂因素对分析指标的影响。

满足条件:理论上要求各组资料都来自方差相同的正态总体;各组的总体直线回归系数相等,且都不为0。因此,严格地说,在对资料作协方差分析之前,应先对这两个前提条件作假设检验,若资料符合上述两个条件,或经变量变换后符合上述条件,方可进行协方差分析否则不宜使用。

4、统计学的因素和水平?

因素也称因子,是方差分析中所要检验的对象,水平的就是影响因素的强度

5、统计语言学概念及研究领域

概念:统计语言学,研究如何利用概率论、数理统计、信息论等统计的、非离散数学的方法和计算机来对自然语言进行统计和分析。自然语言是其统计和分析的对象,概率论和数理统计等统计知识是其统计的理论基础,计算机是其可以实现统计的工具。因此,对语言进行统计不仅要有语言学方面的知识,而且还要有数学和计算机科学方面的知识。

研究领域:

统计语言学的研究领域目前主要包括以下几个方面:

①统计语言单位的出现频率,如对词汇和音位、语素出现的频率进行统计研究。

②统计作家的用词频率、词长分布和句长分布,以了解作家运用语言的风格;用这种方法还可判定匿名文章的作者。

③计算语言存在的绝对年代以及亲属语言从共同原始语分化出来的年代,这方面的研究叫做语言年代学,又称为词源统计分析法。此外,还可对亲属语言的语法、语音体系进行统计、比较。

④采用信息论方法研究语言的熵和羡余度。语言的熵就是在交际过程中语言符号出现的不定度。不定度的大小与语言的熵的高低一致。当语言的接收者接收到语言符号之后,不定度被消除,熵等于零,因而在交际过程中,语言接收者所得到的信息量恰恰等于被消除的熵。语言的羡余度是指语言中超过传递最少需要量的信息量的比例,在一般情况下,人们为了保证对方能够理解,总是提供比实际需要多得多的信息量,因此,不论在书面语还是口语中,语言都有羡余度。

⑤探讨语言的一般统计规律。例如,在按频率递减顺序排列的频率词典中,词的序号越大,词的频率越小,序号与频率之间的关系可以用数学公式描述为一定的统计规律,这个统计规律叫做齐夫定律,因其研究者之一、美国语文学家G.K.齐夫而得名。

⑥运用随机过程论来研究语言,把语言看成彼此联系的字母序列,前一个字母决定后一个字母的出现,于是形成一条字母链,叫做马尔科夫链,因其最早的研究者俄国数学家A.A.马尔科夫而得名。

⑦研究文章中两个词之间、两个语法范畴之间、两个语义类之间或两个句法类型之间的间距,以揭示文章在句法或语义上的特征。

⑧研究语言的词汇与文章长度的关系,以揭示文章中词汇的丰富程度和差异程度。

6、从语言学角度分析统计语言学发展的历史,论述各历史阶段统计语言学的价值?

统计语言学在数理语言学中有比较悠久的历史。

古印度语法学家在研究《吠陀》时,就进行过单词和音节数目的统计。

19世纪,1851年,英国数学家A.德·摩尔根曾把词长作为文章风格的一个特征加以统计研究。苏格兰学者L.坎贝尔于1867年、德国学者W.迪丁贝尔格于1881年都曾采用统计方法确定柏拉图著作的写作时期。1887年,美国学者T.C.门登霍尔对英国文学作品、特别是莎士比亚的作品进行过统计分析。

价值:开始用统计学来研究语言的词汇、音位,也使用过统计方法来研究语言的风格等。

20世纪,1913年,马尔科夫研究了俄语中字母序列的生成问题,提出了马尔科夫随机过程论。1944年,英国数学家G.U.尤勒在《文学词语的统计分析》一书中广泛使用概率和统计方法来研究语言。1950年,美国学者M.斯瓦德士进行了语言年代学的研究。1951年,美国数学家C.申农采用信息论的方法研究书面英语中的熵和羡余度;美国学者V.英格韦对句法现象进行了间距分析。1954年,法国学者P.基罗根据文章中词的频率分布提出了词汇丰富度的概念。1956年,英国学者G.赫尔丹出版了《语言是选择和机遇》一书,系统总结了统计语言学的研究成果。

价值:通过统计来研究语言及语言的熵和羡余度、语言的年代、词汇的丰富度、语言或语义上的特征等近30年来,在语言统计中日益广泛地使用计算机,逐渐改变了传统的手工查频、统计的办法,提高了统计的效率和精度

价值:使统计语言学得到了迅速发展。

相关文档