八喜电子书 > 经管其他电子书 > 思维科学探索 >

第35部分

思维科学探索-第35部分

小说: 思维科学探索 字数: 每页4000字

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!



研究它一般的理论。
模式识别和科学的语言学是两门技术科学。通过对这两
门技术科学的研究和加以应用,可以为共同的基础科学形象
思维学提供素材,而这两门技术科学之间有一致的地方,它已
经由句法模式识别加以沟通。模式识别的发展经历了从统计
模式识别、句法模式识别到词意句法模式识别的过程。词意句
法模式识别的方法与人识别模式的方法之间的差距,在某种
第 299 页
十五年才发展起来的。
程度上缩小了。或者说前者由于受到人的识别启发其方法更
多一些。这里针对科学语言学与模式识别之间一致的地方,
以及词意句法模式识别的初步形成作一个简单的介绍:
以往根据一般性的识别方法把模式识别分为统计(决策
理论)模式识别及句法(结构)模式识别两大类
模式识别首先把模式进行数
选取的特征对于通常遇到的干扰束来说,应尽可能具有不
变性,或者至少是很不敏感。对于比较简单的模式,模式
识别就是对模式进行分类。如果抽取
描绘原来的模式,那么就可以用一个
的模式。用特征向量构成代表相应模式类的“模板”对于一
个未知的模式,就用与模板进行匹配即计算相关函数的办法
来进行分类。这种办法是以高维随机向量分析作为基础的,分
类就相当于把特征空间划分成若干部分,每一部分与一模式
类相对应。很明显人脑用的不会是这种办法。句法模式识别
着眼于把模式的构成与语言的构成加以类比,它借鉴数理语
言中的概念、方法与结果。这样就把识别方法建立在数理语言
的基础上,把数理语言中的句法结构及生成方式用于模式的
构成与描述。例如,一幅图象如何由比较简单的子图象构
成,子图象又如何由更简单的子图象构成等等,就象英文句
子由短语组成,短语又由单词组成。一幅图象就相当于某种
文法规则组成的句子。它的形式可以象语言那样是符号组成
的链,也可以推广到树状的形式,或者是包括结点和分支的
图的形式。
句法模式识别的研究不象统计模式识别那样透彻,是近
年美国普度大学傅京孙教授发表
。统计
压缩,抽取反映模式的特征。
个特征能够基本上
维的向量来代表相应
第 300 页
。另外,一些试验证
了第一本专著《模式识别中的句法方法》,从而奠定了句法模
式识别的基础。句法方法抓住图象模式与语言之间在结构方
面的共性,把两者沟通,给模式识别打开了一个新的局面。然
而它在工程领域内,受到欢迎的程度并不热烈。其原因之一是
通过句法分析来进行识别时,由于产生比较简单的图形就需
要考虑上下文的信息,就是说需要由上下文敏感的文法来加
以描述。关于上下文敏感文法的句法分析相当复杂,需要很长
的机器时间。另一个原因是对于大部分实际问题来说,设计者
面对大量模式样本,如何根据这些样本归纳出描述这些样本
的文法也就是所谓的“文法推断”,问题不象原先估计的那
样容易解决。目前已经摸索到解决这些问题的途径:把统计模
式识别和句法模式识别统一起来,取长补短,建立新的模型
词意句法模式识别。词意信息是十分重要的,人们说话
或理解别人的话都不能离开记忆。长期记忆的模型往往是某
种结点和链的网络这种记忆可以沿着链束获得,也可以借助
于对刺激的直接的辨别和再认来获得
明人们的记忆中着重的是概念是词意,而不是句法。句法模
式识别基本上是按乔姆斯基短语结构文法体系建立起来的
。考虑的仅是句法,有局限性。词意句法模式识别既考
虑句法又考虑词意,通过采用属性文法,文法中包括句法部
分和词意部分并且加上元素的属性和连接关系的属性,把统
计模式识别和句法识别有机地统一起来。与统计方法及句法
相比较,词意句法方法与人识别模式的方法接近的程度加大
了,通过对模式识别中这一新的领域的深入研究,可能为建
立形象思维学提供富有启发性的素材。
二、短语结构语言      记忆认识与思维都与语言密切
第 301 页
字母表是构成语言
字母表
度有限的符号链。链的长度
的数目。一个语言所包含的句子总是无限多。
,宏文法
,近
有关,大脑信息加工的研究和模拟中就有一系列语言学或与
语言有关的课题。已经有一些关于科学语言的介绍
代语言学的特点是利用数学作为工具来研究语言。语言学
和数学相结合形成了数理语言学。数理语言学又可以划分为
统计语言学和代数语言学,前者着重研究词汇和文体的统计
特征以及语言内在结构的统计规律,后者主要研究语言的
学模型。最初关于语言的数学结构的探讨,其目的在于了解
自然语言的性质,通过研究发现具有一组产生式规则的短语
结构文法可以用来作为描述语言的方法。五十年代这一概念
发展和加以形式化。
由心理语言学家乔姆斯基和巴希勒尔以及他们的合作者加以
年以后发展了由巴库士范式定义的
程序语言,是短语结构语言中的一类语言上
下文无关语言。这一发现打开了从理论上取代仅仅用启发式
的办法来研究程序语言的可能性。自从乔姆斯基提出短语结
构文法以后,还提出过许多其他的文法模型,有些模型中采
用特殊形式的产生式。例如附标文法(阿荷
(费希切
夫特
,散射上下文无关文法(格瑞巴赫和哈普克洛
,还有的文法是对所用的产生式的次序加以限
制,如程序文法(罗申克瑞兹。另外在自然语言和程
序语言方面都进行了大量的工作。
有一个
乔姆斯基针对过去语言研究中的归纳方法,建立起一个
演绎性的形式语言系统。根据他的理论,某种语言
的有限个符号的集合,如英语的
中的符号从左往右排构成长
表示链中所包含的符号
中的符号所
第 302 页
优秀的
学生
〈动词〉〈副词
能够成的所有链用表示,所研究的语言是的一个子
集。中还包含着空链,空链包括语言单位之间的间隔,如
时,起着重要的作用。表示。
一段话语与另一段话语之间的停顿。空链在描写句子的结构
中除去空链所成的集合用
这些符号在以后将会遇到。
是一个动词短
下面简单的谈谈短语结构语言,虽然它的概念来源于分
析英文句子。为方便起见,我们用一个中文句子“优秀的学
生学习努力”为例加以说明,然后再转到讨论文法。这里
“优秀的学生”是一个名词短语作为主语,它包括着形容词
“优秀的”和名词“学生”,“学习努力
语,它包括动词“学习”和副词“努力”。这个句子可以由
下面的步骤形成。
〈句子〉
、〈名词短语〉〈动词短语〉
、〈形容词〉〈名词〉〈动词短语〉
、优秀的〈名词〉〈动词短语〉
、优秀的学生〈动词短语〉
、优秀的学生〈动词〉〈副词〉
、优秀的学生学习〈努力〉
、优秀的学生学习努力
〈句子〉
上述这些步骤可以依次按下列产生规则:
〈名词短语〉〈动词短语
〈名词短语〉〈形容词〉〈名词〉
〈动词短语〉
形容词〉
〈名词〉
第 303 页
是产生式的左部, 是产生式的右部。
学习
努力
表示“可以再写成”。
这样一个句子的产生还可以用树形图表示如下:通过
上面的分析我们来定义产生短语结构语言的短语结构文
法,一个短语结构文法是形如
四元式,其中和
量)。在上面例子中
) 的
是非终止符和终止符字母表( 或变
={〈句子〉,〈名词短语〉,〈动词
短语〉,〈形容词〉,〈名词〉,〈动词〉,〈副词〉
={优秀的,学生,学习,努力}
和的总和构成的总字母表,且
写, 是产生式(或再规则)有限集产生式形式表示成
其中都是中的变量组成的链,且中至少包括一个
非终止符, 是

中一个特殊的符号,称为起始符,对应于上面例中的〈句
。把句子的生成与图象的生成加以比较,也可以用短语结
构文法来产生或描述图象。例如,用下列短语结构文法生成:
次中性染色体〉)
〈动词〉
〈副词〉
上式中的
第 304 页
〈臂对〉
〈臂对〉
〈臂对〉
〈臂对〉
:〈次中性染色体〉
〈边〉〈臂对〉
〈臂对〉〈边〉
〈臂〉〈右部〉
〈左部〉〈臂
〈臂对〉
臂部〉〈臂〉(接下页)
〈臂对〉
右部〉,〈臂〉,〈边〉
, { 〈次中性染色体〉, 〈臂对〉, 〈左部
第 305 页
型(没有限制)的文法,即产生
可以

型文法到
〈臂〉
( 接上页)
〈右部〉
〈边〉
边〉
〈臂〉
〈臂〉
〈边〉
〈边〉
〈边〉
〈边〉
〈臂〉
〈臂〉
〈臂〉
乔姆斯基根据产生式的不同形式把短语结构文法
分成种类型。第一种称为
式的箭头两端的链可以是任意的。这样的文法过于广泛
而没有什么用处,一般说来不能确定一条由终止符组成的链
是否由型文法产生。由型文法产生的语言称为
型文法,
型语言。第
二种称为型文法的产生式的形式是有限制的,形式
为: 其中且
的情况下,
由型文法叫做上下文敏感文法。上下文
( 零链)。这意味着在上下文分别为
来加以代换,所以
型文
,其中
敏感文法产生的语言称为上下文敏感语言。第三种称为
法或上下文无关文法,产生式的形式为:
可以用,
代换而这种代换与型文法或有
),这意味着非终止符
的上下文无关。第四种称为
或其中
都是单个符号。从
限状态文法,产生式的形式为:
,这里
型文法,对于产生式的限制是逐步增加的。因此它们之间
便有这样的关系:
第 306 页
要研究高维图象文法。克尔希(
型型型型
很明显它们所产生的语言之间也有这种关系。
我们可以用不同的观点来看待语言,文法是从生成的观
点来看,另一种是从接受的观点来看,那就是识别(自动
机)的观点。短语结构文法中的每一种文法与
,上下文
种类型的自
动机对应,即该种文法产生的语言恰好能够由对应的自动机
接受。文法和自动机是密切联系而不可分的。有限状态文法
与有限状态自动机(
无关文法与非确定下推自动机(
机(
,上下文敏感文法与线性有界自动
型文法与图灵机
)相对应。
短语结构文法所产生的语言是字母表中的符号组成的
链。这种链是通过产生式规则生成的。对于描述某些一维的
模式,如声音、波形等是有效的。上面谈到的染色体是把外
形转换成一维的表示,对于描述图象及高维模式满足不了要
求,所以就需要研究高维模式文法。
三、图象文法      符号链是一维的,符号之间只有左右
连接关系,而图象模式是二维的,连接关系就不仅仅是左右
连接。用产生符号链的链文法来产生二维的图象需要首先把
象转换成一维的链,这样很不方便,效率也低,很自然就
)可能是第一
条产生式,产生式
个给出一个完整的图象文法的人。他构造了一个能够产生任
意等边直角三角形的文法。文法中包括
以图形方式给出。以具有九个方格的方块表示:
第 307 页
中的一个。所描绘的直角三角形以表示直角顶点, 、
和斜边由
和、
组成,另一条边由组成,三角形的内点为字母
可、中的一个,
其他两个顶点分别为组成,一条底边由
在上述产生式中,符号可以是
是中的一个, 可以是以
及空白中的一个。在产生式( ) 中,
条开始,以

不同的位置可以代表不同的字母。在使用产生式时,箭头两
端希腊字母代表同样的符号。这些产生式从第
任何方式进行直至没有规则可用而构成一个等边直角三角形
方块中可以是空白,或者是英文字母
第 308 页
为止。所产生的三角形如图所示,从这些产生式的形式
可以看出来,要求在一定条件下进行代换所以这一文法是上
下文敏感的文法。
接起来用一个向量表示,然后定义种连接运算关系:
把每个图象元素规定头( )和尾( ,并且把头尾连
另外还提出过一种图象描述语言

第 309 页
)描述房子。其树状表示如下:
描述英文字母链( ) )
于是上述文法产生的链(( )
三角形(
房子( ) ) ( 三角形)
房子, (三角形) )
以及产生式集
, ,
形=
,其中= 房子,三角
用下面的文法可以产生英文字母和房子
如果以种线段作为基本元素
此外,运算表示把头尾例置
第 310 页
,丛状文法( ,其中
先后曾经提出过一些图象文法如网状文法( 与
第 311 页
产生的链表
表示的模
,使得由文法
分析”。除了回答
所示:
树状文法因为能有效地进行句法分析,所以比较广泛的采
用。下面的例子给出用树状表示描绘一个简单的电感电容线
路,如图
个模式类,可以分
四、句法分析  如果构造了一个文法来产生一种语言,
这种语言恰好能描述我们所研究的模式。识别模式就变成识
别语言了。下一步就是设计一个识别程序来识别由文法所产
生的语言,并且要求根据某个特定的文法所设计的识别程序
只能识别这个文法产生的语言。例如有
个文法
类中的模式。那么对于一个未知的、用链
别构造
示第
式,模式识别问题基本上成为这样的问题: 属于个文法
代表的模式属于或不属于
中哪一个文法产生的语言?求解这一问题的过程称为“句法
产生的语言
之外,句法分析的过程还提供这个模式的结构信息。
如果是有限状态文法,那么就可以根据有限状态文法
与有限状态自动机之间的对应关系,设计一个有限状态自动

第 312 页
机来产生的语言。如果文法
相一致,那么
是上下文无关文法
一般说来要求

返回目录 上一页 下一页 回到顶部 0 0

你可能喜欢的