邹崇理研究员莅临中心做“组合范畴语法CCG”的学术讲座

发布时间:2016-12-01 来源:本站原创 作者:本站编辑   浏览次数:

邹崇理研究员莅临中心做“组合范畴语法CCG”的学术讲座

应西南大学逻辑与智能研究中心的邀请,中国逻辑学会会长、中国社会科学院哲学所邹崇理研究员于20161130日上午10:30在逻辑与智能研究中心的学术报告厅中进行了一场关于“组合范畴语法CCG”的学术讲座,主要内容包括组合范畴语法CCG的基本理论、CCG的多模态扩展和CCG树库的构建等三方面。

首先,介绍了关于组合范畴语法CCG的一些基本知识。他指出,CCG是逻辑学、语言学和计算机三者交叉创新的产物。CCG中的范畴的意思是,将自然语言语词按照句法行为分为若干大类,每一类指派一个用于计算的范畴标记,如:初始范畴、函项。其中,范畴之间的毗连运算是类似乘法中的分母消去运算。同时,他还深入的讲解了组合算子和组合运算的规则,并指出组合范畴语法CCG具有如下优点:1、其分析能力远远超出了经典范畴语法/上下文自由文法。不仅可以在同一个框架下统一刻画右节点提升、非成分并列、语缺等不连续结构、关系从句等无界限结构、还能转换生成语法需要用“移位”来解释的结构和现象;2、在理论允许的范围内,句法范畴之间可以运算则语义范畴中也可运算。

其次,介绍了CCG的多模态扩展。对于发展CCG的多模态扩充,主要目的是为了解决自然语言的复杂局面。他认为,要保证生成结果精准无冗余,不仅要向规则本身增加额外的限制条件,还要注意不同语言之间需要不同规则的差别以及语句的合法化。因此,邹会长着重介绍了添加范畴算子的下标的方法。在这当中,不同语言现象对句法运算的要求有所不同,需要区别对待。有时不必区分语词结合的先后顺序(如主谓宾简单句),有时需要调换两个成分的位置(如重型NP移位),体现在句法系统中,就是对结合律和置换律的不同满足情况。以Baldridge2002)假定了四种模态算子为例,让我们更加清楚的了解到了添加下标的运算方式。在这一方面的主要成果有英语:以Steedman等人为代表已经完成了宾州树库到组合范畴语法树库的转换;其他语言:土耳其语、德语等CCG词库的生成( Cakici2005Hockenmaier2007),以及汉语:微软亚洲研究院(完成部分树库的转换)。

第三,讲解了CCG树库的构建。截至目前,CCG树库的构建已经取得了较大的成就,包括:国外的宾州CCG库,有75669词条(929552词例)和48934个语句;国内清华中文CCG库有23641词条(约35万词例)32737个句子等。

最后,提出了对CCG的进一步思考和研究,如:CCG的词汇主义(语义多样性)CCGCTL——实用的和混合的思路、开发汉语CCG的句法分析器等方面的思考和研究。为我们对CCG进一步的了解和发展提供了一定的方向和构想空间。

此次讲座由中心教师李章吕副教授主持。中心主任郭美云教授、蒋军利博士,以及逻辑学专业的博士生和硕士生等20多人倾听了讲座。讲座期间气氛活跃,不少师生踊跃提问,邹会长深入浅出地作了回答。本次讲座也在热烈的掌声中圆满结束。(李陈成、李章吕 供稿)