北京大学陈保亚教授来我院作《汉语规则语法单位的提取》主题讲座
发布时间: 2024-12-06
2024年11月26日晚,北京大学博雅特聘教授陈保亚在文学院5049报告厅讲授语言学前沿研讨课,主题为“汉语规则语法单位的提取:从字到语符、词——AI大语言模型分布理论的启示”。讲座由文学院古代汉语研究所所长齐元涛老师主持。文学院许小颖老师、胡佳佳老师、余德江老师等百余名师生参与讲座。 陈保亚老师开篇指出,汉语大语言模型能够依赖的语法单位只能是字及其在文本中的分布,而汉字记录的是语素,具有一字一音节一意义的特点,人脑学习汉语也可考虑以汉字为起点。不同于大语言模型,人类语言习得的关键是从有限的语料中获取规则以及规则单位,进而生成无限的句子或文本。 陈保亚老师回顾了中外语言学界关于语法单位界定和提取问题的研究,分析了“自由”概念下各种界定方法的价值与缺陷,指出了以词和语素(字)作为规则语法单位的问题:语素的类常常不能预测整体的类;词的类可以预测整体的类,但由于复合词和词组结构上的相似性,二者的区分常常遇到困难。 为此,陈保亚老师提出了新的语法单位“语符”。语符是平行周遍分布的最小单位,涵盖自由和黏着两类形式。以平行周遍原则代替单说、扩展等标准,能够较好地处理汉语中大量黏着语素(字)可以规则活动的现象。 最后,陈保亚老师介绍了平行周遍原则的动态过程。人脑借助和经验打交道的亲知条件,通过汉字的平行周遍分布获取规则单位语符。随着语言知识的增加,提取到的规则越来越多,语符的数量越来越少,从而实现记忆的减负。这一过程中对平行周遍原则的应用体现了人类处理复杂系统时一种学习能力,通过这一原则找出的单位有利于建立语言复杂系统的规则。 讲解结束后,同学们就词组和句子层面的不规则组合、平行周遍中的不平行实例、从语言内部因素解释汉语的词汇化、音节以下的语素提取等问题,与陈保亚老师进行了深入讨论。 活动在热烈的掌声中圆满结束。讲座结束后,陈保亚老师与同学们亲切交流。 (图/崔耘赫 文/郑雅钦)