在英语教学和测试领域,作文是检测英语学习者语言能力的重要指标。评测学习者英语作文通常依靠教师或评分员人工评阅。这一过程需要耗费大量的人力和物力,同时很难保障作文评测的信度和效度。为了克服上述弊端,国内外学者近年来开始借助自然语言处理技术,利用计算机自动评测学习者的作文质量。其中,语法错误的自动检测和修改是作文质量自动评测的重要环节。目前,学习者作文的语法检测主要采用基于语法规则和基于统计两种方法,前者有的语言学理论基础,充分考虑语言的线性和层级结构,但依靠语言学家直觉编写的语法规则覆盖面有限,无法检测涉及搭配和冠词、介词等类别的语法错误;后者以大规模的真实语料为知识来源,避免了人工编写规则的繁琐,且覆盖面大,但这种方法对语言的层级结构考虑不够。本研究拟结合上述两种方法的优点,使用混合法进行自动语法检查:混合法以语法规则为基础编写错误模板,同时,从大规模经过词性和句法标注的语料库中提取词汇-语法信息构建模型,弥补模板的不足,提高现有语法检测系统的率。
面向英语书面语误自动检测的依存规则研究》结合基于语法规则和基于统计两种语法检测方法的优点,使用混合
法进行自动语法检查:混合法以语法规则为基础编写错误模板,同时,从大规模经过词性和句法标注的语料库中提
取词汇-语法信息构建模型,弥补模板的不足,提高现有语法检测系统的率。
刘磊于2011-2014年间师从北京外国语大学中国外语研究中心的梁茂成教授,获得外国语言学与应用语言学方向博士学位。本人研究兴趣包括语料库语言学、计算机语言学和计算机辅助英语教学。近年来,本人参与和主持了若干校级和省部级项目,内容涉及英语学习者书面语误自动检测和学习者书面语搭配特征研究等,并发表了相关论文。