题目:超大型英汉平行语料库的加工与检索:大数据视角
时间:2017年6月15日 15:30-17:30
地点:人文馆416
主讲人:刘鼎甲,英语语言文学硕士与计算机应用技术博士,北京外国语大学中国外语与教育研究中心博士后研究员。研究兴趣为语料库、计算语言学与语料库翻译学。主持中国博士后科学基金面上项目一项,参加国家社科重大课题一项、国家社科两项、省部级课题多项,在《中国外语》、《外语与外语教学》、《语料库语言学》、《小型微型计算机系统》等发表文章十数篇,被CSSCI、CSCD、EI和SCI收录。
内容简介:本研究报告国家社科重大项目“大规模英汉平行语料库的建立与加工”在语料库检索技术上取得的进展:首先,梳理语料库加工与检索技术的发展脉络;其次,介绍项目进行的词类赋码、双语对齐、句法分析方法;第三,介绍面向一亿词级别英汉平行语料库检索的《大规模中英文平行语料库检索平台 v1.1》及其应用。最后,对比分析本研究所设计的方法与技术较之传统平行语料库研制的优势,并展望未来语料库加工与检索技术改进和发展的方向。
欢迎广大师生参加。
外国语学院
2017年6月12日