70周年校庆 | 国内首家语料库研究院在上外揭牌

2019年11月19日

为推动跨学科研究和语言智能研究,2019年11月16日,国内首家语料库研究院在上海外国语大学揭牌。在揭牌仪式同时,上外语料库研究院召开了以“语料库与跨学科研究”为主题的学术研讨会,吸引了来自英国、新加坡、港澳地区和内地高校和企业机构的130余名专家和学者参会。

5-2_副本.jpg

近年来,语料库愈来愈广泛地应用于人文科学、社会科学和自然科学之中,具体包括语言学、文学、翻译学、舆情研究、国别与区域研究、医学和人工智能等领域。为推进语料库在不同学科研究中的应用,上海外国语大学积极推进机构创新,成立语料库研究院这一校级实体机构,是对大数据时代和人工智能发展的强有力响应,为学校,乃至国家的语料库研究和应用的高水平的可持续发展奠定了扎实的基础。

上外党委书记姜锋在揭牌仪式上表示,科技与人文的结合是上海外国语大学在未来发展当中一个非常重要的起点。不仅要关注如何把对传统语言翻译人才的培养推向卓越,同时也关注新兴人工智能领域的神经语言学、语料库语言学、计算语言学、语言智能等。语料库研究院的设立将有利于整合学校资源,实现跨学科资源整合,服务于人才培养和社会发展。

5-1揭牌_副本.jpg

中国外文局前副局长、全国翻译专业教育指导委员会主任委员黄友义教授表示,随着时代发展和国际形势的变化,我国对外传播面临的新挑战,从翻译实践和翻译需求看,多领域语料库的研究建设十分迫切。上外语料库研究院建立,是翻译教育领域的一件大事,它标志着上外应对翻译新时代挑战的新举措。

国务院学科评议组外语学科召集人、浙江大学文科资深教授许钧教授认为,上外语料库研究院积极对接国际学术研究前沿和国家发展战略,不仅面向广阔社会,关注人才培养,还通过产学研相结合,注重基础研究和应用研究并重。

国务院学科评议组成员、北京外国语大学讲席教授王克非在致辞中表示,这是一个需要语料库,并且产生出语料库的时代。语料库无论是给语言研究者,还是给翻译研究者都开垦出一片崭新的天地。上外语料库研究院的成立,在这个信息化、数据化、数字化时代,是一个标志性的事件。

北京语言大学原党委书记、中国辞书协会会长李宇明教授表示,进入到5G时代和语言智能时代,谁拥有了非常好的数据库,谁就可能拥有这个学科。语料库是人工智能最重要的一部分,不仅要为学校、为同行与社会建语料库,还要为未来的机器发展建语料库、为人才培养建好语料库。

上海对外经贸大学原副校长、上海市外文学会会长叶兴国教授表示,当前,自动化、信息化和智能化不断融合,势必对外语教育和研究产生深刻的影响,语料库数据的影响力涉及多个领域,乃至整个社会的科学。上外成立语料库研究院,不仅是顺应信息技术发展趋势的创新举措,而且有助于推进新文科建设,更将推进外语教学中国学派的构建。

5-3_副本.jpg

与此同时,上外语料库研究院分别与和鲸科技有限公司和上海外语教育出版社签署了联合建设语言智能实验室协议、合作出版《语料库与语言文化》辑刊协议,并举行了上外语料库研究院网站和上外语料库研究院语料库检索与应用平台的启用仪式。

据上外语料库研究院院长胡开宝教授介绍,上外语料库研究院团队由语料库翻译学、语料库语言学、计算语言学、计算机科学、语言智能等领域的专家组成,将建设“一带一路”多语平行语料库、国别与区域研究多语语料库、语料库建设平台、语料库检索与应用平台,以及语言智能实验室和数字人文实验室等基础设施,大力推进基于语料库的跨学科研究,推动语料库建设与应用方面的产学研合作,培养语言数据开发与应用等领域的高端人才。

在主旨发言环节,英国曼彻斯特大学Mona Baker教授及其博士生Jan Buts详细介绍了如何采用语料库技术研究西方文明核心概念在不同文化体系中的传播历程。

香港理工大学黄居仁教授回顾了三十年来中文语料库建设与应用的发展历程,指出语料库语言学已经与各种数据分析紧密结合,任何学科领域只要需要处理中文文本或以中文沟通交换的知识内容,就需要用到中文语料库语言学。

北京航空航天大学梁茂成教授基于深度学习模型,采用Doc2vec技术,对韩素音翻译大赛的一万多篇汉译英和英译汉译文进行自动评分,研究表明,自动评分具有较高的信度,可以有效辅助人工评分,极大地减少人工评分的工作量。

5-4_副本.jpg

本次会议设有6个分论坛,在一天半的会期内,与会代表将围绕语料库与跨学科研究这一中心议题展开热烈讨论,具体议题涉及语料库与语言研究、语料库与文学研究、语料库与翻译研究、语料库与社会科学研究、语料库与人工智能等。