医学英语语料库构建研究

(整期优先)网络出版时间:2020-08-05
/ 2

医学英语语料库构建研究

1 罗晓雨 2 袁成

1 成都理工大学外国语学院 四川省成都市 610000

2西南科技大学生命科学与工程学院 四川省绵阳市 621000

摘要:在计算机辅助翻译学习中,语料库属于一种重要的工具,对于医学英语语料库而言,其能够在语音、语义等方面提供较好的辅助教学,对于促进专用英语教育等有着较大帮助。医学英语语料库的构建需要多项条件予以支持,本文则运用了Elan等软件进行了医学英语语料库的构建,涉及到软件的安装、语料的载入、语料标注等方面,以期为其他语料库的构建提供借鉴。

关键词:医学英语;语料库;构建

1引言

医学英语语料库是一个多级语料库,可以在计算机的帮助下真实,全面地反映语言。医学英语语料库以语音理论为基础,以语音活动为研究对象,以从原始数据中提取的信息和知识为手段,以模型为动力,包括语言,声音,图像和动作,整个语音活动,多媒体语料库。在检索技术的支持下,医学英语语料库真实地反映了语境中语音,语义和语用等语言的全貌,有利于推动基于自我发现的语言知识建设,提高学习者的多元性,阅读能力,自主学习能力,综合语言能力。

2 医学英语语料库构建的理论基础

2.1 系统功能语言学理论

从语言学角度来看,医学英语语料库用于多模式话语分析。尽管多模式话语分析借鉴了皮尔斯等人的符号学理论对三位一体的媒介,对象和解释的概念,但其主要的理论基础是哈里代伊创立的系统功能语言学[1]。系统功能语言学理论认为,语言具有社会符号学和潜在的意义,除语言以外的其他符号系统也丰富而重要。 因此,多模态话语就像只包含语言符号的话语一样,也是多功能的,即概念,人际和话语功能[2]。人们认为,情境因素与多模态话语的意义解释之间存在着密不可分的关系。

2.2 情景认知理论

情景认知理论认为,知识和活动是密不可分的,学习者获得知识,经验和技能以解决实际情况中的实际问题,从而不断建立自己的新知识体系。就是说,知识是情境化的,学习者可以在实际情况下获取和应用知识[4]。对于语言学习,上下文情景尤其重要。真实情境可以有效地促进语言识别和学习,这也是建立医学英语语料库以驱动语言学习的重要目的。

3 医学英语语料库的构建分析

3.1 语料的筛选标准

考虑到医学英语语料库的使用者主要是学相关专业教师和大学高年级医学专业本科生、研究生,依据医学英语的教学内容及学生们的学习基础与兴趣,在构建小型医学英语语料库的语料选择中除了根据语料库建库的基本原则(针对性、代表性和规模性)之外,又需要兼顾以下2个特点:

(1)全面性:在兼顾医学相关尽可能多的学科,比如生理学、病理学、生物学、解剖学、影像诊断学、医学伦理学等;

(2)适用性:医学语言实用地道,尽量考虑到跨文化交际的语言和文化内涵;

依照以上原则,共选取了总长约为120小时左右的英语视频和音频材料,构建医学英语语料库,其中美国知名大学的医学相关教学公开课约占40%,40%为医学题材的影视作品如《豪斯医生》、《扪心问诊》、《实习医生格蕾》、《嗜血法医》、《急诊室的故事》等,其他多模态语料约占总语料的20%,包括VOA健康报道、BBC科技中的部分纪录片等。

3.2 预料标注与检索

当前常用的医学英语语料库标注和检索软件主要包括MCA,Elan,DRS,ANVIL等。其中,Elan(EUDICO语言标注器)是由马克斯·普朗克心理语言研究所(荷兰奈梅亨)的Brigit Hellwig设计和开发的。该软件用于分析多模态话语研究,还可以应用于多媒体和医学英语语料库的构建。 因此,在医学英语语料库的构建中,使用了Elan软件来标记和检索医学英语语料库。

Elan中共划分了5种语言学类型,包括NONE层、Time Subpision层、Symbolie Subpision层、Included In层和Symbolic Association层。这样,可以根据语料库的应用范围灵活选择标注和检索方法,从而扩大了应用范围和可能性。

标注者可以在Elan中自定义不同类型的语料库单元进行标记,从而实现对特定符号的识别和标记,不仅提高了标记的效率和准确性,而且便于对语料库的标记信息进行管理。同时,语料库的用户也可以用更少的符号进行搜索,大大提高了搜索的便利性。

Elan可以导出扩展名为.eaf的批注文件,该扩展名包括视频剪辑和批注信息,并支持批注信息的多种显示方法,例如层显示,表显示,文本显示和字幕显示。也可以在播放期间随时显示。

3.3 基于Elan建设的医学英语语料库构建

3.3.1 Elan 软件的安装

登录Elan的官方网站,然后单击进入下载部分。根据计算机的不同操作系统,选择最新版本的Elan软件。 下载完成后,双击安装软件进行安装,选择要安装的路径,然后单击“下一步”进行安装。在使用该软件之前,建议下载ELAN语言标注器版本4.9.4手册,以阅读并熟悉Elan软件的详细使用情况。Elan 4.9.4的最新版本已由中国湖南师范大学国际华人文化学院的李斌教授进行了简体中文本地化。

3.3.2 在Elan中载入语料

安装并注册Elan软件后,激活主程序文件Elan.exe以运行该软件。主界面包括一个菜单栏,一个视频播放窗口和一个标注区域。菜单栏主要由文件,编辑,标注,层,类型,搜索和浏览(视图),选项(选项),窗口(Window),帮助(Help)和其他组件组成。 单击“文件”,然后使用下拉菜单中的“新建”功能来加载未标记的多模式语料库。 双击要加载的多模式文件,然后单击“确定”以完成多模式语料库的加载。

3.3.3 语料的分割及字幕转写

加载多模式语料库后,首先在“文件”(File)下拉菜单中单击“保存”(Save)以保存文件,然后将默认图层名称“默认”(Default)更改为“英语字幕”(English subtitles)。 然后在“选项”下拉菜单中单击“拆分模式”,在时间轴上单击ENTER标记多模式语料库,然后在“选项”下拉菜单中单击“传输模式”以将英语音译字幕。

3.3.4 语料标注

点击“选项”下拉菜单中的“标注模式”对多模态语料进行标注。本文根据医学英语语料库的教学应用设计,对多模态语料进行了词汇、音标、主题、情境等标注,如表1所示。

3.3.5 医学英语语料库检索与播放

标记医学英语语料库后,单击“搜索”进行搜索。 E1an的搜索功能更强大,它可以搜索单个或多个.eaf文件。 用户可以分析或分析不同级别的语料库。 对比。 Elan支持替换和多种形式的结果输出,以及正则表达式搜索,即,它可以检索单词的各种变形形式,并通过速度控制进行播放,暂停和播放。

结语

医学英语语料库在ESP教学和多模态话语分析领域具有重要的研究和应用价值。在ESP教学中,医学英语语料库可以为学生提供真实的语言资料和多种语境,实现教学新模式,对促进英语教学改革具有重要意义。本文结合语料库构建系统的功能语言理论,建构主义学习理论等理论,构建了医学英语语料库,对医学英语教学具有重要的帮助。

参考文献

  1. 宫武. 语料库在英语教学中的应用研究[J]. 淮南职业技术学院学报, 2019(4):57-58.

  2. 刘曦. 语料库驱动下的大学英语词汇自主学习模式构建初探[J]. 海外英语, 2019(15).

  3. 车宇玲. 独立学院中医护理行业英语语料库的建设意义研究[J]. 长江丛刊, 2018(1):102-102.

  4. 熊玲莹. 语料库在英语语言研究方面的应用[J]. 校园英语, 2017(4):217-217.

  5. 刘雪晴. 浅析语料库在高职英语词汇教学中的应用[J]. 校园英语, 2017(30):65-65.

1作者简介:罗晓雨,性别:女,籍贯:四川省德阳市,出生年月:1998年5月26日,身份证号:510625199805264021,院校:成都理工大学外国语学院,专业:翻译专业,学历:本科.

2作者简介:袁成,性别:女,出生年月:1997年5月8日,身份证号:510682199705084020,院校:西南科技大学生命科学与工程学院,专业:制药工程, 学历:本科.