计算机辅助翻译 计算机辅助翻译 现阶段翻译的问题:完全的机器翻译还满足不了信息沟通、文化交流的需要,完全的人工翻译速度太慢 解决方案:计算机辅助翻译 优点: 帮助译者优质、高效地完成翻译工作。 第三节 翻译和语料库 语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。 目前,语料库已经成为语言学理论研究、应用研究和语言工程不可缺少的基础资源。 3.1. 语料库类型 特殊语料库 普通语料库 比较语料库 平行语料库 学习者语料库 教学语料库 历史语料库 语料语种分类 单语语料库 双语语料库 多语语料库 3.2. 语料库对翻译技术的影响 术语研究 词典编纂 搭配词典编纂 翻译辅助和翻译软件研发 3.3. 语料分析工具 借助电子文集的附加或者各种标识对复杂的语言现象进行大规模数据搜集。 语言学研究中,语料库主要用来为统计语言模型提供语言特征信息和概率数据,在语言研究的其他领域,多使用语料检索和频率统计结果 语料库分析工具可以提供一系列服务 3.3. 语料分析工具 3.3.1字频、词频列表 语料分析工具能对具体的字词频率进行统计比较,对字词的差别进行计量分析。使用者可以通过这些分析工具来检索语料库中一共有多少个没有重复出现的词——类符、每个词出现的频率是多少——形符。 词频表操作方式 1:不同顺序来排列 2:根据词在语料库中的出现的顺序排列 3:根据字母顺序排列 4:根据出现频率的次数排列。 这些顺序可以是从小到大排列,也可以从大到小排列,极为灵活。 其他功能 除了词频统计,计算机分析工具还可以帮助我们 统计类符形符比 计算出语料库中的句子和段落的总数 计算出语料库中词、句、段的平均长度,从而帮助译者确定语料库中所收文章的文体特点。 3.3.2. 语料检索 语料检索软件——相关集列系统 语料检索软件主要应用于语言学习、文献分析、语料库语言学、术语学和词汇学等方面。 3.3.2.1. 单语检索 1:键入需要查询的词或词组 2:检索软件在相关文档中显示出它们所在的位置。 词节(关键词)——被检索词 检索行——显示这些关键词的句行 在检索过程中,被检索词一般会在屏幕上高亮显示,并且置中。在计算机辅助翻译中,这种检索显示称为“上下文关键词”,经常用KWIC来代替 软件:WordSmith、MConcord等 通配符检索 通配符——一个可以在检索时代替其他字符的符号。例如 “?”、“*”等符号,一般来说,用“?”代替任何一个字符,用“*”代替任何字符或者字符串。 例如: 输入“ho?se”来进行搜索,可以产生 “house”和“horse”等多个词。 3.3.2.2. 双语检索 语料库在翻译中的运用主要通过双语检索途径实现。 如果要使用双语检索功能,就需要建立一个双语平行语料库来支持它,最好对语料库里的文本预先进行排列。 文本自动对齐是建立双语语料库的关键技术。自动对齐工具最基本的处理方法是:把原文的第一个句子和译文的第一个句子加以排列,原文的第二句与译文的第二句加以排列,以此类推。 自动对齐常见问题举例 英文句子的句尾符号是“.” 很多词的词尾也会出现“.”号。常见的有“Mr.”、“Mrs.”等词 汉语的问题——汉语语句简短、干练,往往一个英语句子,会被翻译成两个或者更多的汉语句子。这些都不可避免地为原文和译文自动对齐带来困难。 图6 使用WordCruncher创建的英汉平行语料库 4.1. 术语管理系统的作用 能够帮助译者解决很多翻译问题,可以帮助存储、检索并且更新术语库,给译者提供一个完整的术语规范,从而保证译文中术语的一致性和翻译的质量。 用户一次性建立一个或多个标准术语列表(表中包括术语原文和译文) 在使用术语管理系统进行翻译时,打开术语管理工具中相应的术语列表,系统就会自动识别出当前句子中有哪些词是已定义的术语,并给出标准的术语译文,省掉了校对的麻烦。 4.2.创建新的术语库 术语库多由政府、公司、语言学协会等组织来创建。 最知名的术语库是 EURODICAUTUM,——12种语言,91个领域。 通讯领域内最重要的术语库是“ACRoTERMITE”,包含阿拉伯语、汉语、英语、法语、俄语和西班牙语等6种语言。 用在本地化等行业的商用术语库Multiterm、Translation Star、TranslationManager和SDLX等。 4.3. 术语检索 术语经过存储之后,使用者就需要检索这些经过存储的术语信息。 一些术语管理系统允许通配符和截词检索。搜索引擎最常用的通配符有星号(*)和问号(?)等,(
本文地址:http://nhjcxspj.xhstdz.com/news/770.html
物流园资讯网 http://nhjcxspj.xhstdz.com/ , 查看更多