2022年春季计算机辅助翻译的简单介绍
树图思维导图提供 2022年春季学期计算机辅助翻译思维导图 在线思维导图免费制作,点击“编辑”按钮,可对 2022年春季学期计算机辅助翻译思维导图 进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:9f722d0e7a16b3e459b1ce1c449f2bad
2022年春季学期计算机辅助翻译思维导图模板大纲
信息意识
所谓信息意识,简单地说,是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、选择能力和消化吸收能力。有无信息意识决定着人们捕捉、判断和利用信息的自觉程度。而信息意识的强烈与否对能否挖掘出有价值的信息、对文献获取能力的提高起着关键的作用。
信息意识含有信息认知、信息情感和信息行为倾向三个层面。信息认知是指对信息和信息活动的了解和看法,其中最重要的是评价性的认知;信息情感是指人们多次从多方面感受信息的过程中,逐渐形成的某种持久、稳定的、反映本质的需求关系的内心体验,这种体验相对持久、相对稳定,而不是那种即时产生的情绪;信息行为倾向是指个人在信息活动中欲表现出来的行为趋向,是信息行为的心理准备状态。
信息意识形式有两种:一是被动接受状态,二是自觉活跃状态。前者指人们从社会的信息环境中被动地接受事先未料及的信息;后者指信息意识的觉醒状态,它促使人们制订信息活动计划,主动关心和了解各种变化,并作出相应的选择。
人们的信息搜集活动是受信息需求驱使的,影响需求的力量的大小主要就是需求被意识的清晰程度——意识越明确,行动目标越清楚,则信息活动的动机越稳定、持久、强烈,努力程度也就越高。因此,信息意识的强弱直接影响人们的信息需求程度。
搜索意识
本质上是一中学习行为,搜索意识实际上为了学习获得新的信息而执行搜索行动的内在驱动力
翻译搜索意识
翻译搜索意识对应的是面向翻译问题时为解决问题而执行搜索动作的内在驱动力,对搜索者也提出了更高的要求,不仅包含单语信息搜索,还包括双语信息搜索、多语信息搜索;不仅涉及国内搜索引擎工具的应用,还涉及国外搜索引擎和专业语料库等工具的应用;目标不仅仅是获取信息,还需要在获得信息后结合翻译问题综合分析。
搜索方法
搜索图书
基于语料库的搜索
公开数据搜索
基于思维导图和PDF的本地数据库资源搜索
总结
时间关系,上面这些方法不能完全展示完,受限于每个人的电脑操作系统和软件使用习惯,有许多软件的功能大家无法亲自使用,但从长远来看,译者需要把搜索技能作为自己的一项核心技能来训练,在不断的应用中形成较强的搜索意识
我们身边的搜索
微信的搜索怎样使用
搜索无处不在
谷歌高级检索技巧
Site
site:用于检索特定网站中的内容,比如:
仅搜索北语的网站的信息:site:blcu.edu.cn
仅搜索教育类网站:site:edu
不搜索北大的网站: 高级翻译学院 -site:pku.edu.cn
注意事项:
1.冒号是英文的冒号
2.冒号后面没有空格
Filetype:
filetype:用于检索某种特定文件类型的文件能搜索xls、ppt、doc结尾的的Office文件能搜索pdf文件能搜索swf文件
注意事项:
1.冒号是英文的冒号
2.冒号后面没有空格
图片翻译
减号
排除包含某些特定词的页面来精炼搜索结果。当搜索结果中含有大量非搜索意图的结果时使用。
英文双引号
搜索特定词组,结果更家精确
诱导词
概念
分类
语言维度
源语诱导词
目标语诱导词
关系维度
使用原文中某个词或某几个词的译文作为诱导词
与原文内容的知识背景有关系
使用与直接检索词有相同词根,词形,来源等
使用原文中某个词的同义词为诱导词
扩展诱导词,直接检索词的语义放大或缩小后,与其有关的的词
使用建议
谷歌的其他技巧搜索
在熟练掌握谷歌高级检索技巧并应用于翻译实践之前,每道位译者都应当知道谷歌究竟有哪些常用的高级检索技巧。请每位译者自行到谷歌上搜索除site:、filetype:、inurl:外,还有哪些常用的高级检索符。
参考网址:
如何在Google中进行搜索:https://support.google.com/uebsearch/answer/13449?hl=zh-HansGoogle搜索运算符:https://support.google.com/websearch/answer/466433?hl=zh-Hans如何过滤搜索结果:https://support.google.com/websearch/answer/%243?hl=zh-Hans
如何使用Goagle的高级搜索页面:https://support.google.com/websearch/answer/5890?hl=zh-Hans
暗网搜索
如何快速搜素、
搜索引擎并非唯一地方
其他非主流搜索技巧
语料库
善用网络爬虫
平行语料库和翻译记忆库
对三个CAT工具的初步使用体验进行简短交流·源文本是一份政策性文件,
其中我个人偏好飞译的翻译,译文方面,以下就两段文字简要对比分析。Yicat的主要问题有四点,功能按钮虽然丰富但是对新手不够友好,导出英文的默认字体不够美观,有整句的漏翻,文体不够正式,多使用人称代词their和must而非shall,句段的切分不够准确
Smartcat的界面的颜色非常好看,编辑界面也充分利用了屏幕空间,但问题有两点,一是导出默认英文字体用的是宋体不够美观二是翻译过于僵硬,比如连用多个shallnot;相比之下,飞译的翻译一方面导出的英文字体为TimesNew
Roman相对美观,另一方面没有冗长的表述,译文篇幅得当,虽然有一处漏掉了一个单词的翻译,但整体瑕不掩瑜。
核心功能
首页
登录
上传数据
选择语言
上传示例
审核数据
删除文件
审核意见
发布数据
查询数据
下载数据
数据查错
数据查重
编辑数据
语言门户
管理团队
成果展示
公开权限
安装
配置环境
下载
安装
术语的涵义
含义一:表示专业术语工作的实践和方法。
例:请阅读一本与“人工神经网络”的教材,并收集、描述和表示这本教材中出现的术语。可形象为:请制作一份《人工神经网络术语表》,术语表的底层为XML,表层为Excel表格,术语表中包含多个字段,含原文、译文、定义等。
含义二:表示研究专业术语的理论。
例:假设看完上述教材后收集到1500条术语,请撰写收集术语的原则,定义术语的原则,所有术语涉及的概念体系,每条术语与对应概念的关系。可形象化为:请制作一份《人工神经网络术语表工作指南》,详细描述该术语表的制作理论依据,其中包含术语表底层XML文件对应的DTD文件。
含义三:表示某个领域中专业词汇的总体。
例:上述教材是由“词汇”组成的,词汇包括普通词汇和专业词汇,由专业词汇组成的集合即是“人工神经网络”领域专业概念的语言表达。可形象化为:请制作一份《人工神经网络词汇表》,包含所有的专业词汇,仅含所有词汇原文。
概念
世界万物(thing)之间有所区分(difference),是因为本质(essence)不同。决定本质的是“属性”(attribute)。
世界万物(thing)可以分为不同的类(category/class),有的属性是某类事物必有的,是能够将这类事物与其他事物区分开的特有属性。
而有些属性,则是部分类的成员具有的偶有属性。
概念仅反映事物的特有属性,不反映事物的偶有属性。
可以形象化为:
1)属性=特有属性+偶有属性
2)因为概念仅反映事物的特有属性,所以将“特有属性”从“属性”中抽取出来,删去所有的偶有属性之后,就形成了“概念” (概念具有“抽象性” (Abstraction))
术语
来源
用于指代常识概念的词汇单位一开始叫做原始术语
随着人们对概念的理解不断深入,原始术语转化为稳定的准术语,并最终称为术语
术语是通过语音或文字来表达或限定专业概念的约定性符号,可以是词,也可以是词组
理论上,一个概念对应一个术语,如果一个概念对应多个术语的话,就会产生术语的同义现象,属于标准化就要解决这种现象
术语管理
术语系统从无到有,不断变得复杂和庞大。术语系统也并非一成不变,随着时代的发展和科技的进步,术语也会发生变化,因此术语系统中术语增删减不可避免。
传统的术语管理方式是借助手工制作的卡片,不利于存储和查询。
1963年在卢森堡建立了世界上第一个术语数据库,采用计算机来存储术语,便于术语的存储、编辑和检索。
不同国家和机构都在建立自己的术语数据库,数据库之间如何交换和共享数据?于是逐渐有带头大哥出来制定规范和标准。
知识工程
人看到“术语”时,眼睛看到的是“文字”,大脑里浮现出来的是“概念”。计算机无法做到“输入文字并获得概念”,计算机处理的均是“数据”。我们可以把“含义三”中的词汇表放到一个txt文件里输入给计算机,也可以把“含义二”中的xml术语库输入到计算机,也可以把“含义三”中的dtd文件输入到计算机。“含义三”中包含的各种“概念”就是“知识”,把知识告诉计算机,计算机就会更加“智能”。
计算术语学
1998年世界上第一次计算术语学举办,讨论了以下议题:
1.如何抽取术语以满足信息检索的需要;
2.如何抽取术语以便使用双语语料库来进行翻译;
3.如何进一步完善原有术语抽取的工作(例如,如何建立概念层级网络,如何搜索语义信息或概念信息)
思考:你们觉得计算机怎么来处理这些问题?
例:给你一段话,如何判断其中的某个短语是“术语”(新词)
例:给你一句话,如何找出所有的“词组型术语”
引申
如果这个片段左右的搭配丰富,并且片段内部分搭配很固定,则认为这是一个词,将这样的片段筛选出来,按照频率由高到低,排在前面的那写即为词语,如果文本够大,再通过词典过滤旧词,可以得到新词
互信息
互信息体现了两个变量之间的相互依赖程度。二元互信息是指两个事件相关性的量
互信息值越高,表明X和Y相关性越高,则X和Y组成短语的可能性越大;反之,互信息值越低,X和Y之间相关性越低,则X和Y之间存在短语边界的可能性越大。
公式中的X和Y指的是两个相邻的单词,P值是它的出现概率。
信息嫡
信息嫡:描述随机变量的不确定性
知识本体
人看到“术语”时,眼睛看到的是“文字”,大脑里浮现出来的是“概念”。计算机无法做到“输入文字并获得概念”,计算机处理的均是“数据”。我们可以把“含义三”中的词汇表放到一个txt文件里输入给计算机,也可以把“含义二”中的xml术语库输入到计算机,也可以把“含义三”中的dtd文件输入到计算机。
能会又三”中包合的各种“概合”就是“知识”,把知识告诉计算机,计算机就会更加“智
想象一辆车,及构成这辆车的所有组件,并且将所有组件都用术语表示出来,在有关系的组件之间用线条来描绘……
由于术语指代的是概念,概念之间组合成为概念系统。上面这个例子中所有组件对应的术语之间形成的概念系统源自于实际的一辆真正的车,所以这种概念之间的关系叫做“知识本体关系”。
On=bcing onta=bcings logos=学问
知识本体的作用
在这里举一个用知识本体来解决句子歧义问题的例子:
原文:
I saw a star with a telescope.
请思考:人是怎么理解这个句子的,如何让计算机也能这样理解句子?
知识本体
既然我们能够把一辆车抽象为一种知识本体,或者一个互相之间有关联的概念的集合,或者一个互相之间有关联的术语的集合,那么就可以把更多的事物描述成这种术语的集合。然后把这个集合全部都输入到电脑里,让电脑记住构成这个世界的所有事物的属性……
1991年,美国计算机专家R.Niches认为:智能系统分为两个部分:知识本体+问题求解方法知识本体:特定知识领域共有的知识和知识结构
问题求解方法:在相应知识领域进行推理
是不是很像编程里学到的:一个对象有很多属性,用函数可以去操控这些属性,让对象动起来、活起来、智能起来!
树图思维导图提供 鄂尔多斯市校园安全网格化管理清单 在线思维导图免费制作,点击“编辑”按钮,可对 鄂尔多斯市校园安全网格化管理清单 进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:b0ff1d16fc853ad7fd07941a4952693d
树图思维导图提供 计算机辅助电子线路设计 在线思维导图免费制作,点击“编辑”按钮,可对 计算机辅助电子线路设计 进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:6ca7534122e478b7cd1b28b3c72601e8