充分了解大学校园教育中关于语言学概论的内容(信息科学和语言信息处理能力),记住关键知识点。
树图思维导图提供 信息科学和语言信息处理能力思维导图 在线思维导图免费制作,点击“编辑”按钮,可对 信息科学和语言信息处理能力思维导图 进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:3d3c039ee2882e9a4b2f9099c8134236
信息科学和语言信息处理能力思维导图模板大纲
语言信息处理
计算机可以传送、接收,甚至理解、表达自然语言的各种信息,这就是“语言信息处理”
语言学与计算机信息处理的关系
语言学知识可以用于信息处理技术
信息处理技术需要语言学知识
哪些计算机信息处理技术需要语言学知识
基于经验的信息处理研究,与此相关的语言学研究就叫做语料库语言学或工程语言学
基于规则的信息处理研究,与此相关的语言学研究就是一般说的形式语言学或计算语言学
分辨汉字信息处理的基本技术
汉字编码有两个任务
一是要给每个汉字确定一个机器代码(也称内码),这样计算机通过内码就能检索和输出汉字
二是要给每个汉字确定一个跟内码相关联的输入代码(也称外码)
说明汉字信息处理中应用的语言学知识
无论是编制汉字内码还是外码,都是在语言学知识的基础上实现的
语音信息处理
是人机交互的重要组成部分,语音信息处理技术包括语音实验、语音识别和语音合成等技术
主要的语音信息处理技术:语音实验、语音识别、语音合成
语音实验:是指用各种仪器做实验来研究人的发音机制、语音的物理传播机制及语音听觉过程
语音识别:就是让计算机模拟人的听觉器官的反应来接受语言信号并做出回应动作或给以语言答复,简单地说就是让计算机听懂人说话
语音合成:是一种通过机械的、电子的方法产生语音的技术,这种技术就是让计算机模拟人的发音器官发出类似人发出的语音
判断哪些设备应用了语音信息处理技术
语音拨号,语音导航,室内设备控制等等
语料库
按照一定条件存储在计算机中的大规模语言材料就是语料库
分辨不同的语料库
语料库可以从不同的角度进行分类
加工文本语料库
加工文本语料库:是指标注了一定附加信息的语料库
计算机给真实语料自动分词的困难
是语料中有大量人名、地名、书名、公司名等词库里没有的专有名词
是语料中会不断出现词库里没有的新的词语
是汉语中字与字是连续出现的,词与词中间没有空格,所以就可能出现大量的“交集型歧义字段”
机器自动翻译
机器自动翻译是指通过计算机把一种语言自动翻译成另外一种或多种自然语言的信息处理技术
机器自动翻译的类别
按自动化程度的不同,可分为自动机器翻译和辅助机器翻译
根据处理对象的不同,可分为文本翻译和语音翻译
根据处理技术基础的不同,可分为基于规则的机器翻译、基于统计的机器翻译和基于实例的机器翻译
机器自动翻译的四个层级
语汇平面的翻译
句法平面的翻译
语义平面的翻译
语境平面的翻译
树图思维导图提供 生命科学和人的语言能力思维导图 在线思维导图免费制作,点击“编辑”按钮,可对 生命科学和人的语言能力思维导图 进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:49b03adf7b6222a94bb4530820df7c38
树图思维导图提供 语言学的应用价值思维导图 在线思维导图免费制作,点击“编辑”按钮,可对 语言学的应用价值思维导图 进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:dc17efa6fbc439810e37301fbc199b3f