语音识别的流程
树图思维导图提供 语音识别的流程 在线思维导图免费制作,点击“编辑”按钮,可对 语音识别的流程 进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:db9a91c8dbf737f2f5044f63d5c11567
语音识别的流程思维导图模板大纲
语音通常通过话筒输入计算机
话筒将声波转换为电压信号,然后通过A/D装置(如声卡)进行采样,从而将连续的电压信号转换为计算机能够处理的数字信号
目前多媒体计算机已经非常普及,声卡、音箱、话筒等已是个人计算机的基本设备
其中声卡是计算机对语音信进行加工的重要部件,它具有对信号滤波、放大、A/D和D/A转换等功能
而且,现代操作系统都附带录音软件,通过它可以驱动声卡采集语音信号并保存为语音文件。
语音信号号在采集后首先要进行滤波、A/D变换,预加重(Preemphasis)和端点检测等预处理,然后才能进入识别、合成、增强等实际应用。
滤波的目的
一是抑制输入信号中频率超出//2的所有分量(/:为采样频率),以防止混叠干扰
二是抑制50Hz的电源工频干扰。因此,滤波器应该是一个带通滤波器。
A/D变换是将语音模拟信号转换为数字信号。A/D变换中要对信号进行量化,量化后的信号值与原信号值之间的差值为量化误差,又称为量化噪声。
预加重处理的目的是提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱,便于频谱分析。
人说话的频率在10kHz以下
根据香农采样定理,为了使语音信号的采样数据中包含所需单词的信息,计算机的采样频率应是需要记录的语音信号中包含的最高语音频率的两倍以上。
一般将信号分割成若干块,信号的每个块称为帧,为了保证可能落在帧边缘的重要信息不会丢失,应该使帧有重叠。例如,当使用20kH*的采样麵率时,标准的一帧为10ms,包含200个采样值。
话筒等语音输入设备可以采集到声波波形
虽然这些声音的波形包含了所需单词的信息,但用肉眼观察这些波形却得不到多少信息因此,需要从采样数据中抽取那些能够帮助辨别单词的特征信息。在语音识别中,常用线性预测编码技术抽取语音特征。
经过向量量化的特征向量也可以作为后面隐马尔可夫模型中的输入观察符号。
在标量量化中整个动态范围被分成若干个小区间,每个小区间有一个代表值,对于一个输入的标量信号,量化时落入小区间的值就用这个代表值>[戈替。因为这时的信号量是一维的标量,所以称为标量量化。
模板(template)匹配法
随机模型法
概率语法分析法
树图思维导图提供 904名中国成年人第三磨牙相关知识、态度、行为和病史的横断面调查 在线思维导图免费制作,点击“编辑”按钮,可对 904名中国成年人第三磨牙相关知识、态度、行为和病史的横断面调查 进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:10b9a8a2dd2fb4593f8130ef16c320fc
树图思维导图提供 第1章 化工设计基本知识 在线思维导图免费制作,点击“编辑”按钮,可对 第1章 化工设计基本知识 进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:70ec0519ed26419068a32a511862aadd