TreeMind树图在线AI思维导图
当前位置:树图思维导图模板行业/职业模板其他视频笔记ASR标注项目操作手册思维导图

视频笔记ASR标注项目操作手册思维导图

  收藏
  分享
免费下载
免费使用文件
U179909976 浏览量:802024-10-13 12:39:41
已被使用10次
查看详情视频笔记ASR标注项目操作手册思维导图

验收方式,标注工具,规则流程等内容讲解

树图思维导图提供 视频笔记ASR标注项目操作手册 在线思维导图免费制作,点击“编辑”按钮,可对 视频笔记ASR标注项目操作手册  进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:fb9fcc2b084edb57fd91bee4290932c8

思维导图大纲

视频笔记ASR标注项目操作手册思维导图模板大纲

标注规则流程

待标注音频数据由声音和噪音组成。我们需要做的事情是把声音和噪音区分开,然后给声音配上对应的文本,体现到项目的落地动作即为:使用软件工具在音频框中标记声音的起始点,然后在文本框中遵循

1、确认音频中是否有可标注段落

一条音频可标多段文本标注区域。

音频出现区域

首先听完整条

2、拉取ASR可标注区域

ASR标注区域由

静音区的作用:静音区在文本标注区域内,在文本标注区域开头与结尾部分起留白作用,保证后续音频处理、播放时声音波形的完整。

注意事项:

文本标注区域时长注意事项:

图片示例:

3、进行ASR文本标注

中文标注不能出现繁体字,一律使用简体字进行标注。(除非强行要求写繁体字)

字音一一对应,不要少标或多标(音字对应原则)

例:

文本标注必须同时满足:

需要将标注区域内主要发声者说的所有字词标注出来,包括重复词、语气词;即标注所有可以听到的一些特殊的音的标注规则另作讨论(见下方“特殊音的标注”)。

歌词无论原唱翻唱,都需要查找对yu应歌曲的歌词进行标注。(忘词、错词除外)齐声合唱

类型

发音

重复

wo wo wo wo

我我我我

我我我

结巴

na zen zen me yang

那怎怎么样

那怎么样

带口音

ber ber shuang

倍儿倍儿爽

倍倍儿爽

标注中可使用的标点符号为:

注意:如果预识别文本找不到,再用听歌识曲识别一下,如果再找不到则不标注)

(注意:若前后都是英文时,数字转成英文单词;前后都是中文时,数字转成中文。仅是针对于歌曲出现的情况, 其他情况还是按实际发音来)

每个英文单词前后一定要有空格

当发音人念英文字母时,每个字母也要作为一个单词前后有空格。

特殊情况:

英文字母一律采用大写 按日常书写习惯即可,该大写大写,该小写小写

英文标注规则:

数字标注规则:

语气词标注,只允许使用以下的字库:

- 啊【a】、

- 吧【ba】、哒【da】、嘎【ga】、哈【ha】、咔【ka】、咵【kua】

- 啦【la】、哇【wa】、呀【ya】

- 吗(?)【ma】、嘛(。)【ma】、哪(?)【na】、呐(。)【na】

- 嗯【en】、咯【ge】、呵【he】、嘞【le】、呢【ne】

- 哩【li】、咝【si】、咦【yi】、啵【bo】、呼【hu】、呜【wu】、嘘【xu】

- 呗【bei】、咚【dong】、咳【hai】、嘿【hei】

- 唻【lai】、嘞【lei】、咧【lie】、啰【luo】、咯【lo】、喽【lou】

- 呶【nao】、喏【nuo】、吆【yao】、呦【you】、哟【yo】、耶【ye】

- 唉呦【ai you】、唉哟【ai yo】、唉呀【ai ya】、诶呀【ei ya】

- 嗯呐【en na】、哇噻【wa sai】、哦豁【o ho】

(如有其他要用到的语气词没有记录在这里,请告知项目负责人,不要擅自标注)

当发现不可避免的笑声(句中或句尾),如果笑音可标且没有跟发声者的声音重叠可直接标注出来。可标笑音仅限三种:哈哈、呵呵、嘿嘿。除此之外的笑声可忽略。(数不出多少个哈字,就放弃标注,不截进去)

例子

标注结果

你这人(可标笑声)真逗!

你这人,呵呵呵,真逗!

话是不该这么说的吧(不可标笑声)。

话是不该这么说的吧。

如果发声者说话的发音不太准,但标注员能理解到实际语义。在

例子

标注结果

妈的好。

骂得好。

请少二维码。

请扫二维码。

对某个人物或品牌,如果知道正确的写法,请根据正确写法进行标注。但如果实在不知道正确写法,也可根据听出来的中文读音直接标注。咕卡;蛋仔派对;找蛋搭子;叶罗丽;

特殊声音的标注:

部分口语、特殊发音的标注:

拼音无需标注

(例:

二、标注工具

进入标注口令

2、标注界面介绍

生成、播放切片与文本标注

播放快捷键:Tab

按住鼠标左键向右框选,到合适的地方放开左键,即可生成新文本框;

或者移动预识别切片框左右的线段,移动至合适的位置即可。

切片框左上角的数字,与下方的文本区域的编号对应,点击文本框,即可对文本内容进行编辑。

点击文本区域的编号,也可以播放对应切片框的音频。

当实线在切片框内时,若要新增一个切片框,必须鼠标左键按住红色三角标,然后向右移动;若实线在切片框外,则选中任意位置向右,都可以拉取切片框;

移动实线,按TAB键可以对实线后的内容进行播放;播放时,也可以随意点击该切片框内的任意位置,切换播放起始点;

当实线在切片框外,此时你点击切片框一次,默认实线定位到切片框的开头,此时若点击tab键进行播放,默认完整播放该切片框的音频;若要将实线移动到切片框的其他位置,需要再次点击,此时也是默认从实线,播放到切片末尾;

点击切片框右上角的×,即可删除切片框;或者点击切片对应的文本框后面的X,也可以删除切片;

4、完成标注

SHIFT+S保存,然后点击提交

标注SOP

写在前面:在执行标注SOP前,要先确保能完全理解播放快捷键,实线与虚线分别在不同位置时,点击tab键,对切片的播放方式均不相同;

1)首先拿到音频后,点击tab键,从头开始播放。

2)播放到第一个切片结束,若句意未结束,可以适当延长播放。本次播放确认两个关键点--断句的地方、错别字;

3)快速点击音波区,修改实线位置,配合tab键重新确认切片起止地方的静音区是否符合要求;

4)继续播放下一个切片,重复上述动作;

三、验收方式

1、验收标准

字准确率 98%+(标注区域内正确的字所占的比例):将使用脚本校对质检前和质检后的文本,得出字准确率。

验收计算单位:按有效秒

若整句需要调整前后VAD线段,则认定为整句所有字都错误,计入字错数量中;

2、验收方式

按有效时长验收

3、质检比例

人员培训期和适应期间可以按天交付数据。

阶段描述

质检比例

试标适应期

随机抽检看共性

爬坡期1

按人员抽检看个人

爬坡期2

50%

成熟期1

20%

成熟期2

10%

T+2反馈质检明细,至多T+3

相关思维导图模板

第1章	化工设计基本知识思维导图

树图思维导图提供 第1章 化工设计基本知识 在线思维导图免费制作,点击“编辑”按钮,可对 第1章 化工设计基本知识  进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:70ec0519ed26419068a32a511862aadd

《数字教育平台开发项目策划》思维导图

树图思维导图提供 《数字教育平台开发项目策划》 在线思维导图免费制作,点击“编辑”按钮,可对 《数字教育平台开发项目策划》  进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:d6437326e3e07ecf1e5e178ba84d0100