[发明专利]一种用户语言评估方法及系统在审
申请号: | 201810036799.8 | 申请日: | 2018-01-15 |
公开(公告)号: | CN108257615A | 公开(公告)日: | 2018-07-06 |
发明(设计)人: | 蔡森川;杜娟;何嘉斌;顾嘉唯 | 申请(专利权)人: | 北京物灵智能科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G06K9/46;G06F17/30 |
代理公司: | 北京市天玺沐泽专利代理事务所(普通合伙) 11532 | 代理人: | 谢鑫 |
地址: | 100102 北京市朝阳区望京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 跟读 评估 目标文本 用户语言 文本 接收用户 用户学习 语言学习 播放 复读 采集 申请 语言 | ||
1.一种用户语言评估方法,其特征在于,包括:
识别当前文本是否为目标文本;
当识别当前文本为目标文本时,则接收用户的跟读操作;
确定执行跟读操作对应的待播放的第一跟读音频;
播放第一跟读音频;
采集用户根据所述第一跟读音频复读的第二跟读音频;
对用户的第二跟读音频进行评估。
2.如权利要求1所述的方法,其特征在于,识别当前文本是否为目标文本,具体包括:
获取当前文本图像;
提取所述当前文本图像的图像特征;
在预先存储的图像特征数据库中查找是否存在所提取的图像特征;
若是,则识别当前文本为目标文本;
若否,则识别当前文本为非目标文本。
3.如权利要求2所述的方法,其特征在于,提取当前文本图像的图像特征,具体包括:
通过卷积神经网络算法提取当前文本图像的图像特征;或
通过循环神经网络算法提取当前文本图像的图像特征;或
通过尺度不变特征变化算法提取当前文本图像的图像特征。
4.如权利要求1所述的方法,其特征在于,确定执行跟读操作对应的待播放的第一跟读音频,具体包括:
获取目标文本中的待读文本页图像;
提取所述待读文本页图像的图像特征;
根据所述待读文本页图像的图像特征,在页码特征数据库中,确定所述待读文本页对应的页码;
根据所述待读文本页对应的页码,在语句标记文本数据库中,确定所述页码对应的语句标记文本;
根据所述页码以及所述页码对应的语句标记文本,获取第一跟读音频;
将所获取的第一跟读音频确定为执行跟读操作对应的待播放的第一跟读音频。
5.如权利要求4所述的方法,其特征在于,对用户的第二跟读音频进行评估,具体包括:
依次提取用户的第二跟读音频中的各单词音频;
按提取单词音频的顺序针对每个单词音频,依次提取该单词音频中的各音素音频;
按提取音素音频的顺序针对每个音素音频,确定该音素音频对应的标准音素音频,并将该音素音频与标准音素音频进行对比,确定该音素音频的第一分数值;
针对任一单词音频,将该单词音频所包含的所有音素音频的第一分数值之和作为该单词音频的第二分数值;
将所述用户的第二跟读音频所包含的所有单词音频的第二份数值之和作为所述用户的第二跟读音频的评估值;
根据所述用户的第二跟读音频的评估值,对用户的第二跟读音频进行评估。
6.如权利要求5所述的方法,其特征在于,确定该音素音频对应的标准音素音频,具体包括:
根据包含该音素音频的单词音频的提取顺序,在所述语句标记文本中提取单词音频对应的单词;
根据该音素音频的提取顺序,在所提取的单词音频对应的单词中提取该音素音频对应的单词音标;
根据所提取该音素音频对应的单词音标,在标准音素音频数据库中,确定所述单词音标对应的标准音素音频。
7.如权利要求5所述的方法,其特征在于,根据所述用户的第二跟读音频的评估值,对用户的第二跟读音频进行评估,具体包括:
判断所述用户的第二跟读音频的评估值是否超过预设的阈值;
若是,则所述用户的第二跟读音频合格,并提示用户;
若否,则所述用户的第二跟读音频未合格,并重复播放所述第二跟读音频。
8.一种用户语言评估系统,其特征在于,包括:
中央处理器,用于识别当前文本是否为目标文本;
图像反馈装置,用于当中央处理器识别当前文本为目标文本时,则接收用户的跟读操作;
中央处理器,用于确定执行跟读操作对应的待播放的第一跟读音频;
扬声器,用于播放第一跟读音频;
麦克风,用于采集用户根据所述第一跟读音频复读的第二跟读音频;
云端服务器,用于对用户的第二跟读音频进行评估。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京物灵智能科技有限公司,未经北京物灵智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810036799.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:音频数据标注的方法及其系统
- 下一篇:一种噪声场景识别系统及方法