[发明专利]一种自动生成基于地方方言的讯或询问笔录的方法在审
申请号: | 201810929477.6 | 申请日: | 2018-08-15 |
公开(公告)号: | CN109243460A | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 徐甲甲;费先江;盛马宝;廖志明 | 申请(专利权)人: | 浙江讯飞智能科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/22;G10L15/14;G10L15/06;G10L15/08 |
代理公司: | 杭州融方专利代理事务所(普通合伙) 33266 | 代理人: | 沈相权 |
地址: | 311201 浙江省杭州市萧山区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地方方言 自动生成 询问 模型训练模块 语音处理模块 语音识别模块 办事效率 | ||
本发明专利涉及一种讯或询问笔录的方法,尤其涉及一种自动生成基于地方方言的讯或询问笔录的方法。按以下步骤进行:前端语音处理模块→后端语音识别模块→模型训练模块。一种自动生成基于地方方言的讯或询问笔录的方法,进一步提高办事效率和准确性。
技术领域
本发明专利涉及一种讯或询问笔录的方法,尤其涉及一种自动生成基于地方方言的讯或询问笔录的方法。
背景技术
中国上下五千年,历史悠久,文化一脉相承,又地大物博,但是因为地域广阔所以各地也有各自的风俗习惯,同时也语言丰富多彩。
以杭州市萧山区为例,目前常住人口约150万人,随着萧山经济的迅猛发展,社会矛盾日益凸显,各类违法犯罪案件呈现逐年上升趋势。公安机关肩负的责任和承担的工作任务越来越重。多年来案多人少、办案力量不足,一直是基层比较突出的问题。办案力量不足,不仅影响本职工作的开展,还影响其他工作的有效发挥和齐头并进。如何提高工作效率以破解“案多人少”的难题,如何革新现有技术手段以简化工作人员办公过程,成为当前公安领域日益凸显的问题。公安民警在处理各种案件时都需要制作笔录,笔录是公安民警审讯过程中常用到的取证手段。目前很多地方的民警在制作笔录的时候普遍采用手写形式。由于传统手工笔录制作非常耗时,也容易存在字迹潦草、记录不完整、制作不规范等问题而严重影响笔录的质量和法律效力。采用语音识别技术(尤其是针对萧山方言的语音识别技术)实现交谈语音数据的实时自动内容识别,可以解放公安民警的双手,让公安民警专注案件的分析和侦查,方便警务人员迅速办理、审查案件,提高笔录制作的速度和效率。
发明内容
本发明主要是解决现有技术中存在的不足,提供建立一套针对日常交谈、能够将报案人或嫌疑人说的任意连续语音通过计算机自动转写为对应的文字系统的一种自动生成基于地方方言的讯或询问笔录的方法。
本发明的上述技术问题主要是通过下述技术方案得以解决的:
一种自动生成基于地方方言的讯或询问笔录的方法,按以下步骤进行:
(一)、前端语音处理模块:
针对输入的语音,首先使用基于能量及模型的VAD技术进行分段,再采用基于模型的聚类技术对原始语音中的人声、非语音、背景噪音相关现象进行自动判别及归类,再进一步针对不同说话人进行聚类,针对分割后的语音提取对语音识别有效的、对噪声鲁棒性较好的声学特征,同时为了消除不同说话人对识别效果的影响,首先会从特征域尽可能去除说话人的信息,主流的特征域处理方式包括VTLN、HLDA、特征域SAT相关技术,通过这些关键技术的加入,可以获得冗余信息更少、说话人信息被去除的声学特征,为后续的语音识别做好准备;
(二)、后端语音识别模块:
为了将各语音转写关键技术点进行更好的整合,并综合考虑识别效果和识别效率相关因素,在系统中将使用多编解码框架:首先使用简单声学模型和低阶语言模型,简单声学模型是指模型复杂度较小、未去除说话人信息;低阶语言模型是指三阶且模型复杂度较小;并结合WFST解码器进行一遍的快速解码,并生成对应的词图空间,该词图空间具有覆盖性好、结构紧致的特点;
接着,将绝大多数对性能提升的核心技术点放到二遍解码中,包括特征规整、区分性特征、模型区分性训练、模型自适应,并在二遍解码中相应使用更加复杂的声学模型和超大规模高阶语言模型,在词图空间中采用重新打分的方式输出二遍解码结果;虽然二遍解码融入了各关键技术点,且模型复杂度相对于一编解码提升很多,但是由于基于该词图空间的搜索范围小了很多,二遍解码的效率非常高;基于上述多编解码框架,不仅能将各转写技术点的性能提升发挥出来,在效率上还有巨大的优势;
置信度判决是后端语音识别系统中重要的后处理模块,针对识别结果中可能出现的错误通过词后验概率技术给出识别结果对应的可信度得分,对可信度低的识别结果进行智能拒识;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江讯飞智能科技有限公司,未经浙江讯飞智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810929477.6/2.html,转载请声明来源钻瓜专利网。