[发明专利]识别文本展示方法及装置有效
申请号: | 201810330612.5 | 申请日: | 2018-04-13 |
公开(公告)号: | CN108536654B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 胡尹 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/106;G06F40/109 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 文本 展示 方法 装置 | ||
本发明实施例提供一种识别文本展示方法及装置,属于语音识别和自然语言处理技术领域。方法包括:获取识别文本中每一分词的分类特征;将每一分词的分类特征输入至分类模型,输出每一分词的分类标记,分类标记用于表示分词在识别文本中的重要程度和/或在识别文本中的异常情况;根据每一分词的分类标记,确定每一分词的展示方式,并基于每一分词的展示方式对识别文本中每一分词进行展示。由于在展示识别文本中文本内容的同时,还可以通过展示方式来体现分词在识别文本中的重要程度和/或在识别文本中的异常情况,从而承载发言人发言时的情感色彩和/或发言时的语义。因此,满足了发言人个性化展示其发言的需求。
技术领域
本发明实施例涉及语音识别和自然语言处理技术领域,更具体地,涉及一种识别文本展示方法及装置。
背景技术
近年来,随着语音技术的飞速发展,语音识别技术凭借其智能、高效和人性化的优势,被广泛应用于生产、生活的各个领域,越来越受到大众的欢迎。
目前的语音识别技术,其目标是将语音数据转换为文本进行展示,一般通篇采用同一种格式,形式显得单一刻板。通过现有技术获取的识别文本,仅通过固定的展现形式,无法直观地为用户展现语音数据的关键信息,缺乏针对语音数据的个性化展示形式。因此,如何对识别文本进行个性化展示,仍是目前业界亟待解决的课题。
发明内容
为了解决上述问题,本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的一种识别文本展示方法及装置。
根据本发明实施例的第一方面,提供了一种识别文本展示方法,该方法包括:
获取识别文本中每一分词的分类特征,识别文本是对语音数据进行语音识别后得到的;
将每一分词的分类特征输入至分类模型,输出每一分词的分类标记,分类标记用于表示分词在识别文本中的重要程度和/或在识别文本中的异常情况;
根据每一分词的分类标记,确定每一分词的展示方式,并基于每一分词的展示方式对识别文本中每一分词进行展示。
本发明实施例提供的方法,通过获取识别文本中每一分词的分类特征,将每一分词的分类特征输入至分类模型,输出每一分词的分类标记。根据每一分词的分类标记,确定每一分词的展示方式,并基于每一分词的展示方式对识别文本中每一分词进行展示。由于在展示识别文本中文本内容的同时,还可以通过展示方式来体现分词在识别文本中的重要程度和/或在识别文本中的异常情况,从而承载发言人发言时的情感色彩和/或发言时的语义。因此,满足了发言人个性化展示其发言的需求。
根据本发明实施例的第二方面,提供了一种识别文本展示装置,该装置包括:
特征获取单元,用于获取识别文本中每一分词的分类特征,识别文本是对语音数据进行语音识别后得到的;
分类获取单元,用于将每一分词的分类特征输入至分类模型,输出每一分词的分类标记,分类标记用于表示分词在识别文本中的重要程度和/或在识别文本中的异常情况;
展示单元,用于根据每一分词的分类标记,确定每一分词的展示方式,并基于每一分词的展示方式对识别文本中每一分词进行展示。
根据本发明实施例的第三方面,提供了一种识别文本展示设备,包括:
至少一个处理器;以及
与处理器通信连接的至少一个存储器,其中:
存储器存储有可被处理器执行的程序指令,处理器调用程序指令能够执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的识别文本展示方法。
根据本发明的第四方面,提供了一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的识别文本展示方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810330612.5/2.html,转载请声明来源钻瓜专利网。