[发明专利]提取热词的方法、系统、电子设备及介质有效
| 申请号: | 202010865409.5 | 申请日: | 2020-08-25 |
| 公开(公告)号: | CN112069950B | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 郑翔;宗博文;徐文铭 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
| 主分类号: | G06V20/40 | 分类号: | G06V20/40;G06F16/951;G06F16/783;G06F16/78;G10L15/22 |
| 代理公司: | 北京远智汇知识产权代理有限公司 11659 | 代理人: | 范坤坤 |
| 地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 提取 方法 系统 电子设备 介质 | ||
本公开公开了一种提取热词的方法、装置、电子设备及存储介质,该方法包括:确定目标视频帧中的目标标识,并获取与所述目标标识相对应的目标页面;通过对所述目标页面解析处理,得到与所述目标页面相对应的目标内容;基于所述目标内容,确定所述目标视频帧所属目标视频的至少一个热词词汇。本公开实施例的技术方案,通过爬取与目标标识相对应的目标页面,并基于目标页面中的页面内容,快速准确的确定目标视频帧所属视频的热词,以便在语音转文字处理时,获取与语音信息对应的热词,从而提高语音转文字的准确率的技术效果。
技术领域
本公开实施例涉及计算机技术领域,尤其涉及一种提取热词的方法、系统、电子设备及介质。
背景技术
随着互联网通信技术的发展,越来越多的用户倾向于线上沟通或者交流。
在基于线上沟通时,可能存在无法根据视频帧中显示的内容了解其所属视频的核心思想,引起无法很好的了解视频的内容,导致存在交互效率极低以及用户体验较差的技术问题。
发明内容
本公开提供一种提取热词的方法、系统、电子设备及介质,以实现通过对各个目标视频帧进行处理,提高确定目标视频帧所属视频的热词词汇效率的技术效果。
第一方面,本公开实施例提供了一种提取热词的方法,该方法包括:
确定目标视频帧中的目标标识,并获取与所述目标标识相对应的目标页面;
通过对所述目标页面解析处理,得到所述目标页面中的目标内容;
基于所述目标内容,确定所述目标视频帧所属目标视频的至少一个热词词汇。
第二方面,本公开实施例还提供了一种提取热词的装置,该装置包括:
目标页面获取模块,用于确定目标视频帧中的目标标识,并获取与所述目标标识相对应的目标页面;
目标内容确定模块,用于通过对所述目标页面解析处理,得到与所述目标页面中的目标内容;
热词词汇确定模块,用于基于所述目标内容,确定所述目标视频帧所属目标视频的至少一个热词词汇。
第三方面,本公开实施例还提供了一种提取热词的系统,该系统包括:
图文识别子系统确定目标视频帧中的目标标识,并将所述目标标识发送至爬虫子系统;
所述爬虫子系统接收所述目标标识,并获取与所述目标标识相对应的目标页面,将所述目标页面发送至页面解析子系统;
所述页面解析子系统接收所述目标页面,并对所述目标页面解析处理,得到所述目标页面中的目标内容,将所述目标内容发送至热词提取子系统;
所述热词提取子系统接收所述目标内容,并确定所述目标视频帧所属目标视频的至少一个热词词汇。
第四方面,本公开实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开实施例任一所述的提取热词的方法。
第五方面,本公开实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本公开实施例任一所述的提取热词的方法。
本公开实施例的技术方案,通过对目标视频的各个目标视频帧进行处理,可以确定目标视频帧所属目标视频的热词词汇,以在语音转文字处理过程中,基于确定的热词词汇确定语音信息相对应的文字,提高了语音转文字的准确性,从而在基于转换的文字进行交互时,提高了用户交互效率的技术效果。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010865409.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高速公路车辆唯一标识特征提取方法及系统
- 下一篇:一种车辆连接结构及车辆





