[发明专利]一种智能语音搜索影片的方法及系统有效
申请号: | 201810606616.1 | 申请日: | 2018-06-13 |
公开(公告)号: | CN108877781B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 关广鹏;刘江 | 申请(专利权)人: | 东方梦幻文化产业投资有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/26;G10L15/30;G10L15/34;G06F16/783 |
代理公司: | 北京卓特专利代理事务所(普通合伙) 11572 | 代理人: | 陈变花 |
地址: | 100000 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 语音 搜索 影片 方法 系统 | ||
1.一种智能语音搜索影片的方法,其特征在于,包括以下步骤:
识别搜索语音,并将所述搜索语音转化为搜索文本;
将所述搜索文本与服务器中预存的影片对白文本进行匹配;
抽取所述搜索文本中的至少一个关键词;
对搜索文本进行语义层次上的分析得出关键字,对关键词进行初步聚类;将初步聚类后的文档集根据相似度生成拉普拉斯矩阵,并计算其特征值和特征向量;根据特征值间隔确定聚类数以及表示矩阵,并对所述聚类数及表示矩阵进行二次聚类;将二次聚类的结果进行交互操作,并进行再次聚类,通过三步聚类保证了对关键词的精准处理;
确定所述关键词的优先级;
将搜索文本的句子成分划分为谓语、宾语、表语,将谓语设置为第一优先级、将宾语设置为第二优先级、将表语设置为第三优先级;
根据关键词的优先级进行以下搜索;
将所述至少一个关键词作为匹配目标,将所述匹配目标与所述对白文本进行目标匹配;
计算所述关键词的目标匹配度;
抽取所述搜索文本中的关键词后,分析关键词的语义,将相同相近语义的词语确定为关键词的衍生词,根据所述关键词的衍生词进行目标匹配;
若匹配成功,则输出影片。
2.根据权利要求1所述的智能语音搜索影片的方法,其特征在于,将所述搜索语音转化为搜索文本后,将所述搜索文本与服务器中预存的影片名和/或影片标签进行匹配;若对比失败,则将所述搜索文本与服务器中预存的影片对白文本进行匹配。
3.根据权利要求1或2所述的智能语音搜索影片的方法,其特征在于,获得所述影片对白文本具体包括:
对影片的对白进行语音识别;
将所述影片的对白对应的语音转化为对白文本,并存储于服务器。
4.一种智能语音搜索影片的机顶盒,其特征在于,包括:
语音识别模块,用于识别搜索语音,并将所述搜索语音转化为搜索文本;
通信模块,用于将所述搜索文本发送至服务器,并且接收服务器将所述搜索文本与服务器中预存的影片对白文本匹配成功后输出的影片;
服务器的抽取模块抽取所述搜索文本中的至少一个关键词,对搜索文本进行语义层次上的分析得出关键字,对关键词进行初步聚类;将初步聚类后的文档集根据相似度生成拉普拉斯矩阵,并计算其特征值和特征向量;根据特征值间隔确定聚类数以及表示矩阵,并对所述聚类数及表示矩阵进行二次聚类;将二次聚类的结果进行交互操作,并进行再次聚类,通过三步聚类保证了对关键词的精准处理;
抽取搜索文本中的关键词后,服务器的优先级确定模块确定关键词的优先级;
将搜索文本的句子成分划分为谓语、宾语、表语,将谓语设置为第一优先级、将宾语设置为第二优先级、将表语设置为第三优先级;
服务器的计算模块根据关键词的优先级进行目标匹配;
服务器的计算模块将至少一个关键词作为匹配目标,将所述匹配目标与对白文本中进行目标匹配,计算所述关键词目标匹配度;
抽取所述搜索文本中的关键词后,分析关键词的语义,将相同相近语义的词语确定为关键词的衍生词,根据所述关键词的衍生词进行目标匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东方梦幻文化产业投资有限公司,未经东方梦幻文化产业投资有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810606616.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音搜题方法及家教设备
- 下一篇:语音识别方法和装置