[发明专利]基于模式挖掘与词向量相似度计算的中文查询扩展方法在审
| 申请号: | 202010773432.1 | 申请日: | 2020-08-04 |
| 公开(公告)号: | CN111897922A | 公开(公告)日: | 2020-11-06 |
| 发明(设计)人: | 黄名选 | 申请(专利权)人: | 广西财经学院 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332 |
| 代理公司: | 广西南宁明智专利商标代理有限责任公司 45106 | 代理人: | 林兴宁 |
| 地址: | 530007 广西壮族*** | 国省代码: | 广西;45 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提出了一种基于模式挖掘与词向量相似度计算的中文查询扩展方法,其首先通过用户查询检索中文文档集得到初检文档,对初检文档集进行词向量语义学习训练得到包括查询词项和非查询词项的词向量集;然后采用基于Copulas函数的关联扩展词挖掘方法对伪相关反馈文档集挖掘扩展词,建立关联扩展词集;在词向量集中进行两种向量余弦相似度运算,得到词嵌入扩展词集和词向量关联扩展词集,最后将词嵌入扩展词集和词向量关联扩展词集并集融合得到最终扩展词,最终扩展词和原查询组合为新查询,再次检索文档集,实现查询扩展。本发明将关联模式挖掘与词向量学习融合,可挖掘出高质量扩展词,提高信息检索性能,具有较好应用价值和推广前景。 | ||
| 搜索关键词: | 基于 模式 挖掘 向量 相似 计算 中文 查询 扩展 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西财经学院,未经广西财经学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010773432.1/,转载请声明来源钻瓜专利网。





