[发明专利]基于词向量表征的问题评论对的构建方法有效
申请号: | 201911229576.4 | 申请日: | 2019-12-04 |
公开(公告)号: | CN110968674B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 钱宇;袁华 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/211;G06F40/30;G06Q30/0601 |
代理公司: | 四川省成都市天策商标专利事务所(有限合伙) 51213 | 代理人: | 张秀敏 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 向量 表征 问题 评论 构建 方法 | ||
1.一种基于词向量表征的问题评论对的构建方法,其特征在于,包括以下步骤:
S10、获取问答语料库以及评论语料库,并对问题和该问题的回答进行拼接;
S20、使用word2vec工具和基于词向量的词袋模型分别对拼接后的问答语句以及评论进行表征,获得拼接后的问答语句的句向量以及评论语句的句向量;
在步骤S20中,所述的word2vec工具包括CBOW模型和Skip-Gram模型,通过CBOW模型和Skip-Gram模型得到拼接后的问答语句以及评论的词向量;
在步骤S20中,设句子的句长为N,第i个词的词向量为vi,句子的句向量为s,则可得到句向量
S30、利用步骤S20得到的句向量计算拼接后的问答语句以及评论语句间的相似度;
在步骤S30中,采用余弦相似度来计算句子与句子之间的相似度,设VQA为问句和答句拼接后的句向量,VR为评论的句向量,则问句和答句拼接后的句向量与评论的句向量之间的余弦相似度为:
S40、对于每个问题,按照步骤S30得到的相似度对评论进行排序,将相似度最高的n个评论作为该问题的候选评论;
S50、专家在每个问题的候选评论中进行标注,标注出可以回答问题的评论和不可以回答问题的评论,即可得到问题评论对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911229576.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:应用内存测试方法、装置及计算机存储介质
- 下一篇:一种轮椅用雨衣