[发明专利]基于话题图谱的评论生成在审
申请号: | 202010561320.X | 申请日: | 2020-06-18 |
公开(公告)号: | CN111753050A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 周庆;王建勇;陈鹏;黎强;韦添;苏之阳;孙婷 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36;G06F40/295 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 张立达 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 话题 图谱 评论 生成 | ||
1.一种用于基于话题图谱的评论生成的方法,包括:
从目标文档中识别出至少一个话题项;
利用所述至少一个话题项来建立话题图谱;
至少基于所述话题图谱的结构信息来生成所述话题图谱的话题图谱表示;以及
至少基于所述话题图谱表示来生成对所述目标文档的评论。
2.如权利要求1所述的方法,其中,
每个话题项是包括实体和话题词语的二元组。
3.如权利要求1所述的方法,其中,所述识别出至少一个话题项包括:
通过将所述目标文档与候选话题项集合进行匹配来识别出所述至少一个话题项。
4.如权利要求1所述的方法,其中,所述建立话题图谱包括:
将所述至少一个话题项设置为至少一个节点;
识别出共享相同信息的一个或多个节点对;以及
为每个所识别的节点对设置用于连接该节点对中的两个节点的边。
5.如权利要求1所述的方法,其中,所述生成话题图谱表示包括:
获得所述至少一个话题项的至少一个话题项表示;以及
基于所述至少一个话题项表示和所述结构信息来生成所述话题图谱表示。
6.如权利要求5所述的方法,其中,
每个话题项的话题项表示是利用该话题项的相关文档来生成的。
7.如权利要求5所述的方法,其中,所述话题图谱包括多个节点和在所述多个节点之间连接的多条边,所述结构信息包括每个节点的连接信息,并且所述生成所述话题图谱表示包括:
获得所述多个节点中每个节点的初始节点特征,该初始节点特征对应于该节点中的话题项的话题项表示;
通过图注意力网络,基于每个节点的初始节点特征和该节点的连接信息来生成该节点的更新节点特征;以及
将所述多个节点的多个更新节点特征组合为所述话题图谱表示。
8.如权利要求1所述的方法,还包括:
生成与所述目标文档对应的文档表示,并且
其中,所述评论是进一步基于所述文档表示来生成的。
9.如权利要求8所述的方法,其中,所述生成评论包括:
对所述文档表示应用第一注意力机制;
对所述话题图谱表示应用第二注意力机制;
对所述第一注意力机制的输出和所述第二注意力机制的输出进行融合;以及
利用所述融合的结果来产生所述评论。
10.如权利要求3所述的方法,还包括:
预先建立所述候选话题项集合。
11.如权利要求10所述的方法,其中,所述预先建立所述候选话题项集合包括:
获得多个实体;
从多个参考文档标题中提取多个话题词语;
计算每个实体与每个话题词语之间的相关性值;以及
选择相关性排序最高的多个实体,话题词语二元组以作为所述候选话题项集合中的多个候选话题项。
12.如权利要求11所述的方法,还包括:对于每个候选话题项,
从所述多个参考文档标题中识别出包含该候选话题项中的实体和话题词语的多个相关文档标题;以及
利用所述多个相关文档标题来生成该候选话题项的话题项表示。
13.如权利要求12所述的方法,其中,所述生成该候选话题项的话题项表示包括:
生成所述多个相关文档标题的多个标题表示;
将所述多个标题表示聚类成至少一个簇;以及
计算所述至少一个簇的代表性表示,以作为所述话题项表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010561320.X/1.html,转载请声明来源钻瓜专利网。