[发明专利]一种商品知识图谱的构建方法有效
申请号: | 201610220247.3 | 申请日: | 2016-04-07 |
公开(公告)号: | CN105912656B | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 林煜明;蒋向香;杨溢;李优;张敬伟;张会兵 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06Q30/02 |
代理公司: | 桂林市持衡专利商标事务所有限公司 45107 | 代理人: | 陈跃琳 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种商品知识图谱的构建方法,包括商品知识图谱的客观性商品分类知识的构建和主观性用户观点知识的构建。主观性知识的构建包含采用基于多分类器集成的方法从用户评论中挖掘观点目标和观点词的过程和直接从网站上获取观点持有者、观点发表时间和/或观点的URL信息的过程。客观性知识的构建包含采用基于多源异构分类层次融合的方法获取兼顾深度和广度的商品分类层次的过程和直接从网站上获取商品实例的过程。本发明针对商品所构建的结构化的知识图谱涵盖了客观性商品分类和主观性用户观点两类知识,不仅能够为上层服务提供商品实体的准确解释,而且还能够了解众多用户对商品及其属性的观点描述,从而为用户提供更快速、更精准、更全面的商品知识服务。 | ||
搜索关键词: | 一种 商品 知识 图谱 构建 方法 | ||
【主权项】:
一种商品知识图谱的构建方法,包括商品知识图谱的客观性商品分类知识的构建和主观性用户观点知识的构建,其特征是,上述主观性用户观点知识的构建包含采用基于多分类器集成的方法从用户评论中挖掘观点目标和观点词的过程,即:步骤(1)将评论集中评论的单词数小于设定阈值τ的评论过滤掉,将评论集中剩下的每个评论切分成句子,构成一个评论语句集S;步骤(2)对评论语句集S中的每个句子进行组块识别;步骤(3)对评论语句集S中的每个句子所出现的组块两两构建成观点目标和观点词的候选对,并保证每个候选对中的两个组块的次序与它们在句子中出现的顺序一致;步骤(4)将每个候选对作为一个样本,并根据预先确定的特征对样本进行向量化后,构成样本集SL;步骤(5)将样本集SL划分成大小不等的两个集合SL1和SL2,其中|SL1|>|SL2|;步骤(6)在集合SL1上采用不同的分类方法训练出不同的分类器;步骤(7)对集合SL2中的每个样本分别用训练好的分类器进行分类,得到的分类结果与样本的标签构成一个新的样本,由此可以得到|SL2|个新样本;步骤(8)用所得的新样本去训练出一个集成分类器,并用该集成分类器将所有分类器的预测结果进行整合,由此完成商品知识图谱的主观性用户观点知识中的观点目标和观点词的协同抽取。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610220247.3/,转载请声明来源钻瓜专利网。