[发明专利]用于从用户生成的内容建立演化本体的系统和方法在审
申请号: | 201911031161.6 | 申请日: | 2019-10-28 |
公开(公告)号: | CN111104518A | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 刘石竹;黄凯琳;陈力;孙建勋;许宁;张程冲;周辉 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;京东美国科技公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/284;G06F40/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 倪斌 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 用户 生成 内容 建立 演化 本体 系统 方法 | ||
一种用于构建演化本体数据库的方法和系统。该方法包括:接收多个数据条目;计算任何两个数据条目之间的语义相似度得分;基于语义相似度得分来将数据条目集群为多个当前主题;通过将当前主题与使用先前数据条目准备的多个先前主题进行比较来从当前主题中选择新概念;以及使用新概念来更新演化本体数据库。通过下式计算任何两个数据条目之间的语义相似度得分,其中si是特征源的权重,fj是两个数据条目之间的特征相似度,wj是fj的权重,j、k和n是正整数。
交叉引用
在本公开的描述中引用和讨论了包括专利、专利申请和各种出版物的一些参考文献。提供这样的参考文献的引用和/或讨论仅是为了阐明本公开的描述,而不是承认任何这样的参考文献是本文描述的公开的“现有技术”。在本说明书中引用和讨论的所有参考文献均通过引用以其整体并入本文,其程度与每个参考文献通过引用独立地并入本文的程度相同。
技术领域
本公开总体上涉及从复杂和动态数据建立演化本体,更具体地,涉及用于从电子商务网站上用户生成的内容建立演化本体的系统和方法。
背景技术
本文提供的背景描述是为了总体上呈现本公开内容的目的。在此背景技术部分中所描述的范围内,目前命名的发明人的工作,以及申请时可能无法视为现有技术的说明书中的某些方面,均未明确地或暗示地承认本公开为现有技术。
计算机中介通信正在成为当今社会共享和交换信息的最便捷、最重要的方式。人们可以直接将他们的反馈意见提交给特定的商家或制造商,并通过读取其他用户的评论,来在做出许多常规消费者购买决定之前进行在线研究。然而,仅通过检查单个评论得分或多个正面或负面评论,很难有效利用网络上大量且多样的用户生成的内容。
因此,在本领域中存在解决前述缺陷和不足的未解决的需求。
发明内容
在某些方面,本公开涉及一种用于构建演化本体数据库的方法。在某些实施例中,该方法包括:
计算设备接收多个数据条目;
计算设备基于数据条目的特征源和特征相似度来计算任何两个数据条目之间的语义相似度得分;
计算设备基于语义相似度得分将数据条目集群为多个当前主题;
计算设备通过将当前主题与使用先前数据条目准备的多个先前主题进行比较来从当前主题中选择新概念;以及
计算设备使用新概念来更新演化本体数据库。
在某些实施例中,任何两个数据条目之间的语义得分通过下式计算:
其中si是特征源的权重,fj是两个数据条目之间的特征相似度之一,wj是fj的权重,j、k和n是正整数。
在某些实施例中,数据条目是用户生成的反馈,并且计算语义相似度得分的步骤包括:通过情绪分析器预测情绪相似度值,情绪相似度值表示两个数据条目之间关于正面反馈、负面反馈、中性反馈、非常负面反馈以及互联网滥用的相似度;通过相似度计算器预测文本相似度值,文本相似度值表示从两个数据条目中提取的文本的语义之间的相似度;通过中性语言解析器预测句法相似度值,句法相似度值表示两个数据条目的文本的句法复杂度。
在某些实施例中,集群数据条目的步骤还包括:使用情绪相似度值、文本相似度值和句法相似度值计算两个数据条目的语义相似度得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;京东美国科技公司,未经北京京东尚科信息技术有限公司;京东美国科技公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911031161.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:显示装置
- 下一篇:柔性热电发电器及其制造方法
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法