[发明专利]一种确定相关对象的方法和装置有效
申请号: | 201510882827.4 | 申请日: | 2015-12-04 |
公开(公告)号: | CN105512270B | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 葛宁 | 申请(专利权)人: | 上海优扬新媒信息技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/35 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 201210 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 相关 对象 方法 装置 | ||
1.一种确定相关对象的方法,其特征在于,所述方法包括:
从外部数据源获取对象的大量原始语料文档;
依据对象的原始语料文档确定对象的对象类型和对象主题,具体包括:
从所述对象的原始语料文档中提取类型关键词集合和主题关键词集合;
将类型关键词集合所匹配到的标准对象类型作为对象类型,以及
主题关键词集合所匹配到的标准对象主题作为对象主题;
按照对象类型聚合对象,得到一个以上的对象簇;
依据同一对象簇中对象之间的主题相似度,获得待分析对象的相关对象。
2.根据权利要求1所述的方法,其特征在于,所述将类型关键词集合所匹配到的标准对象类型作为对象类型,以及主题关键词集合所匹配到的标准对象主题作为对象主题具体包括:
将所述类型关键词集合和主题关键词集合分别与预先建立的标准类型分类知识库和标准主题分类知识库进行匹配;
确定所述标准类型分类知识库中与类型关键词集合相匹配的标准对象类型分类,以及所述标准主题分类知识库中与主题关键词集合相匹配的标准对象主题分类;
依据匹配的标准对象类型分类和标准对象主题分类确定对象类型和对象主题。
3.根据权利要求1至2任一项所述的方法,其特征在于,按照对象类型聚合对象,得到一个以上的对象簇包括:
查找标准对象类型树形结构,确定各对象类型在所述标准对象类型树形结构的位置;
若各对象的对象类型之间具有相同的上级节点,且对象类型之间的层级差符合预设的要求,则确定该各对象属于同一对象簇。
4.根据权利要求1至2任一项所述的方法,其特征在于,采用如下方式确定对象之间的主题相似度:
分别确定各对象的主题向量,所述主题向量由对象的每个对象主题构成;
确定各对象的主题向量的余弦相似度作为对象之间的主题相似度。
5.根据权利要求1至2任一项所述的方法,其特征在于,周期性地或者受事件触发时,执行所述方法。
6.根据权利要求1至2任一项所述的方法,其特征在于,所述方法还包括:
将各对象分别作为待分析对象,执行所述方法;
在结果数据库中存储各对象对应的相关对象。
7.根据权利要求1至2任一项所述的方法,其特征在于,所述方法还包括:
将用户输入的对象作为待分析对象,执行所述方法,并输出待分析对象的相关对象。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
获取用户输入的对象;
查询所述结果数据库,确定并输出与所述输入的对象对应的相关对象。
9.根据权利要求1至2任一项所述的方法,其特征在于,
所述对象的原始语料文档包括公司的新闻语料、行业描述、产品服务描述及关系;
所述对象类型包括公司行业;
所述对象主题包括公司提供的产品服务;
所述相关对象包括存在竞争关系的公司。
10.一种确定相关对象的装置,其特征在于,所述装置包括:
原始语料文档获取单元,用于从外部数据源获取对象的大量原始语料文档;
确定单元,用于依据对象的原始语料文档确定对象的对象类型和对象主题,所述确定单元具体包括:
关键词集合提取单元,用于从所述对象的原始语料文档中提取类
型关键词集合和主题关键词集合;
匹配单元,用于将类型关键词集合所匹配到的标准对象类型作为对象类型,以及主题关键词集合所匹配到的标准对象主题作为对象主题;
聚合单元,用于按照对象类型聚合对象,得到一个以上的对象簇;
相关对象获得单元,用于依据同一对象簇中对象之间的主题相似度,获得待分析对象的相关对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海优扬新媒信息技术有限公司,未经上海优扬新媒信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510882827.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:组合物用于制备血管新生异常的药物的用途
- 下一篇:用于账号登录的方法和装置