[发明专利]一种创建网络百科词条的方法及装置有效
| 申请号: | 201410742411.8 | 申请日: | 2014-12-08 |
| 公开(公告)号: | CN104484374B | 公开(公告)日: | 2018-11-16 |
| 发明(设计)人: | 吴先超 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 路凯;胡彬 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 创建 网络 百科 词条 方法 装置 | ||
1.一种创建网络百科词条的方法,其特征在于,所述方法适用于网络百科未收录用户输入的新词条,用户创建新词条的情况下,所述方法包括:
接收待创建词条,分析所述待创建词条的领域分类,并查询与所述领域分类相对应的视角分区,其中,所述视角分区代表领域分类的各方面属性,以对所述领域分类进行详细描述;
使用所述待创建词条和所述视角分区组建检索语句,根据所述检索语句进行检索;
依据预设的整合规则,对检索结果进行整合,并显示整合后的检索结果;
其中,所述查询与所述领域分类相对应的视角分区,包括:
依据所述领域分类对应的网络百科词条模板,查询与所述领域分类相对应的视角分区;其中,所述网络百科词条模板中包含所述领域分类和与所述领域分类相对应的视角分区。
2.根据权利要求1所述的方法,其特征在于,分析所述待创建词条的领域分类包括:
依据词条与领域分类模型分析所述待创建词条的领域分类,获得至少一个所述领域分类。
3.根据权利要求1所述的方法,其特征在于,所述领域分类包括人物、机构、药品和品牌中的至少一个;
所述人物相对应的视角分区包括时间、空间和生平事件组成的时空图谱;
所述机构相对应的视角分区包括时间、空间和相关人物;
所述药品相对应的视角分区包括时间、发明人、发明机构、效果和副作用;
所述品牌相对应的视角分区包括时间、创始人、规模和产品。
4.根据权利要求1所述的方法,其特征在于,在使用所述待创建词条和所述视角分区组建检索语句,根据所述检索语句进行检索之后,依据预设的整合规则,整合检索结果之前,还包括:
采用语义角色标注器,对检索结果中的各个语句进行语义角色标注,获得所述各个语句的主干结构。
5.根据权利要求4所述的方法,其特征在于,在采用语义角色标注器,对检索结果中的各个语句进行语义角色标注之前,还包括:
对检索结果中的各个语句分别进行依存关系分析,并对分析结果进行修正,获得所述各个语句分别对应的依存分析树;
则所述采用语义角色标注器,对检索结果中的各个语句进行语义角色标注,获得所述各个语句的主干结构,包括:
将检索结果中的各个语句的依存分析树分别输入所述语义角色标注器,所述语义角色标注器每次接收到语句的依存分析树后,根据当前接收的依存分析树进行语法解析,输出对应语句的主干结构。
6.根据权利要求1-5中任一所述的方法,其特征在于,所述预设的整合规则包括以下至少一项:
对所述检索结果进行命名实体识别NER,以识别出有特定意义的实体词语;
对所述检索结果中的实体词语进行歧义消除,以将具有歧义的实体词语统一为同一个实体词语;
归一化代表同一个实体的缩率语。
7.根据权利要求1-5中任一所述的方法,其特征在于,依据预设的整合规则,对检索结果进行整合之后,在显示整合后的检索结果之前,还包括:
对于查询到的各视角分区,统计所述检索结果中对应该视角分区的检索结果的出现频次;
将查询到的语义相似的多个视角分区合并成一个视角分区,并叠加该多个视角分区对应的检索结果的出现频次,作为合并后的视角分区对应的检索结果的出现频次;
所述显示整合后的检索结果包括:
按照各视角分区对应的检索结果的出现频次由高到低的顺序,显示各视角分区相对应的检索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410742411.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:字符串相似度的计算方法和装置
- 下一篇:一种业务对象投放信息的检测方法和装置





