[发明专利]信息处理方法及装置在审
申请号: | 201310611314.0 | 申请日: | 2013-11-26 |
公开(公告)号: | CN104679742A | 公开(公告)日: | 2015-06-03 |
发明(设计)人: | 葛乃晟;郑仲光;付亦雯;孟遥 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;李春晖 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 装置 | ||
技术领域
本申请涉及信息处理领域,尤其涉及一种信息处理方法及装置。
背景技术
在现有的信息处理技术中,利用关键词检索相关专利文档时,一般都是关键词完全匹配或者模糊匹配。但是,这样获得的文档与关键词的相关性不高。
发明内容
鉴于现有技术的上述情形,本申请的实施方式提供了一种信息处理方法及装置,在利用关键词搜索相关文档时,考虑关键词与文档的句子中的最大名词单元和/或语法关系的匹配度,从而提高搜索到的文档与关键词的相关性。
本申请实施方式提供一种信息处理方法,包括:按照预定语法单位,将搜索请求中的关键词针对预定的数据库中的文档进行最大名词单元匹配和/或语法关系匹配,根据所述最大名词单元匹配和/或语法关系匹配的匹配结果确定所述文档与所述搜索请求的相关度;其中,所述文档中的每一个预定语法单位都具有以最大名词单元为中心的语法关系;根据各文档与所述搜索请求的相关度获取作为搜索结果的文档。
本申请的另一实施方式中提供一种信息处理装置,包括:最大名词单元匹配部件,被配置用于按照预定语法单位将搜索请求中的关键词针对预定的数据库中的文档进行最大名词单元匹配;和/或语法关系匹配部件,被配置用于按照预定语法单位将所述搜索请求中的关键词针对所述预定的数据库中的文档进行语法关系匹配;其中,所述文档中的每一个预定语法单位都具有以最大名词单元为中心的语法关系;以及相关度确定部件,被配置用于根据所述最大名词单元匹配和/或语法关系匹配的匹配结果确定所述文档与所述搜索请求的相关度;以及文档确定部件,被配置用于根 据各文档与所述搜索请求的相关度获取作为搜索结果的文档。
本申请中,当使用关键词在数据库中搜索文档时,可以根据在文档中搜索到的关键词与文档中的最大名词单元的匹配结果和/或与文档中的语法关系的匹配结果选择文档,从而可以搜索得到与搜索请求的相关度高的文档。
附图说明
参照下面结合附图对本申请实施方式的说明,会更加容易地理解本申请的以上和其它目的、特点和优点。附图以示例而非限制性的方式来说明本申请。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。
图1示出本申请实施方式提供的信息处理方法的流程图。
图2是示出对预定的数据库的一个具体处理示例的图形。
图3是示出图1所示的最大名词单元匹配和语法关系匹配的实施过程的一个具体示例的图形。
图4是示出本申请实施方式提供的最大名词单元匹配的实施过程的一个具体示例的图形。
图5是示出本申请实施方式提供的语法关系匹配的实施过程的一个具体示例的图形。
图6示出本申请实施方式提供的信息处理装置的结构框图。
图7示出本申请实施方式提供的信息处理装置的另一结构框图。
图8示出本申请实施方式提供的另一种信息处理装置的结构框图。
图9示出可用于实现本申请实施方式提供的方法和装置的计算设备的示例性结构框图。
具体实施方式
现在参考附图来更加详细地描述本申请的实施方式。示例实施方式的提供是为了使本申请更加详尽,并且向本领域技术人员充分地传达保护范围。阐述了众多的特定细节如特定部件、装置的例子,以提供对本申请的实施方式的详尽理解。对于本领域技术人员而言将会明显的是,示例实施 方式可以用许多不同的形式来实施而不一定使用这些特定的细节,因此它们都不应当被解释为限制本申请的范围。另外,在本发明的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。在某些示例实施方式中,为了清楚的目的,没有在附图和说明中详细地描述众所周知的过程、结构和技术。
下面参考附图结合具体实施方式介绍本申请提供的检索文档的方法。出于方便说明的目的,下述实施方式中以使用关键词搜索汉语文档为例进行说明,应当注意,本发明提供的方法还可以应用于其他语言,其处理可以参照下述以汉语为例执行的处理,本文不再赘述。
图1示出本申请实施方式提供的信息处理方法的流程图。
在步骤S101中,按照预定语法单位,将搜索请求中的关键词针对预定的数据库中的文档进行最大名词单元匹配和/或语法关系匹配,根据所述最大名词单元匹配和/或语法关系匹配的匹配结果确定所述文档与所述搜索请求的相关度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社;,未经富士通株式会社;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310611314.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种论坛回帖的方法
- 下一篇:互联网热词挖掘方法及装置