[发明专利]文档搜索装置和文档搜索方法在审
申请号: | 201280067066.1 | 申请日: | 2012-12-27 |
公开(公告)号: | CN104221012A | 公开(公告)日: | 2014-12-17 |
发明(设计)人: | 藤井洋一;石井纯 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 金春实 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 搜索 装置 方法 | ||
1.一种文档搜索装置,具备:根据预先准备的文档制作的搜索索引;以及文档搜索部,接收来自用户的输入,使用所述搜索索引从所述文档内搜索与该用户输入有关联的项目,该文档搜索装置的特征在于,具备:
发声估计模型,学习了询问所述文档的内容的设想提问与成为该设想提问的回答的所述文档内的项目的对应关系;
发声内容估计部,基于所述发声估计模型从所述文档内估计与所述用户输入的回答相当的项目;以及
结果合并部,将从所述文档搜索部得到的文档搜索结果与从所述发声内容估计部得到的文档估计结果进行合并来生成最终搜索结果。
2.根据权利要求1所述的文档搜索装置,其特征在于,
所述发声内容估计部对估计出的所述文档内的项目赋予与和所述用户输入的关联程度相应的分数,
所述结果合并部在从所述发声内容估计部得到的文档估计结果的分数大于预先决定的值的情况下,忽略从所述文档搜索部得到的文档搜索结果来生成最终搜索结果。
3.根据权利要求1所述的文档搜索装置,其特征在于,
所述文档搜索部对搜索出的所述文档内的项目赋予与和所述用户输入的关联程度相应的分数,
所述发声内容估计部对估计出的所述文档内的项目赋予与和所述用户输入的关联程度相应的分数,
所述结果合并部将从所述文档搜索部得到的文档搜索结果的分数与从所述发声内容估计部得到的文档估计结果的分数以一定的比例相加来进行合并。
4.根据权利要求1所述的文档搜索装置,其特征在于,
具备搜索对象限定部,该搜索对象限定部提取从所述发声内容估计部得到的文档估计结果中的满足规定的条件的项目,
所述发声内容估计部基于学习了比所述搜索索引的搜索的最小单位大的单位的项目与所述设想提问的对应关系的发声估计模型进行估计,
所述结果合并部将从所述发声内容估计部得到的文档估计结果中的由所述搜索对象限定部提取的项目与从所述文档搜索部得到的文档搜索结果进行合并。
5.根据权利要求1所述的文档搜索装置,其特征在于,具备:
输入分析部,分析预先准备的文档以及收集发声数据,其中,该收集发声数据定义了询问该文档的内容的设想提问与成为该提问的回答的该文档内的项目的对应关系;
搜索索引制作部,根据从所述输入分析部输出的所述文档的分析结果制作所述搜索索引;以及
发声估计模型制作部,使用从所述输入分析部输出的所述收集发声数据的分析结果,学习所述设想提问与所述文档内的项目的对应关系,制作所述发声估计模型。
6.一种文档搜索方法,其特征在于,具备以下步骤:
用户输入步骤,接收来自用户的输入;
文档搜索步骤,使用根据预先准备的文档制作的搜索索引,从该文档内搜索与所述用户输入有关联的项目;
发声内容估计步骤,基于学习了询问所述文档的内容的设想提问与成为该设想提问的回答的所述文档内的项目的对应关系的发声估计模型,从所述文档内估计与所述用户输入的回答相当的项目;以及
结果合并步骤,将从所述文档搜索步骤得到的文档搜索结果与从所述发声内容估计步骤得到的文档估计结果进行合并来生成最终搜索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280067066.1/1.html,转载请声明来源钻瓜专利网。