[发明专利]一种多媒体问答系统及方法在审
申请号: | 201210146651.2 | 申请日: | 2012-05-14 |
公开(公告)号: | CN103425640A | 公开(公告)日: | 2013-12-04 |
发明(设计)人: | 刘扬;王栋;刘洁 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 张全文 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多媒体 问答 系统 方法 | ||
1.一种多媒体问答系统,其特征在于,所述系统包括:
问题输入单元,用于接收用户输入的文本问题;
解析单元,用于解析获取所述文本问题的特征信息及语义类别;
类别判断单元,用于判断预设多媒体数据库中是否存在所述语义类别;
相似度获取单元,用于当所述类别判断单元输出结果为是时,将所述特征信息与所述多媒体数据库中所述语义类别对应的所有文本特征进行匹配,获取每一文本特征与所述特征信息之间的相似度;以及
多媒体答案输出单元,用于获取相似度大于预设阈值时对应的文本特征,并输出所述文本特征所对应的预先存储在所述多媒体数据库中的多媒体答案信息。
2.如权利要求1所述的系统,其特征在于,所述系统还包括:
文本答案输出单元,用于当所述类别判断单元输出结果为否时,或者当所述相似度获取单元输出的相似度均不大于所述预设阈值时,直接从网络上获取并输出与所述文本问题相关的文本答案信息。
3.如权利要求1所述的系统,其特征在于,所述系统还包括:
采集单元,用于采集网络问答社区中各种文本问题及对应的文本答案;
特征提取单元,用于获取网络上的每一文本问题和/或对应的文本答案的文本特征及关键词;
多媒体判断单元,用于根据任一文本问题的文本特征,判断所述任一文本问题是否需要获取对应的多媒体答案信息;
多媒体答案获取单元,用于当所述多媒体判断单元输出结果为是时,根据所述任一文本问题和/或对应的文本答案的关键词,获取与所述任一文本问题对应的一条或者多条多媒体答案信息;
类别获取单元,用于根据所述任一文本问题和/或对应的文本答案的关键词,获取所述任一文本问题所对应归属在多媒体数据库中的一种语义类别;以及
数据库建立单元,用于在所述多媒体数据库中建立与所述任一文本问题对应的语义类别、文本特征以及所述一条或者多条多媒体答案信息之间的对应关系。
4.如权利要求3所述的系统,其特征在于,所述多媒体答案获取单元具体包括:
多媒体信息获取单元,用于根据所述任一文本问题和/或对应的文本答案的关键词,获取与所述关键词相关的一条或者多条多媒体信息;
多媒体答案获取子单元,用于根据预先建立的文本问题与多媒体信息之间的映射关系,获取与所述关键词对应的一条或者多条多媒体答案信息;以及
排序单元,用于根据预先建立的基于梯度Boosting的排序算法,按照与所述任一文本问题的相关度,对所述一条或者多条多媒体答案信息进行排序。
5.如权利要求4所述的系统,其特征在于,所述系统还包括:
图像信息获取单元,用于根据所述关键词,获取网络图像资源中与所述关键词对应的视觉图像信息;以及
映射关系建立单元,用于利用视觉概念检测子算法,建立文本问题与多媒体信息之间的映射关系。
6.如权利要求3所述的系统,其特征在于,所述系统还包括:
数据库更新单元,用于实时更新所述多媒体数据库中的语义类别、对应的文本特征以及多媒体答案信息之间的对应关系。
7.一种多媒体问答方法,其特征在于,所述方法包括下述步骤:
接收用户输入的文本问题;
解析获取所述文本问题的特征信息及语义类别;
判断预设多媒体数据库中是否存在所述语义类别;
当所判断结果为是时,将所述特征信息与所述多媒体数据库中所述语义类别对应的所有文本特征进行匹配,获取每一文本特征与所述特征信息之间的相似度;
获取相似度大于预设阈值时对应的文本特征,并输出所述文本特征所对应的预先存储在所述多媒体数据库中的多媒体答案信息。
8.如权利要求7所述的方法,其特征在于,所述方法还包括:
当判断单元为否时,或者当所述每一文本特征与所述特征信息之间的相似度均不大于所述预设阈值时,直接从网络上获取并输出与所述文本问题相关的文本答案信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210146651.2/1.html,转载请声明来源钻瓜专利网。