[发明专利]内容识别方法及装置在审
申请号: | 201810273709.7 | 申请日: | 2018-03-29 |
公开(公告)号: | CN108536787A | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 陈建亮 | 申请(专利权)人: | 优酷网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 互动内容 目标内容 内容识别 多媒体资源 概率 决策模型 自动识别 | ||
1.一种内容识别方法,其特征在于,包括:
利用决策模型,确定针对多媒体资源的互动内容为目标内容的第一概率;
将所述第一概率大于或等于概率阈值的互动内容确定为目标内容。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
控制终端对确定为目标内容的互动内容进行突出显示。
3.根据权利要求1或2所述的方法,其特征在于,所述目标内容包括提问内容。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
对确定为提问内容的互动内容,确定与所述提问内容相匹配的答案。
5.根据权利要求1所述的方法,其特征在于,所述决策模型包括决策节点,每个决策节点具有判断分支,每个决策节点对应于用于判断所述互动内容是否为目标内容的一个特征。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
确定对作为训练样本的历史互动内容进行分类而产生的信息熵,其中,所述分类是根据所述历史互动内容是否为所述目标内容而进行的;
以上一级决策节点的判断分支作为条件,分别确定所述历史互动内容的尚未作为决策节点的各特征的条件熵;
根据所述信息熵和所述各特征的条件熵,分别确定所述各特征的信息增益;
将所述信息增益最大的特征确定为作为条件的所述判断分支的下一级决策节点,并确定该下一级决策节点的各判断分支对应的第二概率,其中,所述第二概率是符合该下一级决策节点的各判断分支的历史互动内容为所述目标内容的概率;
在满足训练条件时,将所有决策节点组成的决策模型作为最终的决策模型。
7.根据权利要求6所述的方法,其特征在于,基于所述特征,利用决策模型,确定针对多媒体资源的互动内容为目标内容的第一概率,包括:
确定所述互动内容所满足的所述决策模型的各个判断分支;
确定所满足的各个所述判断分支对应的第二概率;
根据所述第二概率确定所述第一概率。
8.根据权利要求5或6所述的方法,其特征在于,所述特征包括以下至少一种:
互动内容中是否包含疑问词和问号中的至少一个;
互动内容的长度;
发送互动内容的发送方的标识;
互动内容的语法是否正常;
互动内容中是否出现屏蔽词语。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
确定历史互动内容中的词语包含于被确定为目标内容的历史互动内容的第三概率,以及所述词语包含于被确定为非目标内容的历史互动内容的第四概率;
根据所述第三概率和所述第四概率,确定所述词语是否为屏蔽词语。
10.一种内容识别装置,其特征在于,包括:
第一概率确定模块,用于利用决策模型,确定针对多媒体资源的互动内容为目标内容的第一概率;
目标内容确定模块,用于将所述第一概率大于或等于概率阈值的互动内容确定为目标内容。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
突出显示模块,用于控制终端对确定为目标内容的互动内容进行突出显示。
12.根据权利要求10或11所述的装置,其特征在于,所述目标内容包括提问内容。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括:
答案确定模块,用于对确定为提问内容的互动内容,确定与所述提问内容相匹配的答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于优酷网络技术(北京)有限公司,未经优酷网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810273709.7/1.html,转载请声明来源钻瓜专利网。