[发明专利]内容识别方法及装置在审
申请号: | 201810273709.7 | 申请日: | 2018-03-29 |
公开(公告)号: | CN108536787A | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 陈建亮 | 申请(专利权)人: | 优酷网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 互动内容 目标内容 内容识别 多媒体资源 概率 决策模型 自动识别 | ||
本公开涉及一种内容识别方法及装置,所述方法包括:利用决策模型,确定针对多媒体资源的互动内容为目标内容的第一概率;将所述第一概率大于或等于概率阈值的互动内容确定为目标内容。根据本公开的实施例的内容识别方法,能够自动识别针对多媒体资源的互动内容的是否为目标内容,使该种互动内容易于受到关注或进行特殊处理。
技术领域
本公开涉及多媒体领域,尤其涉及一种内容识别方法及装置。
背景技术
在多媒体内容播放过程中,一些相关知识缺乏可能会让用户在播放多媒体内容过程中产生困惑,而希望得到解答。但苦于寻找答案成本太高,需求不能被很好的满足。用户可能会退出播放界面去搜索相关知识,知识获取的过程比较繁琐,用户体验较差。
部分用户可能会在评论、留言或弹幕中提出相关知识的问题,但评论、留言或弹幕数量过多,其他用户难以回答每一个问题,因此,通过评论、留言或弹幕等方式获得回答的可能性较低。
一些多媒体内容设置有专门的问答专栏,由其他用户或视频后台的工作人员来回答用户的问题,但问答专栏中问题专栏中可能有大量的非问题信息,难以逐条进行筛选。
发明内容
有鉴于此,本公开提出了一种内容识别方法及装置。
根据本公开的一方面,提供了一种内容识别方法,所述方法包括:
利用决策模型,确定针对多媒体资源的互动内容为目标内容的第一概率;
将所述第一概率大于或等于概率阈值的互动内容确定为目标内容。
在一种可能的实现方式中,所述方法还包括:
控制终端对确定为目标内容的互动内容进行突出显示。
在一种可能的实现方式中,所述目标内容包括提问内容。
在一种可能的实现方式中,所述方法还包括:
对确定为提问内容的互动内容,确定与所述提问内容相匹配的答案。
在一种可能的实现方式中,所述决策模型包括决策节点,每个决策节点具有判断分支,每个决策节点对应于用于判断所述互动内容是否为目标内容的一个特征。
在一种可能的实现方式中,所述方法还包括:
确定对作为训练样本的历史互动内容进行分类而产生的信息熵,其中,所述分类是根据所述历史互动内容是否为所述目标内容而进行的;
以上一级决策节点的判断分支作为条件,分别确定所述历史互动内容的尚未作为决策节点的各特征的条件熵;
根据所述信息熵和所述各特征的条件熵,分别确定所述各特征的信息增益;
将所述信息增益最大的特征确定为作为条件的所述判断分支的下一级决策节点,并确定该下一级决策节点的各判断分支对应的第二概率,其中,所述第二概率是符合该下一级决策节点的各判断分支的历史互动内容为所述目标内容的概率;
在满足训练条件时,将所有决策节点组成的决策模型作为最终的决策模型。
在一种可能的实现方式中,利用决策模型,确定针对多媒体资源的互动内容为目标内容的第一概率,包括:
确定所述互动内容所满足的所述决策模型的各个判断分支;
确定所满足的各个所述判断分支对应的第二概率;
根据所述第二概率确定所述第一概率。
在一种可能的实现方式中,所述特征包括以下至少一种:
互动内容中是否包含疑问词和问号中的至少一个;
互动内容的长度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于优酷网络技术(北京)有限公司,未经优酷网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810273709.7/2.html,转载请声明来源钻瓜专利网。