[发明专利]话题生成方法、装置、存储介质和电子设备有效
申请号: | 202011052743.5 | 申请日: | 2020-09-29 |
公开(公告)号: | CN111897965B | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 郭林森;曹雪智;谢睿;王仲远 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/295;G06F40/35 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 魏嘉熹 |
地址: | 100190 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 话题 生成 方法 装置 存储 介质 电子设备 | ||
本公开涉及一种话题生成方法、装置、存储介质和电子设备,所述方法包括:获取用户生成内容对应的语料数据;根据所述语料数据确定至少一种场景词信息,其中,每种所述场景词信息包括多个场景词,用于表征所述语料数据的一个目标场景;针对每种所述场景词信息,确定与所述场景词信息对应的话题模板,其中,所述话题模板包括多个词填充位,每一所述词填充位分别对应于一种场景词的属性;根据所述话题模板和所述场景词信息,生成所述目标场景对应的目标话题。因此,一方面可以有效节省用户的操作,另一方面可以保证确定出目标话题与用户生成内容之间的匹配性和适应性,提供确定出的目标话题的覆盖范围,拓宽该话题使用方法的适用范围。
技术领域
本公开涉及计算机技术领域,具体地,涉及一种话题生成方法、装置、存储介质和电子设备。
背景技术
话题,也称话题标签(hashtag),常应用于社交媒体中,使用同一话题的内容会基于该话题自动聚合到一起,使得用户可以围绕同一个话题进行相关内容的讨论。
现有技术中可使用的话题通常是基于以下方式生成的:
第一种,用户编辑内容时,手动输入话题并进行内容关联。这种情况下不同的用户即使是针对同一话题中心点发表内容,但可能会因为不同用户的表述习惯而添加不同的话题标签,该话题可关联的内容有限,局限性较大。
第二种,可以根据用户手动输入的话题标签,通过自定义规则或机器学习的方式生成新的话题,该类方法所需模板依赖于大量的先验知识,成本较高,难以快速有效地进行迁移。
发明内容
本公开的目的是提供一种话题生成方法、装置、存储介质和电子设备,以提高话题生成的简便性、可用性和全面性。
为了实现上述目的,本公开提供一种话题生成方法,所述方法包括:
获取用户生成内容对应的语料数据;
根据所述语料数据确定至少一种场景词信息,其中,每种所述场景词信息包括多个场景词,用于表征所述语料数据的一个目标场景;
针对每种所述场景词信息,确定与所述场景词信息对应的话题模板,其中,所述话题模板包括多个词填充位,每一所述词填充位分别对应于一种场景词的属性;
根据所述话题模板和所述场景词信息,生成所述目标场景对应的目标话题。
可选地,所述根据所述话题模板和所述场景词信息,生成所述目标场景对应的目标话题,包括:
根据所述场景词信息中每一场景词的属性,将所述场景词添加至所述话题模板中该属性对应的词填充位,获得候选话题;
确定每一所述候选话题的匹配参数,其中,所述匹配参数用于表征该候选话题与所述目标场景的匹配程度;
根据所述匹配参数确定所述目标话题。
可选地,所述方法还包括:
在当前时刻满足模板挖掘时段要求或者接收到模板挖掘指令的情况下,根据所述语料数据中的场景词,确定话题场景词组合;
针对每一所述话题场景词组合,从所述语料数据中确定包含该话题场景词组合中的全部场景词的属性的话题语句;用所述场景词的属性来标识所述话题语句中该场景词对应的词填充位,以获得候选模板;通过模板分类模型对所述候选模板进行分类,并根据分类结果确定新挖掘的话题模板;存储所述新挖掘的话题模板;
所述确定与所述场景词信息对应的话题模板,包括:
从存储的话题模板中,将包含所述场景词信息中的全部场景词的属性的话题模板确定为与所述场景词信息对应的话题模板。
可选地,所述根据所述语料数据确定至少一种场景词信息,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011052743.5/2.html,转载请声明来源钻瓜专利网。