[发明专利]基于人工智能的新闻速报生成方法及装置有效
申请号: | 201710047783.2 | 申请日: | 2017-01-22 |
公开(公告)号: | CN106776523B | 公开(公告)日: | 2020-04-07 |
发明(设计)人: | 袁洁 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F16/34 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 新闻 生成 方法 装置 | ||
1.一种基于人工智能的新闻速报生成方法,其特征在于,包括:
基于历史新闻速报预先构建模板库,所述模板库中包括每个新闻类型用于生成新闻速报的基础框架;
确定新闻事件隶属的目标新闻类型;
根据所述目标新闻类型从所述模板库中,获取所述目标新闻类型的目标基础框架;
从预设的数据库中获取所述新闻事件的结构化数据;
根据所述结构化数据向所述目标基础框架中填充内容,得到所述新闻事件的新闻速报的正文;
根据所述正文生成所述新闻速报的标题,将所述标题与所述正文拼接形成所述新闻速报;
其中,所述基于历史新闻速报,预先构建新闻速报的模板库,所述模板库中包括每个新闻类型用于生成新闻速报的基础框架,包括:
针对同一新闻类型,对所有历史新闻速报进行提取,得到所述历史新闻速报中的结构化数据与新闻语料之间的对应关系;
利用所述历史新闻速报中的结构化数据、新闻语料以及所述对应关系形成训练集;
对所述训练集进行文本训练,挖掘各历史新闻速报中可替换的结构化数据,形成所述基础框架。
2.根据权利要求1所述的基于人工智能的新闻速报生成方法,其特征在于,所述形成所述基础框架之后,还包括:
挖掘预设数量的所述历史新闻速报中每两个描述性短语的语义相似度;
根据所述语义相似度获取表示同一语义的所有描述性短语;
利用表示同一语义的所有描述性短语生成该同一语义的润色语句集。
3.根据权利要求2所述的基于人工智能的新闻速报生成方法,所述根据所述结构化数据向所述目标基础框架中填充内容,得到所述新闻事件的新闻速报的正文之后,还包括:
利用所述润色语句集中对所述正文中的同一语义的描述性短语进行随机替换。
4.根据权利要求1所述的基于人工智能的新闻速报生成方法,其特征在于,所述形成所述基础框架之后,还包括:
对预设数量的所述历史新闻速报中的结构化数据进行挖掘,得到表示对象的结构化数据;其中,所述对象的结构化数据为名词性的结构化数据;
识别用于表示同一对象的所有结构化数据;
利用同一对象的所有结构化数据生成该同一对象的同义词表。
5.根据权利要求4所述的基于人工智能的新闻速报生成方法,所述根据所述结构化数据向所述目标基础框架中填充内容,得到所述新闻事件的新闻速报的正文之后,还包括:
利用所述同义词表中对所述正文中的同一对象的所述结构化数据进行随机替换。
6.根据权利要求1-5任一项所述的基于人工智能的新闻速报生成方法,其特征在于,所述确定新闻事件隶属的目标新闻类型,包括:
检测是否有所述新闻事件发生;
当检测到所述新闻事件后,确定所述新闻事件隶属的所述目标新闻类型。
7.根据权利要求1-5任一项所述的基于人工智能的新闻速报生成方法,其特征在于,所述根据所述结构化数据向所述目标基础框架中填充内容,得到所述新闻事件的新闻速报的正文,包括:
基于知识图谱从所述数据库中获取与所述结构化数据相关的内容;
向所述目标基础框架中填充所述结构化数据以及与所述结构化数据相关的内容,得到所述新闻速报的正文。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710047783.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种混合式的自定义手机端报表系统及方法
- 下一篇:一种多媒体批注方法和模块