[发明专利]基于人工智能的文章生成方法和装置有效
申请号: | 201710047782.8 | 申请日: | 2017-01-22 |
公开(公告)号: | CN106874248B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 袁洁 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F16/36 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 文章 生成 方法 装置 | ||
1.一种基于人工智能的文章生成方法,其特征在于,包括以下步骤:
根据文章语料,预先建立模板库;所述模板库包括各类别的基础框架,所述基础框架用于指示对应类别的文章中,各段落所描述的对象,以及所述段落所涉及的字段;
在用户输入的搜索词中,根据搜索词的热度,选取出目标搜索词;
根据所述目标搜索词,查询搜索词与类别的对应关系,确定所属的类别;
根据确定出的类别,选取所述模板库中与所述类别对应的目标基础框架;
在预设数据库中,根据所述目标基础框架中各段落所描述的对象和所涉及的字段进行搜索,得到对象对应的各字段内容;
在所述目标基础框架中的每一段落位置,分别对应填充搜索到的各字段内容,得到文章主体;
根据在标题库中匹配得到的所述文章主体的目标标题,以及所述文章主体,拼接生成文章。
2.根据权利要求1所述的文章生成方法,其特征在于,所述在用户输入的搜索词中,根据搜索词的热度,选取出目标搜索词,包括:
周期性或者定时查询用户历史输入的搜索词的热度;
将热度最高的搜索词确定为所述目标搜索词。
3.根据权利要求2所述的文章生成方法,其特征在于,所述热度是根据用户的点击次数、搜索次数和/或浏览时长确定的。
4.根据权利要求1-3任一项所述的文章生成方法,其特征在于,所述模板库还包括润色语句集,所述润色语句集用于指示属于同一语义的短语集合;所述得到文章主体之后,还包括:
利用所述润色语句集中的各短语,对所述文章主体中属于同一语义的短语进行随机替换。
5.根据权利要求4所述的文章生成方法,其特征在于,所述润色语句集是对所述文章语料,结合上下文进行语义分析所得到的。
6.根据权利要求1-3任一项所述的文章生成方法,其特征在于,所述模板库还包括评价性语句表,所述评价性语句表用于指示用户针对各对象的属性取值的评价结论;所述在所述目标基础框架中的每一段落位置,分别对应填充搜索到的各字段内容之后,还包括:
针对所述字段内容中所记载的对象的属性取值,查询所述评价性语句表,得到所述字段内容的评价结论;
将所述字段内容的评价结论插入到所述文章主体中。
7.根据权利要求6所述的文章生成方法,其特征在于,所述针对所述字段内容中所记载的对象的属性取值,查询所述评价性语句表,包括:
当所述目标基础框架各段落所描述的对象中,包括用于记载所述评价结论的评价对象时,针对所述字段内容中所记载的对象的属性取值,查询所述评价性语句表。
8.根据权利要求1-3任一项所述的文章生成方法,其特征在于,所述得到文章主体之后,还包括:
针对包含字符数量低于第一阈值的文章主体,进行删除或重新生成;
和/或,针对与历史文章重复率高于第二阈值的文章主体,进行删除或重新生成;
和/或,针对各段落之间语义相关性低于第三阈值的文章主体,进行删除或重新生成。
9.根据权利要求8所述的文章生成方法,其特征在于,所述第一阈值、所述第二阈值和所述第三阈值是根据用户对历史文章的操作行为所确定出的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710047782.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种报表生成方法及装置
- 下一篇:一种信息显示方法、装置及终端设备