[发明专利]一种新闻稿件的编辑方法及新闻稿件写稿机器人系统在审
申请号: | 201711365866.2 | 申请日: | 2017-12-18 |
公开(公告)号: | CN108073561A | 公开(公告)日: | 2018-05-25 |
发明(设计)人: | 孔祥明;黎新 | 申请(专利权)人: | 广东广业开元科技有限公司 |
主分类号: | G06F17/24 | 分类号: | G06F17/24;G06F17/27;G06F17/30 |
代理公司: | 北京科家知识产权代理事务所(普通合伙) 11427 | 代理人: | 陈娟 |
地址: | 510070 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 新闻稿件 字符串 机器人系统 采集模块 处理模块 加载模块 排序模块 新闻网页 修正模块 预置规则 调用 排序 机器人 字符串转换 语义 过滤模块 转换模块 撰写 规则库 字符库 内置 上传 串通 网页 输出 修订 转化 网络 | ||
本发明提供了一种新闻稿件的编辑方法及新闻稿件写稿机器人系统,其中,包括一种新闻稿件的编辑方法,包括如下步骤:获取网络上的新闻网页;将获取的新闻网页通过加载模块上传至写稿机器人;所述写稿机器人由内置的采集模块获取网页内的字符串;确定符合预置规则的字符串;对符合预置规则的字符串通过处理模块进行处理,撰写模块生成新闻稿件字符串,调用排序模块对新闻稿件字符串进行排序;调用修正模块对排序后的新闻稿件字符串进行修订;通过字符串转换模块转化并输出形成新闻稿件。一种新闻稿件写稿机器人系统,包括加载模块、采集模块、过滤模块、处理模块、语义字符库、撰写模块、排序模块、修正模块、转换模块以及规则库。
技术领域
本发明涉及一种电子信息技术领域,具体涉及一种写稿机器人,尤其是一种新闻稿件的编辑方法及新闻稿件写稿机器人系统。
背景技术
随着电子信息技术的发展,新闻工作越来越贴近网络的发展,现有的网络新闻主要通过人工录入,转载等,目前的新媒体、自媒体的发展越来越快,但是随之越来越越多的侵权事件发生,现有的新闻稿件主要通过人工录入,对于新媒体、自媒体来说效率慢,侵权比较严重。
发明内容
有鉴于此,本发明的主要目的是提供一种新闻稿件的编辑方法及新闻稿件写稿机器人系统。
其采用的技术方案是:
一种新闻稿件的编辑方法,其特征在于,包括如下步骤:
获取网络上的新闻网页;
将获取的新闻网页通过加载模块上传至写稿机器人;
所述写稿机器人由内置的采集模块获取网页内的字符串;
确定符合预置规则的字符串;
对符合预置规则的字符串通过处理模块进行处理,所述处理模块用于对符合预置规则的字符串进行识别和语义分析,获取符合预置规则的字符串的“时间”、“地点”、“人物”、“事件”的关键字符串;
加载词库、语义字符库以及所述关键字符串通过撰写模块生成新闻稿件字符串,
调用排序模块对新闻稿件字符串进行排序;
调用修正模块对排序后的新闻稿件字符串进行修订;
通过字符串转换模块转化并输出形成新闻稿件。
进一步地,通过以下步骤确定符合预置规则的字符串:将所述采集模块获取网页内的字符串通过设定的滤过模块进行过滤,滤除音频、视频、图片和链接的字符串组;将滤除后的字符串通过排序模块进行基础排序,对基础排序的字符串通过修正模块进行修正得到符合预置规则的字符串。
进一步地,还包括将修订的新闻稿件字符串存储至语义字符库。
进一步地,所述处理模块对符合预置规则的字符串进行识别和语义分析的步骤如下:
对符合预置规则的字符串进行识别,具体包括:
确定是否包含“时间”的字符串特征;
确定是否包含“地点”的字符串特征;
确定是否包含“人物”的字符串特征;
确定是否包含“事件”的字符串特征;
并对识别后的字符串特征进行语义分析,具体包括:
“时间”的字符串特征重复性和先后顺序;
“地点”的字符串特征重复性和先后顺序;
“人物”的字符串特征重复性和先后顺序,以及人物的描述特征;
“事件”的字符串特征重复性、热度、重点词字符串特征出现频率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东广业开元科技有限公司,未经广东广业开元科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711365866.2/2.html,转载请声明来源钻瓜专利网。