[发明专利]自动生成新闻的系统、方法及存储介质有效
申请号: | 202210556532.8 | 申请日: | 2022-05-20 |
公开(公告)号: | CN114925668B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 陈峥;方峻;陈安龙 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F40/205;G06F40/289;G06F18/22;G06F16/958 |
代理公司: | 苏州德萃知识产权代理有限公司 32629 | 代理人: | 官玉梅 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 生成 新闻 系统 方法 存储 介质 | ||
1.一种自动生成新闻的系统,其包括客户端和服务器,所述客户端部署有新闻记者撰稿系统,所述服务器被部署为新闻服务系统,其特征在于:该自动生成新闻的系统包括:
用户引导语句模块,其被配置为接收用户输入的引导语句;
自动生成语段模块,其被配置为根据接收到的用户输入的引导语句,自动生成对应的语段;
所述用户引导语句模块指示用户输入的语段包括:价值判断句、预测分析句、批判分析句、建议导向句和总结语句;
所述自动生成语段模块被配置为执行如下步骤:
步骤s11:对用户引导词语进行分词;
步骤s12:提取分词中代表观点的词语或短语,以及确定记者对该观点的肯定/否定态度词语;
步骤s13:提取用户引导语句中表达情感强度的词;
步骤s14:根据情感强度词确定记者的价值取向,并基于这些观点词或短语、情感强度词计算高维词向量;
步骤s15:根据相似度算法从新闻综合数据库中搜索满足相似度要求的素材,并基于该些素材提取素材中与所确定的记者价值取向相一致的语段;
步骤s16:基于所提取的语段和所述高维词向量,作为训练完毕的transformer网络的输入,并将肯定/否定态度词语和观点词或短语作为权重最高主题词;且在注意力评分中加入与价值取向相反的惩罚项,并将情感强度词的量化值作为惩罚项系数:根据训练后的所述transformer网络自动生成语段。
2.根据权利要求1所述的自动生成新闻的系统,其特征在于:所述情感强度词的量化值为第一量化值和第二量化值之和,其中,将表达作者情感强烈程度的词语,通过情感强烈程度量化表进行量化,获得第一情感量化值;将表达肯定/否定态度的词语根据其强烈程度,量化成第二情感量化值。
3.根据权利要求1或2所述的自动生成新闻的系统,其特征在于:自动生成语段模块至少包括修辞风格设定模块和重写模块;所述的修辞风格设定模块根据用户对该语段的修辞风格的设定而生成对应风格的语段;所述重写模块则重新生成对应语段,以供用户选择。
4.根据权利要求3所述的自动生成新闻的系统,其特征在于:所述新闻记者撰稿系统包括多个模板以及自定义模板;所述模板为根据常见新闻报道逻辑而预先定义的且包含若干语段类型的模板;所述自定义模板中允许用户加入在预定义的多个语段类型中选择合适的语段类型。
5.根据权利要求4所述的自动生成新闻的系统,其特征在于:所述自动生成新闻的系统还包括:
构建原始数据库:该原始数据库的新闻原始数据来源至少包括记者采访数据以及互联网信息源;
对原始数据库进行数据加工处理:该数据加工至少包括数据清洗、数据筛选、结构化数据存储;
构建新闻综合数据库:将前述数据加工后的数据存储至新闻综合数据库;
搭建新闻服务系统:其包括新闻综合数据库和数据分析及新闻撰稿服务器;
建立部署在客户端上的新闻记者撰稿系统与新闻服务系统之间的通信机制。
6.根据权利要求5所述的自动生成新闻的系统,其特征在于:
在用户引导语句模块中,允许用户限定字数;并且在算法生成语段时,所生成的语段字数超过该限定字数的若干字以内时,并不对语段进行裁剪。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210556532.8/1.html,转载请声明来源钻瓜专利网。