[发明专利]一种自动生成小说文本情感曲线并预测推荐的方法有效

专利信息
申请号: 201710377512.3 申请日: 2017-05-25
公开(公告)号: CN107193969B 公开(公告)日: 2020-06-02
发明(设计)人: 戴新宇;周启元;黄书剑;陈家骏;张建兵 申请(专利权)人: 南京大学
主分类号: G06F16/335 分类号: G06F16/335;G06F40/289
代理公司: 江苏圣典律师事务所 32237 代理人: 黄振华
地址: 210023 江苏省南*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 自动 生成 小说 文本 情感 曲线 预测 推荐 方法
【权利要求书】:

1.一种自动生成小说文本情感曲线并预测推荐的方法,其特征在于,包括如下步骤:

步骤1,从小说文本中生成小说的情感曲线;

步骤2,计算步骤1中得到的情感曲线的两两之间的动态规整距离矩阵;

步骤3,利用步骤2中得到的动态规整距离矩阵,通过改进的高斯过程给出目标文本的下载量预测;

步骤4,利用步骤2中得到的动态规整距离,将对应小说文本按距离大小从小到大排序,输出距离最近的小说标题作为推荐;

步骤1包括如下步骤:

步骤1-1,利用python的自然语言处理工具包spaCy将小说的训练文本和目标文本分词,得到文本的单词列表;

步骤1-2,将文本的单词列表按顺序分割成单词窗口,依次计算出每个单词窗口的平均情感分数;

步骤1-3,将步骤1-2中得到的情感分数依次排列,生成一组情感分数的时间序列,计算出该时间序列的移动平均序列,得到的移动平均序列即作为小说的情感曲线;

步骤1-2包括如下步骤:

步骤1-2-1,将文本的单词列表按照文本窗口大小Nw等分分割成文本窗口;

步骤1-2-2,通过labMT情感词汇表得到常用单词的情感分数映射表,形式是一个从单词到情感分数的映射函数havg(w);

步骤1-2-3,统计文本窗口中出现在情感分数映射表中的单词和所述单词出现的频数;

步骤1-2-4,通过如下公式计算每个文本窗口T的情感分数havg(T):

其中,窗口中出现在情感分数映射表中的单词分别为w1,w2,…,wN,窗口出现在表中的单词的总数为N,第i个单词wi对应的情感分数为havg(wi),第i个单词wi在文本窗口T中对应的频数为fi(T),i取值范围为1~N。

2.根据权利要求1所述的方法,其特征在于,步骤1-2-1包括如下步骤:

步骤1-2-1-1,针对文本的单词列表和需要生成的文本窗口大小Nw,计算出需要分割的文本窗口个数l=L/Nw,其中L是文本的单词列表的总长度;

步骤1-2-1-2,根据如下公式计算每个文本窗口的开始位置Tbj和结束位置Tej

Tbj=Nw×j+1,

Tej=Nw×(j+1),

其中j=1…l;

步骤1-2-1-3,依据每个文本窗口在文本单次列表中开始位置和结束位置依次生成分割后的文本窗口。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710377512.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top