[发明专利]一种自动生成小说文本情感曲线并预测推荐的方法有效
申请号: | 201710377512.3 | 申请日: | 2017-05-25 |
公开(公告)号: | CN107193969B | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 戴新宇;周启元;黄书剑;陈家骏;张建兵 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F40/289 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 黄振华 |
地址: | 210023 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 生成 小说 文本 情感 曲线 预测 推荐 方法 | ||
1.一种自动生成小说文本情感曲线并预测推荐的方法,其特征在于,包括如下步骤:
步骤1,从小说文本中生成小说的情感曲线;
步骤2,计算步骤1中得到的情感曲线的两两之间的动态规整距离矩阵;
步骤3,利用步骤2中得到的动态规整距离矩阵,通过改进的高斯过程给出目标文本的下载量预测;
步骤4,利用步骤2中得到的动态规整距离,将对应小说文本按距离大小从小到大排序,输出距离最近的小说标题作为推荐;
步骤1包括如下步骤:
步骤1-1,利用python的自然语言处理工具包spaCy将小说的训练文本和目标文本分词,得到文本的单词列表;
步骤1-2,将文本的单词列表按顺序分割成单词窗口,依次计算出每个单词窗口的平均情感分数;
步骤1-3,将步骤1-2中得到的情感分数依次排列,生成一组情感分数的时间序列,计算出该时间序列的移动平均序列,得到的移动平均序列即作为小说的情感曲线;
步骤1-2包括如下步骤:
步骤1-2-1,将文本的单词列表按照文本窗口大小Nw等分分割成文本窗口;
步骤1-2-2,通过labMT情感词汇表得到常用单词的情感分数映射表,形式是一个从单词到情感分数的映射函数havg(w);
步骤1-2-3,统计文本窗口中出现在情感分数映射表中的单词和所述单词出现的频数;
步骤1-2-4,通过如下公式计算每个文本窗口T的情感分数havg(T):
其中,窗口中出现在情感分数映射表中的单词分别为w1,w2,…,wN,窗口出现在表中的单词的总数为N,第i个单词wi对应的情感分数为havg(wi),第i个单词wi在文本窗口T中对应的频数为fi(T),i取值范围为1~N。
2.根据权利要求1所述的方法,其特征在于,步骤1-2-1包括如下步骤:
步骤1-2-1-1,针对文本的单词列表和需要生成的文本窗口大小Nw,计算出需要分割的文本窗口个数l=L/Nw,其中L是文本的单词列表的总长度;
步骤1-2-1-2,根据如下公式计算每个文本窗口的开始位置Tbj和结束位置Tej:
Tbj=Nw×j+1,
Tej=Nw×(j+1),
其中j=1…l;
步骤1-2-1-3,依据每个文本窗口在文本单次列表中开始位置和结束位置依次生成分割后的文本窗口。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710377512.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种储物柜沙发
- 下一篇:一种多功能的旋转书架