[发明专利]基于自然语言处理的信息生成方法和装置在审
| 申请号: | 201810088663.1 | 申请日: | 2018-01-30 |
| 公开(公告)号: | CN110096694A | 公开(公告)日: | 2019-08-06 |
| 发明(设计)人: | 李雨霜;罗超;薛韬 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
| 地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 情感词 语句 方法和装置 信息生成 词表 自然语言处理 关联存储 关联关系 预设 关联 申请 | ||
1.一种基于自然语言处理的信息生成方法,包括:
获取用户对物品进行评价的原始评价语句;
基于预设的情感词表,确定出所述原始评价语句中的情感词;
确定出所述原始评价语句中的目的词;
基于各目的词和情感词的关联关系,生成评价列表,其中,所述评价列表中关联存储有各目的词以及与各所述目的词关联的情感词。
2.根据权利要求1所述的方法,其中,所述预设的情感词表包括多个预设的情感词以及与各所述预设的情感词相对应的情感倾向标识值;
在所述基于预设的情感词表,确定出所述原始评价语句中的情感词之后,所述方法还包括:
确定出所述原始评价语句中的各情感词的情感倾向标识值;以及
生成评价键值对,其中,各所述评价键值对的键为各目的词,各所述评价键值对的值基于与该键值对的目的词关联的情感词的情感倾向标识值确定。
3.根据权利要求2所述的方法,其中,在所述基于预设的情感词表,确定出所述原始评价语句中的情感词之前,所述方法还包括:
生成所述原始评价语句的语法分析树,其中,所述语法分析树包括一个根节点、至少一个与所述原始评价语句所包含的分句一一对应的中间节点,各所述中间节点包括与该中间节点所对应的分句中的各分词一一对应的叶节点;
所述基于各目的词和情感词的关联关系,生成评价列表,包括:
响应于目的词和情感词属于同一个中间节点,确定该目的词和该情感词具有所述关联关系。
4.根据权利要求3所述的方法,其中,所述基于各目的词和情感词的关联关系,生成评价列表,包括:
若其中一个中间节点仅存在情感词不存在目的词,则确定与该中间节点相邻的中间节点中的目的词与该中间节点中的情感词具有所述关联关系。
5.根据权利要求3所述的方法,其中,所述生成评价键值对包括:
判断中间节点是否包含奇数个否定词,若是,则将该中间节点所包含的情感词的情感标识值取反,作为与该情感词关联的评价键值对的值。
6.根据权利要求3所述的方法,其中,所述生成评价键值对,包括:
判断同一中间节点下,是否同时存在情感词和程度词;
若是,则基于预设的程度词与程度等级的关联关系,调整该情感词的情感倾向标识值。
7.根据权利要求2所述的方法,其中,所述方法还包括:
对于同一物品,合并与各原始评价语句对应的评价列表以生成物品评价列表;
其中,所述物品评价列表中关联存储有各目的词和从各原始评价语句中确定出的与该目的词关联的情感词。
8.根据权利要求7所述的方法,其中,所述方法还包括:
获取针对同一物品的评价键值对;
对具有相同键的键值对进行合并,生成至少一个合并键值对,其中,所述合并键值对的值为具有相同键的各键值对的值之和。
9.根据权利要求8所述的方法,其中,所述方法还包括:
按照合并键值对的值的绝对值降序排列的方式向终端呈现针对同一物品的各合并键值对。
10.一种基于自然语言处理的信息生成装置,包括:
获取单元,配置用于获取用户对物品进行评价的原始评价语句;
情感词确定单元,配置用于基于预设的情感词表,确定出所述原始评价语句中的情感词;
目的词确定单元,配置用于确定出所述原始评价语句中的目的词;
生成单元,配置用于基于各目的词和情感词的关联关系,生成评价列表,其中,所述评价列表中关联存储有各目的词以及与各所述目的词关联的情感词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810088663.1/1.html,转载请声明来源钻瓜专利网。





