[发明专利]一种信息处理方法和系统在审
申请号: | 201910976749.2 | 申请日: | 2019-10-15 |
公开(公告)号: | CN110717029A | 公开(公告)日: | 2020-01-21 |
发明(设计)人: | 康潮明 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/9535;G06N3/04;G06N3/08 |
代理公司: | 51253 成都七星天知识产权代理有限公司 | 代理人: | 袁春晓 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 原始关键词 关键词集合 文本 机器学习模型 统计结果 信息处理 文本库 预设 检索 统计 | ||
1.一种信息处理方法,包括:
获取原始关键词;
根据所述原始关键词得到关键词集合,所述关键词集合包括所述原始关键词在内的至少一个关键词;
基于所述关键词集合中的关键词从预设文本库中检索出一个或多个关键词对应文本;
用机器学习模型处理一个或多个关键词对应文本,得到一个或多个关键词的兴趣成分;
统计在所述一个或多个关键词的兴趣成分中各兴趣成分出现的频次,根据统计结果确定所述原始关键词的兴趣成分。
2.根据权利要求1所述的信息处理方法,所述根据所述原始关键词得到关键词集合包括:
确定所述原始关键词的至少一个同义词;
根据所述原始关键词和所述至少一个同义词构建所述关键词集合。
3.根据权利要求1或2所述的信息处理方法,所述根据所述原始关键词得到关键词集合包括:
获取多个候选词;
确定所述原始关键词和每个候选词的词向量;
根据所述原始关键词和每个候选词的词向量确定每个候选词与所述原始关键词的相似度;
从所述多个候选词中选出与所述原始关键词的相似度满足设定条件的至少一个候选词;
根据所述原始关键词和所选出的至少一个候选词构建所述关键词集合。
4.根据权利要求1所述的信息处理方法,所述机器学习模型为以下中的一种:
长短期记忆和条件随机场模型;
条件随机场模型;或
隐马尔可夫模型。
5.根据权利要求1所述的信息处理方法,所述兴趣成分包括利益成分,所述利益成分用于指示其对应的关键词携带利益信息。
6.根据权利要求1所述的信息处理方法,所述根据统计结果确定所述原始关键词的兴趣成分包括:
将在所述一个或多个关键词的兴趣成分中出现的频次最大的兴趣成分确定为所述原始关键词的兴趣成分。
7.一种信息处理系统,包括:
原始关键词获取模块,用于获取原始关键词;
关键词集合获取模块,用于根据所述原始关键词得到关键词集合,所述关键词集合包括所述原始关键词在内的至少一个关键词;
文本检索模块,用于基于所述关键词集合中的关键词从预设文本库中检索出一个或多个关键词对应文本;
关键词兴趣成分获取模块,用于用机器学习模型处理一个或多个关键词对应文本,得到一个或多个关键词的兴趣成分;
关键词兴趣成分确定模块,用于统计在所述一个或多个关键词的兴趣成分中各兴趣成分出现的频次,根据统计结果确定所述原始关键词的兴趣成分。
8.根据权利要求7所述的信息处理系统,所述关键词集合获取模块包括:
同义词确定单元,用于确定所述原始关键词的至少一个同义词;
关键词集合构建单元,用于根据所述原始关键词和所述至少一个同义词构建所述关键词集合。
9.根据利要求7或8所述的信息处理系统,所述关键词集合获取模块包括:
候选词获取单元,用于获取多个候选词;
词向量确定单元,用于确定所述原始关键词和每个候选词的词向量;
相似度确定单元,用于根据所述原始关键词和每个候选词的词向量确定每个候选词与所述原始关键词的相似度;
候选词筛选单元,用于从所述多个候选词中选出与所述原始关键词的相似度满足设定条件的至少一个候选词;
关键词集合构建单元,用于根据所述原始关键词和所选出的至少一个候选词构建所述关键词集合。
10.根据权利要求7所述的信息处理系统,所述机器学习模型为以下中的一种:
长短期记忆和条件随机场模型;
条件随机场模型;或
隐马尔可夫模型。
11.根据权利要求7所述的信息处理系统,所述兴趣成分包括利益成分,所述利益成分用于指示其对应的关键词携带利益信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910976749.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种剔除干扰问题对的方法及系统
- 下一篇:一种呈现电子书籍详情页的方法与设备