[发明专利]基于人工智能的评论生成方法及装置、设备与可读介质有效
申请号: | 201710196125.X | 申请日: | 2017-03-29 |
公开(公告)号: | CN107133209B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 袁德璋;付志宏;何径舟;周古月;信贤卫;李朋凯;肖求根;詹金波;郑利群 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/2458 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 评论 生成 方法 装置 设备 可读 介质 | ||
1.一种基于人工智能的评论生成方法,其特征在于,所述方法包括:
从预设的分词语料库中挖掘与主题扣题的评论语句中的目标分词对齐的候选分词;所述目标分词对齐的候选分词为与所述目标分词的对齐概率大于或者等于预设概率阈值的分词;所述对齐概率用于表征两个分词的语义相接近的程度;
分别获取所述目标分词的所述候选分词对应的对齐特征、语言特征以及上下文特征;所述对齐特征用于考虑所述评论语句中的上下文对使用所述候选分词替换所述目标分词的影响;所述语言特征用来检测所述候选分词与所述评论语句中所述目标分词前相邻的两个分词的连贯性及搭配性,看所述候选分词放在所述评论语句中所述目标分词的位置,语句是否通顺,以及与所述目标分词在该位置的差别;
根据所述目标分词的所述候选分词对应的所述对齐特征、所述语言特征以及所述上下文特征以及预先训练的可行性打分模型,预测所述评论语句中所述候选分词能够替换对应的所述目标分词的可行性分值;
若所述可行性分值大于或者等于预设的可行性分数阈值,将所述评论语句中的所述目标分词替换为所述候选分词,生成所述主题对应的评论语句。
2.根据权利要求1所述的方法,其特征在于,从预设的分词语料库中挖掘与主题扣题的评论语句中的目标分词对齐的候选分词之前,所述方法还包括:
从评论库中获取与所述主题扣题的所述评论语句;
对所述评论语句进行分词处理,得到多个所述目标分词。
3.根据权利要求1所述的方法,其特征在于,从预设的分词语料库中挖掘与主题扣题的评论语句中的目标分词对齐的候选分词,具体包括:
根据预先训练的候选词挖掘模型,获取与所述评论语句中的所述目标分词与所述分词语料库中各所述分词语料的对齐概率;
从所述分词语料库的多个分词语料中获取对齐概率大于或者等于所述预设概率阈值的分词语料,作为与所述目标分词对齐的所述候选分词。
4.根据权利要求1所述的方法,其特征在于,获取所述目标分词的所述候选分词对应的对齐特征,具体包括:
分别获取所述目标分词与所述候选分词的第一对齐概率、所述目标分词对应的第一前分词与所述候选分词对应的第一前分词的第二对齐概率、所述目标分词对应的第二前分词与所述候选分词对应的第二前分词的第三对齐概率、所述目标分词对应的第一后分词与所述候选分词对应的第一后分词的第四对齐概率、以及所述目标分词对应的第二后分词与所述候选分词对应的第二后分词的第五对齐概率;其中,所述目标分词对应的第一前分词为所述目标分词与所述评论语句中所述目标分词的前相邻的第一个分词构成的分词,所述候选分词对应的第一前分词为所述候选分词与所述评论语句中所述目标分词的前相邻的第一个分词构成的分词;所述目标分词对应的第二前分词为所述目标分词与所述评论语句中所述目标分词的前相邻的两个分词构成的分词,所述候选分词对应的第二前分词为所述候选分词与所述评论语句中所述目标分词的前相邻的两个分词构成的分词;所述目标分词对应的第一后分词为所述目标分词与所述评论语句中所述目标分词的后相邻的第一个分词构成的分词,所述候选分词对应的第一后分词为所述候选分词与所述评论语句中所述目标分词的后相邻的第一个分词构成的分词;所述目标分词对应的第二后分词为所述目标分词与所述评论语句中所述目标分词的后相邻的两个分词构成的分词,所述候选分词对应的第二后分词为所述候选分词与所述评论语句中所述目标分词的后相邻的两个分词构成的分词;
根据所述第一对齐概率、所述第二对齐概率、所述第三对齐概率、所述第四对齐概率和所述第五对齐概率,生成所述目标分词的所述候选分词对应的对齐特征。
5.根据权利要求1所述的方法,其特征在于,获取所述目标分词的所述候选分词对应的语言特征,具体包括:
获取所述评论语句中所述目标分词前相邻的两个分词;
根据所述目标分词、所述目标分词前相邻的两个分词和根据评论语料库预先训练的语言模型,获取所述目标分词对应的第一语言分值;
根据所述候选分词、所述目标分词前相邻的两个分词和预先训练的语言模型,获取所述候选分词对应的第二语言分值;
根据所述第一语言分值和所述第二语言分值,生成所述目标分词的所述候选分词对应的语言特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710196125.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种实体抽取的方法及装置
- 下一篇:一种物流信息录入方法和系统