[发明专利]确定话题点转移以及获取回复文本的方法、装置有效
申请号: | 201711390825.9 | 申请日: | 2017-12-21 |
公开(公告)号: | CN108268443B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 郭振;吴文权;刘占一 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F16/332;G06F16/33 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 话题 转移 以及 获取 回复 文本 方法 装置 | ||
1.一种确定话题点转移的方法,其特征在于,所述方法包括:
针对文本数据分析文本话题点;
利用分析得到的话题点查询预先训练得到的话题点转移模型,确定所述文本数据的转移话题点;
其中,所述针对文本数据分析文本话题点包括:
从所述文本数据中提取重要词;
对所述文本数据进行语法分析,根据所述文本数据中与所述重要词相关的语法结构内容,获取所述文本数据的话题点,所述与所述重要词相关的语法结构内容包含所述重要词以及与所述重要词具有语法结构关系的词语。
2.根据权利要求1所述的方法,其特征在于,所述从所述文本数据中提取重要词包括:
从所述文本数据中提取满足预设的词性要求的词语作为重要词;和/或,
确定所述文本数据中各词语的重要性得分,提取重要性得分满足预设得分要求的词语作为重要词。
3.根据权利要求1所述的方法,其特征在于,所述根据所述文本数据中与所述重要词相关的语法结构内容,获取所述文本数据的话题点包括:
获取所述文本数据的语法树;
根据所获取的语法树,确定与所述重要词相关的语法结构内容;
将确定出的语法结构内容进行组合,得到所述文本数据的话题点。
4.根据权利要求1所述的方法,其特征在于,所述话题点转移模型是采用如下方式预先建立的:
获取对话文本对以及各对话文本的话题点;
将各对话文本对中一个对话文本的话题点作为文本话题点,另一个对话文本的话题点作为所述文本话题点的转移话题点;
利用所获取的各文本话题点以及与各文本话题点对应的转移话题点,建立所述话题点转移模型。
5.根据权利要求1所述的方法,其特征在于,所述话题点转移模型是采用如下方式预先建立的:
获取训练数据,所述训练数据包括各话题点以及与各话题点对应的转移话题点;
将各话题点作为输入,将与各话题点对应的转移话题点作为输出,训练神经网络模型,得到所述话题点转移模型。
6.一种获取回复文本的方法,其特征在于,所述方法包括:
获取文本数据;
针对所述文本数据分析文本话题点,根据所述文本话题点确定所述文本数据的转移话题点;
将所述文本数据和转移话题点输入预先训练得到的对话生成模型,得到所述对话生成模型输出的针对所述文本数据的回复文本;
其中,所述针对所述文本数据分析文本话题点包括:
从所述文本数据中提取重要词;
对所述文本数据进行语法分析,根据所述文本数据中与所述重要词相关的语法结构内容,获取所述文本数据的话题点,所述与所述重要词相关的语法结构内容包含所述重要词以及与所述重要词具有语法结构关系的词语。
7.根据权利要求6所述的方法,其特征在于,所述根据所述文本话题点确定所述文本数据的转移话题点包括:
利用所述文本话题点查询话题点转移模型,确定所述文本数据的转移话题点。
8.根据权利要求6所述的方法,其特征在于,所述从所述文本数据中提取重要词包括:
从所述文本数据中提取满足预设的词性要求的词语作为重要词;和/或,
确定所述文本数据中各词语的重要性得分,提取重要性得分满足预设得分要求的词语作为重要词。
9.根据权利要求6所述的方法,其特征在于,所述根据所述文本数据中与所述重要词相关的语法结构内容,获取所述文本数据的话题点包括:
获取所述文本数据的语法树;
根据所获取的语法树,确定与所述重要词相关的语法结构内容;
将确定出的语法结构内容进行组合,得到所述文本数据的话题点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711390825.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语句意图预测方法及系统
- 下一篇:一种处理地址信息的方法及装置