[发明专利]基于自然语言处理的物品应用分析方法及系统有效
| 申请号: | 202010518566.9 | 申请日: | 2020-06-09 |
| 公开(公告)号: | CN111680499B | 公开(公告)日: | 2023-10-17 |
| 发明(设计)人: | 崔亿萍 | 申请(专利权)人: | 北京启云数联科技有限公司 |
| 主分类号: | G06F40/279 | 分类号: | G06F40/279;G16H80/00;G16H70/40;G06N3/08 |
| 代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 屠晓旭;宋宝库 |
| 地址: | 100086 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 自然语言 处理 物品 应用 分析 方法 系统 | ||
1.一种基于自然语言处理的物品应用分析方法,其特征在于,所述方法包括:
获取与目标物品相关的交流对象的交流数据,所述交流数据包括多个交流对象标识以及每个交流对象标识各自对应的对话信息;
根据每个交流数据中每句对话信息各自对应的交流顺序,生成在所述每个交流数据中每句对话信息各自对应的对话序号;获取每个交流数据的特征信息并根据所述特征信息分别设置在所述每个交流数据中每句对话信息各自对应的唯一标识符;
对每个交流数据中的对话信息进行数据清洗,随后获取在所述数据清洗后的对话信息中具有相同唯一标识符的对话信息,以及根据对话序号对所述具有相同唯一标识符的对话信息进行排序并根据排序结果生成待处理交流数据;所述待处理交流数据包括根据对话序号排列的数据清洗后的对话信息,以及每句对话信息各自对应的交流对象标识和对话序号;
根据预设的神经网络分类模型对所述待处理交流数据进行目标物品推荐类别识别,根据识别结果输出目标物品的应用状态。
2.根据权利要求1所述的基于自然语言处理的物品应用分析方法,其特征在于,
所述获取每个交流数据的特征信息,具体包括:
获取每个交流数据的来源信息;
判断是否存在具有相同来源信息的交流数据;
若不存在具有相同来源信息的交流数据,则直接将所述来源信息作为交流数据的特征信息;
若存在具有相同来源信息的交流数据,则获取每个交流数据中交流对象的对象特征,对每个交流数据各自对应的来源信息与对象特征进行信息组合并将信息组合结果作为每个交流数据各自对应的特征信息;
并且/或者,
所述对每个交流数据中的对话信息进行数据清洗,具体包括:
清除对话信息中与交流对象的交流内容无关的杂乱信息,对清除杂乱信息后的对话信息分别进行信息去重处理;
获取对话信息中的标点符号,将所述标点符号中除问号以及句号以外的其他标点符号均设置为逗号,随后根据每个标点符号的语义信息分别将每个标点符号转换成相应的文字信息。
3.根据权利要求1所述的基于自然语言处理的物品应用分析方法,其特征在于,
当所述物品是药品时,所述根据预设的神经网络分类模型对所述待处理交流数据进行目标物品推荐类别识别,具体包括:
获取所述待处理交流数据中包含目标药品的对话信息并将所述对话信息作为第一目标对话信息;
获取所述第一目标对话信息的交流对象标识符;
若所述交流对象标识符是医生,则根据预设的神经网络分类模型对所述第一目标对话信息进行目标药品推荐类别识别;
若所述交流对象标识符是患者,则选取包含问号的第一目标对话信息作为第二目标对话信息,获取在所述待处理交流数据中对话序号排列在所述第二目标对话信息的对话序号之后且交流对象标识符是医生的对话信息,根据预设的神经网络分类模型对获取到的对话信息进行目标药品推荐类别识别;
并且/或者,
所述根据预设的神经网络分类模型对所述待处理交流数据进行目标物品推荐类别识别,具体包括:
获取预设训练集中的交流数据样本,所述交流数据样本包括物品推荐类别信息、根据对话序号排列的数据清洗后的对话信息以及每句对话信息各自对应的交流对象标识和对话序号;
基于所述交流数据样本并利用机器学习算法对预先构建的神经网络分类模型进行模型训练;
根据模型训练后的神经网络分类模型对所述待处理交流数据中的目标物品进行推荐类别识别,得到目标物品对应的推荐类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京启云数联科技有限公司,未经北京启云数联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010518566.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电子病历的内涵质控方法及装置
- 下一篇:一种自稳式船舶舷梯系统及控制方法





