[发明专利]一种文本处理方法、装置、设备及计算机存储介质在审
申请号: | 201910777842.0 | 申请日: | 2019-08-21 |
公开(公告)号: | CN110502752A | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 王妙心 | 申请(专利权)人: | 北京一链数云科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06K9/62 |
代理公司: | 44542 深圳市恒程创新知识产权代理有限公司 | 代理人: | 张小容<国际申请>=<国际公布>=<进入 |
地址: | 100000 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 问句文本 存储区域 分词结果 目标特征 特征词 预设 匹配 计算机存储介质 关联 获取目标 文本处理 用户提供 有效地 分词 提问 展示 | ||
本发明公开一种文本处理方法、装置、设备以及计算机存储介质,首先从第一待处理文本中获取目标特征词;从预设存储区域获取与第一待处理文本相匹配的第一目标问句文本,并确定与第一目标问句文本关联的第一解答文本;对第二待处理文本进行分词,从分词结果中确定第二待处理文本的特征词对应的句子成分;若分词结果中不包括目标特征词,且句子成分不包括目标句子成分,将目标特征词与第二待处理文本进行组合,生成新的第二待处理文本;从预设存储区域获取与新的第二待处理文本相匹配的第二目标问句文本,并确定与第二目标问句文本关联的第二解答文本,对第二解答文本进行展示,机器人客服在面对用户的多次提问后能够有效地向用户提供理想的解答。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种文本处理方法、装置、设备以及计算机存储介质。
背景技术
随着人工智能技术的飞速发展,NLP(Natural Language Processing,自然语言处理技术)广泛应用于企业客服服务等实际业务环境中。
然而在实际应用中,基于以上的几个功能性特点,形成了对话型交互机器人。
在文本相似度分析中,现有的分析模型大多处在理论研究和浅层的展示互动,然而在企业客服服务等实际业务环境中(例如对话型交互机器人),很难依靠企业知识库进行精准的识别和定位,普遍存在专业数据缺失的情况,无法快速有效的定位在业务场景之上。相对于长期训练的NLP所用到的大数据集,专业领域的知识库FAQ数据只能当做小样本数据集,无法满足深度学习的训练集要求。
例如,当某个用户需要向网站咨询问题时,该用户遇到的客服一开始是一个机器人,用户输入文本信息到对话框后,网站的后台会根据用户输入的文本信息进行解析,然后会根据解析结果给用户反馈一个解答文本;该用户可能会基于机器人客服第一次反馈的解答文本再次输入一个新的问题,但是这个新的问题可能存在一些语法问题或者该网站的后台数据存在专业数据缺失的情况,进而网站的后台无法正确解析该用户提出的新的问题,无法给该用户一个正确满意的答案,最终该用户需要和网站的人工客服进行电话沟通,这样不仅浪费了用户的时间,也让网站不得不雇佣更多的人工客户,进而使得人力成本增加。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供了一种文本处理方法、装置、设备以及计算机存储介质,以解决机器人客服在面对用户的多次提问时不能有效地给出理想的解答。
为实现上述目的,本发明提供了一种文本处理方法,所述方法包括以下步骤:
接收用户输入的第一待处理文本;
从所述第一待处理文本中获取目标特征词;
从预设存储区域获取与所述第一待处理文本相匹配的第一目标问句文本,并确定与所述第一目标问句文本关联的第一解答文本,对所述第一解答文本进行展示;
接收所述用户输入的第二待处理文本;
对所述第二待处理文本进行分词,从分词结果中确定所述第二待处理文本的特征词对应的句子成分;
若所述分词结果中的不包括目标特征词,且所述第二待处理文本的句子成分不包括目标句子成分,将所述目标特征词与所述第二待处理文本进行组合,生成新的第二待处理文本;
从预设存储区域获取与所述新的第二待处理文本相匹配的第二目标问句文本,并确定与所述第二目标问句文本关联的第二解答文本,对所述第二解答文本进行展示。
优选地,所述从所述第一待处理文本中获取目标特征词的步骤,包括:
基于动态规划算法对所述第一待处理文本进行分词,以使所述第一待处理文本具有多个特征词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京一链数云科技有限公司,未经北京一链数云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910777842.0/2.html,转载请声明来源钻瓜专利网。