[发明专利]一种真实场景下用户与客服对话的数据分析方法在审
申请号: | 201811589984.6 | 申请日: | 2018-12-25 |
公开(公告)号: | CN109783623A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 杨燕;张琪;陈成才;郁建峰;战蕾;李芸;贺樑 | 申请(专利权)人: | 华东师范大学;上海智臻智能网络科技股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/34;G06F17/27;G06K9/62 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 客服系统 数据分析 真实场景 客服 场景描述信息 非结构化数据 工作效率高 场景信息 对话文本 关键信息 会话数据 文本分析 用户会话 有效挖掘 句段 文档 对话 抽取 分析 文本 智能 挖掘 便利 优化 网络 | ||
本发明公开了一种真实场景下用户与客服对话的数据分析方法,其特点是在原始会话数据中抽取用户会话的意图和重要句段,并将不同表述的相同意图聚集在一起进行文本摘要,得到同一意图的场景描述信息。本发明与现有技术相比具有从文档中提取表达整篇文章关键信息的部分,为后续的文本分析提供了极大地便利,场景信息分析正确,有效挖掘和分析大量非结构化数据,为智能客服系统提供了有效的解决方案,工作效率高,尤其是对网络客服系统的对话文本挖掘,提出了一个十分有效的优化方法,具有广泛的实用意义。
技术领域
本发明涉及文本挖掘技术领域,尤其是一种基于文本聚类和文本挖掘的真实场景下用户与客服对话的数据分析方法。
背景技术
客服部门在日常运营过程中,会产生大量的非结构化的文本数据,这些数据中往往蕴含了用户对企业产品最真实的反馈数据,客服部门在日常工作中,投入了大量的人力进行人工回复和分析。在知识爆炸的时代,人们每天都需要面对海量数据,合理利用信息,高效地处理文本提取有用的信息就变得极为重要。文本聚类是自然语言处理中的一项重要技术,它主要将大量文本语料通过机器处理,自动分成若干类别。作为一种无监督的机器学习方法,文本聚类技术不需要预先对文档手工标注类别,因此具有较强的灵活性和自动化处理能力。文本聚类已经成为对文本信息进行有效地挖掘、摘要提取的重要手段,所以利用文本摘要技术能够从文档中提取表达整篇文章关键信息的部分,为后续的文本分析提供了极大地便利,有望提升该类数据的分析与挖掘能力,不仅有望降低人工回复、分析和客服部门的日常运营成本,还能大大提升公司产品设计的优化水平。
现有技术的客服系统存在的问题是人工回复和分析,不但浪费了大量的人力资源,而且运营成本高,效率低。
发明内容
本发明的目的是针对现有技术的不足而设计的一种真实场景下用户与客服对话的数据分析方,采用意图聚类以及会话摘要技术,从文档中提取表达整篇文章关键信息的部分,有效挖掘和分析大量非结构化数据,对真实场景下用户与客服的对话进行分析,得到同一意图的场景描述信息,为智能客服系统提供了有效的解决方案,场景信息分析正确,工作效率高,尤其是对客服系统中对话文本挖掘的探索与实践,为后续的文本分析提供了极大地便利,提出了一个十分有效的优化方法,具有广泛的实用意义。
本发明的目的是这样实现的:一种真实场景下用户与客服对话的数据分析方法,其特点是采用文本聚类和文本摘要技术,对真实场景下用户与客服的对话进行分析,得到同一意图的场景描述信息,其具体分析包括下述步骤:
a)、从原始会话数据中抽取用户会话的意图;
b)、从原始会话数据中抽取重要句段;
c)、对会话意图进行聚类;
d)、对有相同意图的会话内容进行文本摘要,得到同一意图下的场景描述。
所述抽取用户会话的意图是在用户会话中抽取出用户所表达的意图,即用户遇到的问题或者发起本轮会话的原因。
所述抽取重要句段是在会话中抽取出描述场景的关键句段,真实场景下的会话噪音繁多,为了增加后续数据分析的有效性,过滤掉噪音数据。
所述聚类是将不同表述的相同意图聚集在一起。
所述文本摘要是对同一类意图下的所有会话数据进行文本摘要,得到同一意图的场景描述信息。
本发明与现有技术相比具有从文档中提取表达整篇文章关键信息的部分,为后续的文本分析提供了极大地便利,场景信息分析正确,有效挖掘和分析大量非结构化数据,为智能客服系统提供了有效的解决方案,工作效率高,尤其是对网络客服系统中对话文本挖掘的探索与实践,提出了一个十分有效的优化方法,具有广泛的实用意义。
附图说明
图1为本发明流程示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学;上海智臻智能网络科技股份有限公司,未经华东师范大学;上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811589984.6/2.html,转载请声明来源钻瓜专利网。