[发明专利]一种从销售会话中确定会话主体角色标签的方法及系统有效
申请号: | 202111500655.1 | 申请日: | 2021-12-09 |
公开(公告)号: | CN114186559B | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 陈竑;韩三普;杨晨 | 申请(专利权)人: | 北京深维智信科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F16/335;G06F16/35;G06K9/62;G06N20/10;G06Q30/02 |
代理公司: | 北京天达知识产权代理事务所(普通合伙) 11386 | 代理人: | 许志宏 |
地址: | 100191 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 销售 会话 确定 主体 角色 标签 方法 系统 | ||
本发明公开了一种从销售会话中确定会话主体角色标签的方法,属于自然语言处理技术领域,解决了目前销售会话存在的角色标签识别效果较差的问题。该方法包括:对销售会话进行文字转录,得到多条会话片段;其中,每一会话片段对应一个会话主体,每一会话主体对应一个角色标签;根据销售会话所属领域,确定该领域中销售会话涉及的角色标签、以及各角色标签对应的正则规则库;过滤符合过滤规则的会话片段,得到备用会话片段;分别基于正则规则库方式、机器学习方式对所述备用会话片段进行角色识别,获取每一会话主体在两种方式下被识别为各角色标签的得分;根据每一会话主体在两种方式下被识别为各角色标签的得分,确定各会话主体的角色标签。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种从销售会话中确定会话主体角色标签的方法及系统。
背景技术
在销售会话系统中,获取会话音频或视频、并将会话音频或视频快速准确的转换为文本对话,是企业提取分析销售数据、进行后续决策与经营活动的重要前提。将会话音频或视频转换成文本对话中的重要的一环是:如何从多种对话行业、多个说话人身份中快速精准的确认说话人(即会话主体)角色标签。
销售领域中涉及的行业众多,相应地,说话人在销售对话系统中也有很多可能的角色。根据根对话所涉及的领域,说话人的身份可能是“猎头”、“候选人”、“售后客服”、“代理商”等中的任何一个,因此对说话人角色标签进行确认存在一定的挑战。业界的角色标签确认方案主要可分为人工确认方法与基于关键词匹配的方法,其中:
基于人工确认的方法需要在获取到文本会话内容后,通过人工介入以确认说话人角色标签。这种方法严重依赖于操作人员的经验水平与处理速度,效率低,不适合批量处理大规模会话内容,更不利于整个销售系统的自动化。
基于关键词匹配的方法通过预设一部分关键词,在获取到文本会话内容后,通过匹配关键词的方式确认说话人的角色标签。这种方法需要根据先验知识提取行业相关关键词,因此无法直接应用于新的行业及领域,扩展性较差。此外,由于说话人所处通话环境的复杂性、录音硬件的质量及业界自动语音识别技术的局限性等因素,在通过自动语音识别技术得到的文本内容的效果较差的情况下,转录文本中可能存在大量的错误文字,基于关键词的方案将难以得到良好的结果。
发明内容
鉴于上述的分析,本发明实施例旨在提供一种从销售会话中确定说话人角色标签的方法及系统,用以解决目前销售会话存在的角色标签识别效果较差的问题。
一方面,本发明公开了一种从销售会话中确定会话主体角色标签的方法,包括:
对销售会话进行文字转录,得到多条会话片段;其中,每一会话片段对应一个会话主体,每一会话主体对应一个角色标签;
根据所述销售会话所属领域,确定该领域中销售会话涉及的角色标签、以及各角色标签对应的正则规则库;
过滤符合过滤规则的会话片段,将剩余会话片段作为备用会话片段;
分别基于正则规则库方式、机器学习方式对所述备用会话片段进行角色识别,获取每一会话主体在两种方式下被识别为各角色标签的得分;
根据每一会话主体在两种方式下被识别为各角色标签的得分,确定各会话主体的角色标签。
在上述方案的基础上,本发明还做出了如下改进:
进一步,通过执行以下操作确定各会话主体的角色标签:
分别获取第i个会话主体被识别为第一角色标签、第二角色标签的综合得分FSi、FCi:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京深维智信科技有限公司,未经北京深维智信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111500655.1/2.html,转载请声明来源钻瓜专利网。