[发明专利]基于AI训练的词汇过滤方法及系统有效
申请号: | 202111285459.7 | 申请日: | 2021-11-02 |
公开(公告)号: | CN113722468B | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 陈芳芳 | 申请(专利权)人: | 杭银消费金融股份有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F40/216;G06F40/30 |
代理公司: | 浙江维创盈嘉专利代理有限公司 33477 | 代理人: | 龚洋洋 |
地址: | 310005 浙江省杭州市下城区庆春路38号1层101*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ai 训练 词汇 过滤 方法 系统 | ||
1.一种基于AI训练的词汇过滤方法,其特征在于,应用于词汇过滤系统,所述方法包括:
依据对第一待处理文本会话事件提取的会话段落集,确定所述会话段落集中热点词汇的使用分布情况;通过所述会话段落集中热点词汇的使用分布情况,确定在设定统计阶段内添加到所述第一待处理文本会话事件的第一热频词汇总结果和与所述第一待处理文本会话事件存在上下游关系的第二热频词汇总结果;通过所述第一热频词汇总结果和所述第二热频词汇总结果,建立针对第二待处理文本会话事件下待分析语句的AI过滤策略;其中,所述第二待处理文本会话事件为以下至少一项:与所述第一待处理文本会话事件一致;与所述第一待处理文本会话事件存在绑定关系的衍生文本会话事件;
其中,所述第一待处理文本会话事件包括设定会话场景内的第一交互主题,所述通过所述第一热频词汇总结果和所述第二热频词汇总结果,建立针对第二待处理文本会话事件下待分析语句的AI过滤策略,包括:通过所述第一热频词汇总结果和所述第二热频词汇总结果,确定所述第一交互主题在所述设定统计阶段内的访问统计结果;
通过所述第一交互主题在所述设定统计阶段内的访问统计结果,建立针对所述第二待处理文本会话事件下待分析语句的AI过滤策略;
其中,当所述第一交互主题包括两个或多于两个时,所述通过所述第一交互主题在所述设定统计阶段内的访问统计结果,建立针对第二待处理文本会话事件下待分析语句的AI过滤策略,包括:通过所述第一交互主题中每个交互主题在相同汇总计划下匹配的访问统计结果,以及所述每个交互主题在所述相同汇总计划下需要进行词汇过滤分析的语句,建立针对所述第二待处理文本会话事件下待分析语句的AI过滤策略;
其中,所述通过所述第一交互主题中每个交互主题在相同汇总计划下匹配的访问统计结果,以及所述每个交互主题在所述相同汇总计划下需要进行词汇过滤分析的语句,建立针对所述第二待处理文本会话事件下待分析语句的AI过滤策略,包括:通过所述每个交互主题在相同汇总计划下匹配的访问统计结果,从所述第一交互主题中确定第一目标交互主题和第二目标交互主题,所述第一目标交互主题为所述第一交互主题中最小访问统计结果匹配的交互主题,所述第二目标交互主题为所述第一交互主题中最大访问统计结果匹配的交互主题;将所述第一目标交互主题作为所述第二待处理文本会话事件,通过所述第二目标交互主题内需要进行词汇过滤分析的语句,建立针对所述第二待处理文本会话事件下待分析语句的分治化过滤策略;
当所述第一交互主题为一个时,所述通过所述第一交互主题在所述设定统计阶段内的访问统计结果,建立针对第二待处理文本会话事件下待分析语句的AI过滤策略,包括:通过所述第一交互主题在不同汇总计划下分别匹配的访问统计结果,以及所述第一交互主题在不同汇总计划下分别需要进行词汇过滤分析的语句,建立针对所述第二待处理文本会话事件下待分析语句的AI过滤策略;
其中,所述通过所述第一交互主题在不同汇总计划下分别匹配的访问统计结果,以及所述第一交互主题在不同汇总计划下分别需要进行词汇过滤分析的语句,建立针对所述第二待处理文本会话事件下待分析语句的AI过滤策略,包括:在所述第一交互主题在不同汇总计划集内分别需要进行词汇过滤分析的语句一致的前提下,通过所述第一交互主题在不同汇总计划下分别匹配的访问统计结果,确定所述第一交互主题需要进行词汇过滤分析的语句匹配的目标词汇过滤条件;所述目标词汇过滤条件匹配的访问统计结果不小于设定访问统计结果判定值;
通过所述目标词汇过滤条件,建立在所述目标词汇过滤条件针对所述第二待处理文本会话事件下待分析语句的AI过滤策略;
其中,所述通过所述第一交互主题在不同汇总计划下分别匹配的访问统计结果,以及所述第一交互主题在不同汇总计划下分别需要进行词汇过滤分析的语句,建立针对所述第二待处理文本会话事件下待分析语句的AI过滤策略,包括:在所述第一交互主题在不同汇总计划集内分别需要进行词汇过滤分析的语句不一致的前提下,通过所述第一交互主题在不同汇总计划下分别匹配的访问统计结果,确定所述第一交互主题在不同汇总计划需要进行词汇过滤分析的语句与对应词汇过滤条件之间的相关性系数;基于确定的所述相关性系数,建立在衍生词汇过滤条件针对所述第二待处理文本会话事件下待分析语句的AI过滤策略;
其中,所述通过所述第一热频词汇总结果和所述第二热频词汇总结果,确定第一交互主题在所述设定统计阶段内的访问统计结果,包括:通过所述第一热频词汇总结果和所述第二热频词汇总结果,得到全局频词汇总结果;将所述第一热频词汇总结果和所述全局频词汇总结果的量化分析结果,作为所述第一交互主题在所述设定统计阶段内的访问统计结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭银消费金融股份有限公司,未经杭银消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111285459.7/1.html,转载请声明来源钻瓜专利网。