[发明专利]用于学习人工智能实体的基于上下文的防火墙有效
申请号: | 201910342746.3 | 申请日: | 2019-04-26 |
公开(公告)号: | CN110460565B | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | C.A.皮科弗;K.韦尔德马里亚姆;E.A.扎莫拉杜兰 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06N20/00 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 王珊珊 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 学习 人工智能 实体 基于 上下文 防火墙 | ||
1.一种用于检测和阻止内容的计算机实现的方法,所述内容能够在学习过程期间导致人工智能AI实体向用户产生不期望的行为,所述计算机实现的方法包括:
由计算机接收一组一个或多个AI实体的输入信息;
由计算机基于从一组策略中选择的策略的规则和所学习的与信息语料库相关联的信息的特征来评估所述输入信息的特征;
由计算机确定评估所述输入信息的特征的结果是否超过预定阈值;和
响应于计算机确定评估所述输入信息的特征的结果超过预定阈值,由计算机使用防火墙、通过基于所述输入信息的上下文执行选择性过滤动作来过滤所述一组AI实体的输入信息。
2.如权利要求1所述的计算机实现的方法,还包括:
响应于计算机确定评估所述输入信息的特征的结果不超过预定阈值,由计算机经由防火墙允许所述一组AI实体接收所述输入信息以用于学习。
3.如权利要求1所述的计算机实现的方法,还包括:
由计算机学习信息的特征,所述信息的特征包括:与信息的作者相对应的语气、个性和语言表达,且所述信息与信息语料库相关联。
4.如权利要求3所述的计算机实现的方法,还包括:
由计算机基于与作者相对应的简档中与作者相关联的特征来分析所述输入信息。
5.如权利要求4所述的计算机实现的方法,还包括:
由计算机基于使用所述与作者相对应的简档分析输入信息来利用标签注释所述输入信息。
6.如权利要求1所述的计算机实现的方法,还包括:
由计算机基于在选择的策略中应用规则来计算与输入信息相对应的分数;
由计算机确定与输入信息相对应的分数是否大于分数阈值;
响应于计算机确定与输入信息相对应的分数大于分数阈值,由计算机防止将所述输入信息提供给所述一组AI实体;和
响应于计算机确定与输入信息相对应的分数不大于分数阈值,由计算机将所述输入信息提供给所述一组AI实体以用于学习。
7.如权利要求1所述的计算机实现的方法,其中,所述一组AI实体中的AI实体是AI计算机、AI工业机器人、AI拟人机器人、具有机器学习的AI服务代理、AI用户助手工具、AI顾问和AI聊天机器人中的一个。
8.如权利要求1所述的计算机实现的方法,其中,所述输入信息是书籍、讲座、视频、新闻文章、记录的语音、历史的人与人的交互、以及实时的人与AI实体交互中的一个。
9.如权利要求1所述的计算机实现的方法,其中,所述输入信息的特征包括输入信息的作者、输入信息中的负面关键词、输入信息中表达的负面情绪、不适当的手势、文化不敏感的信息、以及旨在使所述一组AI实体的评论技能有偏见的不适当信息中的一个或多个。
10.如权利要求1所述的计算机实现的方法,其中,从组群中选择所述选择性过滤动作,所述组群由防止输入信息被所述一组AI实体接收以用于学习、降低关于输入信息的适当性的权重、防止所述一组AI实体从受到危害的另一AI实体学习、向系统管理员发送警报以用于查看、更新AI输入信息过滤规则、以及将输入信息标记为不适当组成。
11.如权利要求1所述的计算机实现的方法,其中,所述计算机为用户提供图形用户界面,以选择关于用户讨厌的输入信息的特征的、不同类型的关注以用于过滤,并选择应用于每种不同类型的关注的过滤的程度。
12.如权利要求11所述的计算机实现的方法,其中,所述计算机将所学习的对应于所述用户的讨厌的输入信息特征翻译成一组规则,并且对于所述一组规则中的每个规则,所述计算机计算对应于特定规则的负面程度,并且为所述特定规则分配权重以用于过滤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910342746.3/1.html,转载请声明来源钻瓜专利网。