[发明专利]输出语句生成装置、方法和程序有效
申请号: | 201810166977.9 | 申请日: | 2018-02-28 |
公开(公告)号: | CN108536670B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 小町守;叶内晨;尾形朋哉;高谷智哉 | 申请(专利权)人: | 公立大学法人首都大学东京;丰田自动车株式会社 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 唐京桥;董娟 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 输出 语句 生成 装置 方法 程序 | ||
本发明涉及输出语句生成装置、方法和程序。一种用于根据多个输入关键词自动生成一个输出语句的输出语句生成装置包括:并入学习的神经网络的候选语句生成器,其被配置成接收多个关键词,并且生成均包括多个关键词中的至少一些的多个候选语句;以及评估输出器,其被配置成针对由候选语句生成器生成的多个候选语句中的每个来计算重叠比率,并且增大重叠比率小的候选语句的评估,从而从多个候选语句中确定输出语句。重叠比率是重叠词的出现次数相比于在对应候选语句中包括的全部词的出现次数。
技术领域
本公开内容涉及输出语句生成装置、输出语句生成方法以及输出语句生成程序。
背景技术
在自然语言处理系统中,使用神经网络的语句生成技术已经为人所知 (例如,参见日本未审查专利申请公开第H01-255966号)。近来,使用学习的神经网络的语句生成装置已经为人所知。当被提供有关键词时,学习的神经网络取其中适量数目的关键词来生成语句。
发明内容
当神经网络利用一些学习数据学习时,它得知包括重叠提供的关键词的语句是正确的语句。当使用以这样的方式进行学习的学习神经网络时,存在以下问题:频繁生成取其中重叠提供的关键词的语句。在实际的自然语句中,很少存在特定词重叠的情况。因此,希望较少频繁地生成包括重叠关键词的这样的语句。然而,为了实现该目的,有必要准备大量的学习数据来提高神经网络的学习准确度。这需要较大的工作量。此外,将会失去使用现有神经网络的便利性。
本公开内容提供了用于生成避免重叠关键词的输出语句的技术,从而在使用学习神经网络时给出更自然的印象。
本公开内容的第一示例方面是用于根据多个输入关键词自动生成一个输出语句的输出语句生成装置。输出语句生成装置包括:并入学习的神经网络的候选语句生成器,其被配置成接收多个关键词,并且生成均包括多个关键词中的至少一些的多个候选语句;以及评估输出器,其被配置成:针对由候选语句生成器生成的多个候选语句中的每个来计算重叠比率,并且增大重叠比率小的候选语句的评估,从而从多个候选语句中确定输出语句。重叠比率是重叠词的出现次数相对于在对应候选语句中包括的全部词的出现次数。
根据以这样的方式配置的输出语句生成装置,不需要重新调整学习的神经网络。此外,对从学习的神经网络输出的多个候选语句进行评估:它们是否包括重叠的关键词。因此,可以通过在利用现有资源的同时进行简单处理来生成避免重叠关键词的输出语句。
此外,上述评估输出器可以增大重叠比率小的候选语句的评估,针对多个候选语句中的每个计算关键词比率,并且增大关键词比率小的候选语句的评估,从而从多个候选语句中确定输出语句并且输出该输出语句。关键词比率为:多个关键词的组与对应的候选语句中包括的全部词的组的交集中的元素的数目相比于多个关键词的组与在对应候选语句中包括的全部词的组的并集中的元素的数目。以这样的方式,通过还考虑关键词比率来进行评估,可以降低可能将取其中少量关键词的语句确定为输出语句的可能性。
在这样的情况下,上述候选语句生成器连同多个候选语句中的每个一起生成评估分数N。候选语句可能被确定为输出语句的可能性越高,评价分数N的值变得越大。评估输出器计算P=1-(重叠词的出现次数)/(全部词的出现次数)作为重叠比率。评估输出器计算J=(多个关键词的组与在对应的候选语句中包括的全部词的组的交集中的元素的数目)/(多个关键词的组与在对应的候选语句中包括的全部词的组的并集中的元素的数目)作为关键词比率。评估输出器可以输出具有N×P×J的最大值的候选语句作为输出语句。以这样的方式,通过用具体的和简单的数值代替评估,可以更快地确定输出语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于公立大学法人首都大学东京;丰田自动车株式会社,未经公立大学法人首都大学东京;丰田自动车株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810166977.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文字信息处理方法、装置及终端
- 下一篇:文本数据的情感指数识别方法和系统