[发明专利]用于确定句子的领域的方法和设备及训练方法和训练设备在审
| 申请号: | 201810295802.8 | 申请日: | 2018-04-04 |
| 公开(公告)号: | CN109388797A | 公开(公告)日: | 2019-02-26 |
| 发明(设计)人: | 闵允泓 | 申请(专利权)人: | 三星电子株式会社 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27;G06K9/62 |
| 代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 王凯霞;王兆赓 |
| 地址: | 韩国京畿*** | 国省代码: | 韩国;KR |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 嵌入式 方法和设备 输入句子 训练设备 句子 自动编码器 嵌入空间 输入特征 | ||
1.一种确定句子的领域的方法,所述方法包括:
使用自动编码器从指示输入句子的输入特征产生嵌入式特征;
基于嵌入式特征在嵌入式特征被分布的嵌入空间中的位置来确定输入句子的领域。
2.根据权利要求1所述的方法,其中,确定领域的步骤包括:
基于嵌入式特征的位置与特定位置之间的距离,来确定输入句子是领域内句子还是领域外句子。
3.根据权利要求2所述的方法,其中,自动编码器被训练,使得指示领域外句子的嵌入式特征更靠近特定位置,
确定领域的步骤包括:响应于所述距离小于阈值距离,将输入句子确定为领域外句子。
4.根据权利要求3所述的方法,其中,确定领域的步骤包括:
响应于所述距离大于阈值距离,使用自动编码器从嵌入式特征产生重建特征;
基于输入特征和重建特征来产生重建误差;
响应于重建误差大于阈值误差,将输入句子确定为领域外句子。
5.根据权利要求2所述的方法,其中,自动编码器被训练,使得指示领域内句子的嵌入式特征更靠近特定位置,
确定领域的步骤包括:
响应于所述距离大于阈值距离,将输入句子确定为领域外句子。
6.根据权利要求5所述的方法,其中,确定领域的步骤包括:
响应于所述距离小于阈值距离,使用自动编码器从嵌入式特征产生重建特征;
基于输入特征和重建特征来产生重建误差;
响应于重建误差小于阈值误差,将输入句子确定为领域外句子。
7.根据权利要求2所述的方法,其中,特定位置为嵌入空间中的原点。
8.根据权利要求2所述的方法,其中,确定领域的步骤包括:
基于嵌入式特征的位置和特定位置来计算Lp-范数或Kullback-Leibler发散度KLD;
基于Lp-范数或KLD发散度的计算来确定嵌入式特征的位置与特定位置之间的距离。
9.根据权利要求1所述的方法,其中,确定领域的步骤包括:
使用自动编码器从嵌入式特征产生重建特征;
基于输入特征和重建特征产生重建误差;
基于重建误差和嵌入式特征的位置来确定输入句子的领域。
10.根据权利要求1所述的方法,其中,嵌入式特征为自动编码器中的隐藏层的激活值或预激活值。
11.根据权利要求1所述的方法,其中,输入特征为通过神经网络从输入句子产生的特征。
12.根据权利要求1所述的方法,其中,输入特征包括:与自动编码器中的输入层对应的独热矢量、实矢量或函数中的任何一个或任何组合。
13.根据权利要求4所述的方法,其中,重建特征包括:与自动编码器中的输出层对应的独热矢量、实矢量或函数中的任何一个或任何组合。
14.根据权利要求1所述的方法,其中,确定领域的步骤包括:
基于分别对应于多个参考领域的特定位置和嵌入式特征的位置,在所述多个参考领域之中,确定输入句子的领域。
15.根据权利要求14所述的方法,其中,自动编码器被训练,使得指示分别属于所述多个参考领域的领域内句子的嵌入式特征分别更靠近特定位置,确定输入句子的领域的步骤包括:
辨识特定位置之中的最靠近嵌入式特征的位置的第二位置;
基于嵌入式特征的位置与第二位置之间的距离是否小于阈值距离,来确定输入句子是否属于与第二位置对应的第二领域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810295802.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:裁判文书的推送方法及装置
- 下一篇:大数据平台上传文本解析系统





