[发明专利]词向量的在线字典扩展在审
| 申请号: | 201910006821.9 | 申请日: | 2019-01-04 |
| 公开(公告)号: | CN110287330A | 公开(公告)日: | 2019-09-27 |
| 发明(设计)人: | 林哲;李英伟 | 申请(专利权)人: | 奥多比公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36 |
| 代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了词向量的在线字典扩展。描述了用于词向量的在线字典扩展的技术和系统,其被配置为提供现有词向量字典的在线扩展,并因此克服常规技术的失败。在一个示例中,字典扩展系统由计算系统采用以扩展词向量字典,从而以在线方式并入新词。关于现有字典中的词来针对新词估计共现信息。这通过基于现有字典和针对新词的稀疏共现信息来估计关于大的词集的共现信息而完成。所估计的共现信息被用于:通过将所估计的共现信息投射到现有的词向量字典上来估计与新词相关联的新词向量。通过合并原始字典和所估计的新词向量,经扩展的字典被创建。 | ||
| 搜索关键词: | 字典 词向量 在线字典 向量 计算系统 扩展系统 信息投射 在线方式 在线扩展 稀疏 关联 合并 失败 创建 配置 | ||
【主权项】:
1.一种在数字介质环境中用于扩展词向量字典的、由至少一个计算设备实现的方法,所述方法包括:由所述至少一个计算设备获得与词集相关联的词向量集;由所述至少一个计算设备接收未被包括在所述词集中的输入词;由所述至少一个计算设备确定所述输入词与所述词集中的一个或多个词之间的关系;由所述至少一个计算设备基于来自所述词向量集的、与所述一个或多个词相对应的一个或多个词向量来近似与所述输入词相关联的新词向量;由所述至少一个计算设备生成包括所述词向量集和所述新词向量的新的词向量集,所述新的词向量集与包括所述词集和所述输入词的新的词集相关联;以及由所述至少一个计算设备将所述新的词向量集传达到自然语言处理系统,以使所述词向量集的实例被替换为所述新的词向量集的实例。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奥多比公司,未经奥多比公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910006821.9/,转载请声明来源钻瓜专利网。





