[发明专利]使用深度学习模型识别内容项在审
| 申请号: | 201680064575.7 | 申请日: | 2016-02-18 |
| 公开(公告)号: | CN108292309A | 公开(公告)日: | 2018-07-17 |
| 发明(设计)人: | 巴尔马诺哈尔·帕卢里;奥伦·里佩尔;彼得·多拉尔;卢博米尔·蒂米特罗瓦·布德夫 | 申请(专利权)人: | 脸谱公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/08;G06F15/18;G06Q50/30 |
| 代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 梁丽超;刘彬 |
| 地址: | 美国加*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 内容项 聚类 嵌入空间 嵌入 多个属性 模型识别 嵌入的 关联 学习 | ||
在一个实施例中,一种方法可包括接收第一内容项。第一内容项的第一嵌入可以被确定并且可以对应于嵌入空间中的第一点。嵌入空间可以包括对应于第二内容项的多个第二嵌入的多个第二点。使用深度学习模型来确定嵌入。点位于嵌入空间中的一个或多个聚类中,每个聚类与一类内容项相关联。聚类内的点的位置可以基于各个对应内容项的一个或多个属性。可以基于第一点和第二点的位置以及对应于所识别的第二内容项的第二点所位于的特定聚类来识别与第一内容项相似的第二内容项。
本申请根据35U.S.C.U119(e)要求于2015年11月5日提交的美国临时专利申请号62/251352的权益,该申请通过引用并入本文。
技术领域
本公开总体涉及训练深度学习模型。
背景技术
深度学习是可涉及在受监督或无监督设置中训练模型的一种机器学习类型。深度学习模型可被训练来学习数据的表示。作为实例并非限制性方式,深度学习模型可将数据表示为强度值的向量。深度学习模型可用于数据分类。分类可涉及通过训练深度学习模型来确定数据点属于哪个类别集合。
发明内容
在具体实施例中,系统可使用深度学习模型来识别与输入的内容项相似的一个或多个内容项。可以对深度学习模型进行训练,以将内容项映射到多维嵌入空间中的嵌入。每一嵌入可对应于嵌入空间中的点的坐标。可以对深度学习模型进行训练以生成内容项的嵌入,使得属于相同类的内容项位于嵌入空间中的相同点聚类中。可进一步训练深度学习模型以基于内容项的一个或多个属性来生成内容项的嵌入,其将内容项放置在聚类内的特定位置处。
内容项的嵌入可用于完成任何数量的合适任务。作为示例而不是限制的方式,系统可以采用搜索算法来识别嵌入空间中的、作为接近搜索查询的内容项的一个或多个嵌入。系统可以确定所识别的嵌入的内容项与搜索查询相似。在具体实施例中,可以响应于所接收的、用户在客户端系统输入的搜索查询识别内容项。所识别的内容项可作为在运行在客户端系统上的应用程序(例如,消息传送平台、与社交网络系统相关联的应用程序或任何其他合适的应用程序)的界面上的建议而显示给用户。
在具体实施例中,第二内容项可以被识别(例如,响应于包括第一内容项的搜索查询)并且可以在嵌入空间中具有接近于第一内容项的嵌入(例如,所识别的第二内容项可以是与第一内容项相关和/或相似的实体或者数据对象)。所识别的第二内容项可被高速缓存或预高速缓存。作为示例而不是限制的方式,可以为一个或多个用户或者一个或多个客户端系统单独地缓存或者预缓存所识别的接近第一内容项的第二内容项。作为示例而非限制,高速缓存或预高速缓存可以在服务器侧或在客户端侧被实现或执行用于一个或多个特定用户或用于每个用户。高速缓存或预高速缓存可允许更快地访问内容项。作为示例而不是限制的方式,如果相应用户请求内容项或者如果服务器向用户(例如,向用户的客户端系统)推送推荐(例如,识别的第二内容项),则可以快速访问内容项(例如,识别的与第一内容项相关或相似的第二内容项)。通过使用所提出的方法,可以将与所获得或者接收的第一内容项有关的内容项(例如,存储在作为实例而非限制性方式的社交网络系统的计算系统的一个或多个数据库内的数据对象)识别为来自用户或者客户端系统的搜索查询是可能的。所识别的第二内容项可各自与被访问的概率相关联。在具体实施例中,可以基于访问的概率超过某个最小概率选择第二内容项。高速缓存或预先高速缓存这样的内容项或对象在避免无用高速缓存和/或减少数据流量方面可能是有效的,和/或在改善访问相应内容项或数据对象的速度或访问时间方面是有效的。在所有可能的内容项(例如,数十亿个内容项)中,在每个搜索中可仅发现内容项的子集相关。通过使用所提议的方法,相关内容项的子集可以被发送到客户端系统或由客户端系统高速缓存或预高速缓存。相关内容项,包括作为示例而不是作为限制,被确定为与第一内容项相似(例如,在嵌入空间中接近于第一内容项)的第二内容项,可以通过在嵌入空间中执行搜索(例如,距离搜索)来快速地获得和/或识别第一内容项。在具体实施例中,实体的聚类可以基于所使用的相应数据库。换言之,聚类可以是特定于数据库的。作为示例而非限制性方式,可以基于所提议的方法针对社交网络系统的一个或多个用户执行相关实体的聚类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于脸谱公司,未经脸谱公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680064575.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:根据移动习惯为用户推荐车辆/乘客资源
- 下一篇:用于数字实体相关的技术





