[发明专利]文章内容转换方法和装置在审
申请号: | 201811366388.1 | 申请日: | 2018-11-16 |
公开(公告)号: | CN111274767A | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 张之硕;王亚波 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F40/151 | 分类号: | G06F40/151;G06F16/9535 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张晓霞;刘芳 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文章内容 转换 方法 装置 | ||
1.一种文章内容转换方法,其特征在于,包括:
获取用户触发的文章读取请求,所述文章读取请求中携带有所述用户的用户标识和请求读取的文章的文章标识;
根据所述用户标识,调取所述用户的用户向量,所述用户向量是根据所述用户的个人信息生成的;
根据所述用户向量、所述文章标识和转换模型,对所述文章的内容进行转换。
2.根据权利要求1所述的方法,其特征在于,所述根据所述用户标识,调取所述用户的用户向量之前,所述方法还包括:
根据所述用户的个人信息,采用词嵌入技术生成所述用户向量。
3.根据权利要求1所述的方法,其特征在于,所述根据所述用户向量、所述文章标识和转换模型,对所述文章的内容进行转换,包括:
根据所述文章标识,调取所述文章;
根据所述用户向量和转换模型,对所述文章的内容进行转换。
4.根据权利要求1所述的方法,其特征在于,所述根据所述用户向量和转换模型,对所述文章的内容进行转换之前,所述方法还包括:
获取所述文章中带有标记信息的内容;
相应的,所述根据所述用户向量和转换模型,对所述文章的内容进行转换,包括:
根据所述用户向量和转换模型,对所述带有标记信息的内容进行转换。
5.根据权利要求4所述的方法,其特征在于,所述根据所述用户向量和转换模型,对所述带有标记信息的内容进行转换,包括:
判断所述带有标记信息的内容是词语还是语句;
若所述带有标记信息的内容是词语,则根据所述用户向量和词袋模型CBOW,确定所述带有标记信息的内容被转换后的目标词语;
将所述带有标记信息的内容替换为目标词语;
若所述带有标记信息的内容是语句,则根据所述用户向量和序列转换模型Seq2Seq,确定所述带有标记信息的内容被转换后的目标语句;
将所述带有标记信息的内容替换为目标语句。
6.根据权利要求5所述的方法,其特征在于,所述根据所述用户向量和词袋模型CBOW,确定所述带有标记信息的内容被转换后的目标词语,包括:
根据所述带有标记信息的内容的上下文所包含的词语,预测至少一个候选词语;
获取所述至少一个候选词语中每个候选词语对应的词向量;
根据每个候选词语对应的词向量和所述用户向量在欧式空间中的距离,确定所述目标词语。
7.根据权利要求5所述的方法,其特征在于,所述根据所述用户向量和序列转换模型Seq2Seq,确定所述带有标记信息的内容被转换后的目标语句,包括:
将所述带有标记信息的内容的上下文所包含的语句输入所述序列转换模型Seq2Seq,将所述序列转换模型Seq2Seq输出的语句作为所述目标语句。
8.根据权利要求1-7任一项所述的方法,其特征在于,还包括:
对转换后的文章采用语义语法规则进行校验。
9.一种文章内容转换装置,其特征在于,包括:
获取模块,用于获取用户触发的文章读取请求,所述文章读取请求中携带有所述用户的用户标识和请求读取的文章的文章标识;
调取模块,用于根据所述用户标识,调取所述用户的用户向量,所述用户向量是根据所述用户的个人信息生成的;
转换模块,用于根据所述用户向量、所述文章标识和转换模型,对所述文章的内容进行转换。
10.根据权利要求9所述的装置,其特征在于,还包括:
生成模块,用于根据所述用户的个人信息,采用词嵌入技术生成所述用户向量。
11.根据权利要求9所述的装置,其特征在于,所述转换模块包括:调取单元和转换单元;
所述调取单元,用于根据所述文章标识,调取所述文章;
所述转换单元,根据所述用户向量和转换模型,对所述文章的内容进行转换。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811366388.1/1.html,转载请声明来源钻瓜专利网。