[发明专利]一种双语可比较语料挖掘方法及装置有效
申请号: | 201710169141.X | 申请日: | 2017-03-21 |
公开(公告)号: | CN106980664B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 洪宇;姚亮 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/58 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本发明公开了一种双语可比较语料挖掘方法及装置,通过预先从不同语言的数据库中抓取多个图片以及对应的文字信息,建立包含图片以及文字信息的多模态知识库;将源语言知识库中的图片作为查询图片,在目标语言知识库中进行图片检索,查找出与查询图片相似的目标图片;根据目标图片对应的文字信息与查询图片对应的文字信息,构建双语可比较语料。本申请采用跨媒体信息检索技术,通过图片作为沟通源语言和目标语言的媒介,进而获取源语言在目标端的等价或可比较的文本,为互联网中的双语可比较资源挖掘提供了新方法,解决了特定双语资源稀缺的问题。 | ||
搜索关键词: | 一种 双语 比较 语料 挖掘 方法 装置 | ||
【主权项】:
一种双语可比较语料挖掘方法,其特征在于,包括:预先从不同语言的数据库中抓取多个图片以及对应的文字信息,建立包含图片以及所述文字信息的多模态知识库;将源语言知识库中的图片作为查询图片,在目标语言知识库中进行图片检索,查找出与所述查询图片相似的目标图片;根据所述目标图片对应的文字信息与所述查询图片对应的文字信息,构建双语可比较语料。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710169141.X/,转载请声明来源钻瓜专利网。