[发明专利]一种确定目标字符序列对应的语调信息的方法与设备有效

专利信息
申请号: 201210094554.3 申请日: 2012-04-01
公开(公告)号: CN103365896B 公开(公告)日: 2018-02-16
发明(设计)人: 张超;何径舟;王强 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06F17/20
代理公司: 北京汉昊知识产权代理事务所(普通合伙)11370 代理人: 罗朋,周建华
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 确定 目标 字符 序列 对应 语调 信息 方法 设备
【说明书】:

技术领域

发明涉及自然语言处理技术领域,尤其涉及一种用于确定目标字符序列对应的语调信息的技术。

背景技术

由于自然语言中存在很多带有声调的语言,如越南语、法语等语言,在这些语言中,字母上会有各种声调,从而更好地表达相关信息。带有声调的标准文字往往会出现在正规的场合,如各大网站的网页上等等。但是在很多场合,为了减少输入麻烦,这样的正规语言会被去掉声调,按照英文字母的形式进行输出,例如用户输入场景、各大SNS社区、BBS等都有大量的这种去声调的字符序列出现。这样无疑给计算机匹配带来巨大的困难,如果不针对去声调的字符序列进行还原,即确定该去声调的字符序列所对应的语调信息,检索系统无法通过对序列进行匹配,从而返回相关文档。在后期的其他相关语义研究,比如机器翻译、语义分析等中,也无法准确地获知用户意图,从而提供更准确更优质的服务。

因此,如何确定目标字符序列对应的语调信息,方便后续处理,提高语言处理的效率,成为本领域技术人员亟需解决的问题之一。

发明内容

本发明的目的是提供一种用于确定目标字符序列对应的语调信息的方法与设备。

根据本发明的一个方面,提供了一种由计算机实现的用于确定目标字符序列所对应的语调信息的方法,其中,该方法包括以下步骤:

a获取待确定其语调信息的目标字符序列;

b根据所述目标字符序列,在一个或多个多元语言模型中进行查询,以获得与所述目标字符序列相匹配的一个或多个语调索引信息,其中,所述语调索引信息与其在所述目标字符序列中的对应序列片段具有相同的去语调字符串;

c根据所述一个或多个语调索引信息,确定所述目标字符序列所对应的语调信息。

根据本发明的另一方面,还提供了一种用于确定目标字符序列所对应的语调信息的语调确定设备,其中,该设备包括:

序列获取装置,用于获取待确定其语调信息的目标字符序列;

索引匹配装置,用于根据所述目标字符序列,在一个或多个多元语言模型中进行查询,以获得与所述目标字符序列相匹配的一个或多个语调索引信息,其中,所述语调索引信息与其在所述目标字符序列中的对应序列片段具有相同的去语调字符串;

语调确定装置,用于根据所述一个或多个语调索引信息,确定所述目标字符序列所对应的语调信息。

根据本发明的又一方面,还提供了一种搜索引擎,包括如上所述的用于确定目标字符序列所对应的语调信息的装置。

根据本发明的再一方面,还提供了一种搜索引擎插件,包括如上所述的用于确定目标字符序列所对应的语调信息的装置。

根据本发明的再一方面,还提供了一种输入法设备,包括如上所述的用于确定目标字符序列所对应的语调信息的装置。

根据本发明的再一方面,还提供了一种输入法插件,包括如上所述的用于确定目标字符序列所对应的语调信息的装置。

与现有技术相比,本发明根据待确定其语调信息的目标字符序列,在一个或多个多元语言模型中进行查询,获得对应的一个或多个语调索引信息,进而确定该目标字符序列所对应的语调信息,方便后续处理,提高语言处理的效率。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:

图1示出根据本发明一个方面的用于确定目标字符序列对应的语调信息的设备示意图;

图2示出根据本发明另一个方面的用于确定目标字符序列对应的语调信息的方法流程图。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本发明作进一步详细描述。

图1示出根据本发明一个方面的用于确定目标字符序列对应的语调信息的设备示意图;语调确定设备1包括序列获取装置101、索引匹配装置102和语调确定装置103。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210094554.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top