[发明专利]一种音字转换方法和系统有效
申请号: | 201110187942.1 | 申请日: | 2011-07-06 |
公开(公告)号: | CN102866781A | 公开(公告)日: | 2013-01-09 |
发明(设计)人: | 关毅;阎于闻 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 樊一槿 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 转换 方法 系统 | ||
1.一种音字转换方法,其特征在于,所述方法包括:
整句生成步骤,按照拼音切分路径权重计算规则,对以当前字符结尾的拼音流的所有拼音切分路径排序,选择所述所有拼音切分路径中权重值最高的第一预定数量的拼音切分路径进行整句生成;
Unigram出词步骤,对所述以当前字符结尾的拼音流的所有拼音切分路径进行Unigram出词;
处理步骤,将所述整句生成结果和所述Unigram出词结果进行去重和排序,获得所述以当前字符结尾的拼音流的音字转换结果。
2.根据权利要求1所述的方法,其特征在于,在所述整句生成步骤中,对一条拼音切分路径进行整句生成,包括以下步骤:
根据核心词库和用户词库确定当前拼音切分路径中每一个拼音对应的所有词条;
对于所述当前拼音路径中的每一个拼音,分别计算所述当前拼音切分路径下,以所述当前拼音的每一个词条结尾所对应的整句中概率最大的整句,将所述概率最大的整句对应的相关信息存储于相应的词条节点,根据预定策略选择第二预定数量的词条作为所述当前拼音的词条;
选择所述当前拼音切分路径的最后一个拼音下的所有词条节点中概率最大的词条节点,根据所述概率最大的词条节点中存储的相关信息,回溯所述当前拼音切分路径,将所述当前拼音切分路径对应的整条句子输出。
3.根据权利要求1所述的方法,其中,在所述整句生成步骤中,对一条拼音切分路径进行整句生成,包括以下步骤:
根据核心词库和用户词库确定所述当前字符对应的拼音的所有词条;
分别计算所述当前拼音切分路径下,以所述每一个词条结尾所对应的整句中概率最大的整句,将所述概率最大的整句对应的相关信息存储于相应的词条节点,根据预定策略选择第二预定数量的词条作为所述当前拼音的词条;
选择所述当前拼音切分路径的最后一个拼音下的所有词条节点中概率最大的词条节点,根据所述概率最大的词条节点中存储的相关信息,回溯所述当前拼音切分路径,将所述当前拼音切分路径对应的整条句子输出。
4.根据权利要求2或3所述的方法,其中,计算当前拼音切分路径下,以每一个词条结尾所对应的整句中概率最大的整句,包括:
根据当前词条Ai的长度确定所述当前词条的前驱拼音B;
分别计算所述前驱拼音B的每一个词条Bj到所述当前词条Ai的整句的概率;
将所述整句的概率中的最大值对应的整句作为以所述当前词条Ai为结尾所对应的整句中概率最大的整句。
5.根据权利要求4所述的方法,其中,分别计算所述前驱拼音B的每一个词条Bj到所述当前词条Ai的整句的概率,包括:
判断所述前驱拼音B的每一个词条Bj与所述当前词条Ai是否具有Bigram关系;
如果所述Bj与所述Ai具有Bigrma关系,则将所述Bj中保存的结果E(Bj),与所述Bj和所述Ai的Bigram关系的对数Log(Bigram(Bj,Ai))的和E(Bj)+Log(Bigram(Bj,Ai))作为所述Bj到所述Ai的整句的概率;
如果所述Bj与所述Ai不具有Bigrma关系,则将所述Bj中保存的结果E(Bj),与所述Bj的Alpha值的对数Log(Alpha(Bj)),以及与所述Ai的概率的对数Log(Pro(Ai))的和E(Bj)+Log(Alpha(Bj))+Log(Pro(Ai))作为所述Bj到所述Ai的整句的概率。
6.根据权利要求1所述的方法,其中,在所述Unigram出词步骤中,对所述以当前字符结尾的拼音流的一条拼音切分路径进行Unigram出词,包括以下步骤:
确定所述拼音切分路径的所有前缀;
判断每一个前缀对应的词组是否已经存在于预先建立的去重词组;
如果全部存在,则将所述所有前缀对应的词组作为所述拼音切分路径的Unigram出词结果;
如果全部不存在,则根据核心词库、用户词库以及生僻词库查询每一个前缀对应的所有词组,将所述所有词组作为所述拼音切分路径的Unigram出词结果;
如果部分存在,则根据核心词库、用户词库以及生僻词库查询不存在的每一个前缀对应的所有词组,将存在的前缀对应的词组以及所述查询获得的不存在的前缀对应的词组作为所述拼音切分路径的Unigram出词结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110187942.1/1.html,转载请声明来源钻瓜专利网。