[发明专利]一种手持设备通讯录的拼音反查方法有效
| 申请号: | 201010176188.7 | 申请日: | 2010-05-19 |
| 公开(公告)号: | CN101833381A | 公开(公告)日: | 2010-09-15 |
| 发明(设计)人: | 朱胜;姜洋;杜斌 | 申请(专利权)人: | 北京友录在线科技发展有限公司 |
| 主分类号: | G06F3/023 | 分类号: | G06F3/023 |
| 代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 余长江 |
| 地址: | 100027 北京市东*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 手持 设备 通讯录 拼音 方法 | ||
技术领域
本发明涉及一种拼音反查方法,尤其涉及一种手持设备通讯录的拼音反查方法,属于信息技术处理领域。
背景技术
随着手持设备硬件性能的进一步提升,和市场日益蓬勃的发展,手持设备第三方软件开发也在蓬勃发展。
通讯录作为移动通讯的核心功能,在人们的日常生活中发挥巨大的作用。目前手持设备通讯录中拼音反查技术只能根据汉字找到其读音,并不能区分出拼音是在姓中使用,还是在名中使用,还是普通使用,从而不利于姓名拼音的正确显示和查找。
同时,中文人名作为特别名词,其中有很大一部分汉字读音与许多与日常生活中的读音存在差异,需要专门的拼音反查词库支持。例如“单”的读音有三个“dan”,“shan”,“chan”,日常中一般使用发音“dan”,人名中使用发音“shan”,而发音“chan”只出现在单词“单于”中,因此需要对三个发音进行分级,以实现在不同场景下的使用,然而,现有的通讯录中没有给出对此问题的解决方案。
另外,人名中出现一些生僻字如“镕”,“赑”,“燚”等不包含在常用汉字字符集GB2312或GBK中,如果使用更大的字符集如GB18030,或者Unicode中的汉字,又会占用太多的空间。
由于手持设备的空间限制和运算性能要求,需要一个占用空间小,能够准确给出姓名汉字读音拼音反查库,针对手持设备的具体特点,一个完善的,完整的人名拼音反查方案亟待出现。
发明内容
针对现有技术中存在的技术问题,本发明的目的在于提供一种手持设备通讯录的拼音反查方法,实现对通讯录中人名的快速、准确查找。
本发明的方法主要是通过对手持设备通讯录的人名中使用的汉字进行统计,抽取人名常用汉字,然后为人名常用汉字中的多音字进行分级,最后对指定汉字进行拼音反查的同时返回各个拼音的分级信息。
本发明的技术方案为:
一种手持设备通讯录的拼音反查方法,其步骤为:
1)建立一汉字数组,用于存储人名中的汉字;
2)从拼音词库中获取所述汉字数组中每个具有拼音的汉字的拼音;
3)根据获取的拼音标注相应的汉字并标注每个拼音的属性信息,得到一人名拼音词库;
4)根据人名拼音库建立一拼音反查词库,所述拼音反查词库的字段包括:版本号、人名拼音词库中汉字个数、汉字节点数据、拼音节点数据;其中汉字节点的字段包括:汉字的国际通用字符集值、每个汉字拼音个数、拼音存储偏移量,拼音节点的字段包括:拼音字符串、拼音属性;
5)根据输入的汉字查找所述拼音反查词库的汉字节点,并根据汉字节点的拼音存储偏移量查找拼音字符串的存储位置,返回汉字的拼音。
进一步的,所述汉字数组的建立方法为:读取人名词库中的每一个汉字,如果该汉字没有出现在所述汉字数组中,则将其添加到所述汉字数组;读取GB2312字符表文件中的每一个汉字,如果该汉字没有出现在所述汉字数组中,则将其添加到所述汉字数组。
进一步的,所述人名拼音词库的拼音属性包括:日常使用、名中日常使用、姓中日常使用、不常用、专用。
进一步的,对于拼音属性为专用的拼音,标注该拼音的专用词组或上下文。
进一步的,所述拼音节点的字段还包括:专用拼音的词组。
进一步的,所述拼音节点的字段中拼音属性包括:常用拼音、不常用拼音、专用词组的拼音、名常用拼音、姓常用拼音。
进一步的,所述拼音的属性中每一属性设有一属性值,其中:常用的属性值>不常用拼音的属性值>名常用拼音的属性值>姓常用拼音的属性值>专用词组的拼音的属性值。
进一步的,所述汉字的国际通用字符集值为2字节整数类型、所述每个汉字拼音个数为4字节整数类型、所述拼音存储偏移量为4字节整数类型。
进一步的,采用折半查找存储每个汉字的所述汉字节点信息,并根据汉字节点的拼音存储偏移量查找拼音数据的存储位置。
进一步的,根据当前汉字使用的场景和汉字所属汉字字符串返回当前汉字的拼音,其方法为:
a)如果使用场景为姓查找,对于查找到的若干个拼音字符串,将拼音字符串属性为姓常用拼音且属性值不为零的拼音字符串返回,否则将拼音字符串属性值最大的拼音字符串返回;
b)如果使用场景为名查找,对于对于查找到的若干个拼音字符串,将拼音字符串属性为名常用拼音且属性值不为零的拼音字符串返回,否则将拼音字符串属性值最大的拼音字符串返回;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京友录在线科技发展有限公司,未经北京友录在线科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010176188.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于分合思想的并行计算硬件结构
- 下一篇:便折装式硬盘固定装置





