[发明专利]一种字符处理方法和装置在审
申请号: | 201610004549.7 | 申请日: | 2016-01-04 |
公开(公告)号: | CN105701074A | 公开(公告)日: | 2016-06-22 |
发明(设计)人: | 王冠 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22 |
代理公司: | 北京成创同维知识产权代理有限公司 11449 | 代理人: | 蔡纯;张靖琳 |
地址: | 100080 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字符 处理 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,具体地,涉及一种字符处理方法和字 符处理装置。
背景技术
随着互联网应用的普及,越来越多的用户喜欢在各种应用的输入文 本中使用emoji符号(表情符号)来表达心情和想法。针对这种趋势, 统一码联盟(UnicodeConsortium)为每个emoji符号创建了对应的unicode 码。统一码联盟最新发布的Unicode8.0版本总共含有7716个脚本和符 号。其中,emoji符号新增37个,另还有4个emoji表情得到了更改。 除了食物、大型飞鸟之外,Unicode8.0还涉及到笑脸、宗教以及多种运 动符号。
但对于使用MySQL的应用来说,新增的emoji符号可能造成数据 库应用异常。这是因为5.6以下版本的MySQL数据库在使用UTF8字符 集时最多使用三个字节存储emoji符号,导致部分emoji符号信息丢失。 例如,目前苹果移动终端的操作系统支持新版的Unicode编码,导致客 户通过苹果移动终端提交的京东反馈表(包含emoji符号)不能正确的 保存和检索。
目前已有的一种处理emoji符号的解决方式是将用户提交的字符串 过滤掉长度为4个字节的emoji符号,剩余字符串转换成新的字符串存 储到数据库。此种方式导致emoji表情信息丢失。
另外一种处理emoji符号的解决方式是升级MySQL到5.6或更高版 本,并且将数据库字符集切换至utf8mb4。这种方式虽然能够解决以后 的emoji符号的存储问题,但是可能造成现有数据库中的数据乱码, MySQL的效率也可能随之降低。
发明内容
有鉴于此,本发明提供一种字符处理方法和处理装置,以解决上述 问题。
根据本发明的第一方面,提供一种字符处理方法,包括:从输入设 备接收文本内容;识别所述文本内容中的第一字符;将所述第一字符转 换为特殊字符串;将所述特殊字符串存储到数据库。
优选地,所述识别所述文本内容中的第一字符包括:将所述文本内 容由当前的编码格式转换为unicode编码格式;从所述unicode编码格式 的文本内容中识别所述第一字符。
优选地,所述从unicode编码格式的文本内容中识别所述第一字符 包括根据unicode码表通过正则表达式匹配获得所述第一字符。
优选地,所述当前编码格式包括UTF8、GBK2312。
优选地,所述特殊字符串包含当前的编码格式的所述第一字符。
优选地,所述第一字符为emoji字符。
优选地,所述第一字符为第一类型的emoji字符。
优选地,所述数据库为MySQL数据库。
优选地,还包括:从数据库中读取所述特殊字符串;将所述特殊字 符串转换为第一字符。
根据本发明的第二方面,提供一种字符处理装置,包括:接收模块, 用于从输入设备接收文本内容;识别模块,用于识别所述文本内容中的 第一字符;第一转换模块,用于将所述第一字符转换为特殊字符串;存 储模块,用于将所述特殊字符串存储到数据库。
优选地,所述识别模块包括:第一转换单元,用于将所述文本内容 由当前的编码格式转换为unicode编码格式;判定单元,用于从所述 unicode编码格式的文本内容中识别所述第一字符。
优选地,所述第一字符为emoji字符。
优选地,所述第一字符为第一类型的emoji字符。
优选地,所述数据库为MySQL数据库。
优选地,还包括:读取模块,用于从数据库中读取所述特殊字符串; 第二转换模块,用于将所述特殊字符串转换为第一字符。
本发明实施例提供一种字符处理方法,包括:从输入设备接收文本 内容;识别所述文本内容中的第一字符;将所述第一字符转换为特殊字 符串;将所述特殊字符串存储到数据库。该方法将现有数据库无法正确 处理的特殊字符转换为字符串处理。该方法使得现有的基于MySQL早 期版本的应用能够在不升级MySQL版本的基础上,正确存储和展示 emoji字符,保证系统的稳定运行。同时提供一种相应的字符处理装置。
附图说明
通过参照以下附图对本发明实施例的描述,本发明的上述以及其它 目的、特征和优点将更为清楚,在附图中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610004549.7/2.html,转载请声明来源钻瓜专利网。