[发明专利]对信息查询编码进行中文转换的方法和系统无效
申请号: | 200810094230.3 | 申请日: | 2008-04-23 |
公开(公告)号: | CN101566989A | 公开(公告)日: | 2009-10-28 |
发明(设计)人: | 梁冰;邹学峰;蔡坚铮;黄平 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 马 浩 |
地址: | 100032*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 查询 编码 进行 中文 转换 方法 系统 | ||
技术领域
本发明属于信息应用技术领域,尤其涉及对信息查询编码进行中文转换的方法和系统。
背景技术
在信息服务领域,为了提高查询条件的输入速度,信息员(例如话务员)常常使用关键字查询编码作为查询条件以获取相应的企业播报信息。由于关键字查询编码不能直接反映汉字信息,对后续的处理造成很大困难,主要表现在:难以获得用户确切的查询条件并进行客户行为分析。例如输入关键字查询编码“jd”,该编码可能对应多个关键字:“酒店”,“家电”,“胶带”,“经典”等。关键字查询编码“jd”不能反映用户确切的查询条件,从而可能影响后续处理的效率和准确性。
此外,现有技术也难以获得确切的关键字查询频率以统计热门关键字。因为,如果直接对关键字查询编码“jd”进行统计,则难以获得确切的关键字(例如“酒店”,“家电”,“胶带”,“经典”等)的统计结果。
此外,根据所述关键字查询编码进行查询统计,难以用于指导发掘出新的关键字。
发明内容
本发明要解决的问题是提出对信息查询编码进行中文转换的方法和系统,可以提高处理效率和准确性,并获取确切的关键字统计结果。
为了解决上述问题,本发明提出对信息查询编码进行中文转换的方法,包括:接收关键字查询编码;搜索与关键字查询编码对应的企业播报信息;根据汉字和拼音的对照文件,获取与关键字查询编码对应的企业播报信息中每个汉字对应的拼音;从所述每个汉字的拼音中提取首拼作为播报记录编码;将所述播报记录编码与所述关键字查询编码所具有的相同编码确定为匹配编码;将所述匹配编码对应的所述企业播报信息的汉字确定为关键字,完成关键字查询编码到关键字的转换。
此外,还将转换后的所述关键字进行分词处理以获取多个关键字的组合。
此外,还保存所述企业播报信息与所述播报记录编码的对应关系。
此外,还保存所述关键字查询编码与所述关键字的对应关系。
根据本发明另一方面,还提出了一种对信息查询编码进行中文转换的系统,包括:
数据库,用于保存汉字和拼音的对照文件、以及企业播报信息与关键字查询编码的对应关系;
提取模块包括:第一收发单元,获取所述企业播报信息并将其传送给查询单元;以及将所述企业播报信息及其对应的播报记录编码发送给转换模块;查询单元,用于根据所述企业播报信息查询数据库中的对照文件,获取与所述企业播报信息对应的拼音全拼并发送给分拣单元;分拣单元,用于从所述每个汉字的拼音全拼中提取首拼作为播报记录编码并传输给第一收发单元;
转换模块包括:第二收发单元,用于从所述数据库中获取关键字查询编码,并接收所述提取模块发送的播报记录编码以及所述企业播报信息;以及将所述关键字查询编码和所述播报记录编码传送给比较单元,将所述企业播报信息传送给确认单元;比较单元,用于将所述播报记录编码与关键字查询编码所具有的相同编码确定为匹配编码,并将该匹配编码在所述播报记录编码中的位置信息传输给确认单元;确认单元,用于将所述企业播报信息中相应位置对应的汉字确定为关键字,完成关键字查询编码到关键字的转换。
此外,还包括分词模块,用于将所述转换模块转换后的关键字进行分词处理以获取多个关键字的组合。
此外,所述提取模块还将所述企业播报信息与所述播报记录编码的对应关系发送给所述数据库;以及所述数据库还保存所述企业播报信息与所述播报记录编码的对应关系。
此外,所述转换模块还将所述关键字查询编码与所述关键字的对应关系发送到所述数据库;以及所述数据库还保存所述关键字查询编码与所述关键字的对应关系。
与现有技术相比,本发明将已查询到的企业播报信息进行汉字到拼音的转化操作,获取对应的拼音全拼并提取每个汉字的首字母作为播报记录编码,将播报记录编码中与关键字查询编码相匹配的编码反向推导出中文汉字。本发明确定了关键字查询编码与关键字的对应关系,获得用户确切的查询条件,从而提高了查询处理的准确度和效率。
根据本发明的另一方面,在关键字较长时,还可以通过分词操作分割为多个关键字的组合以获取更加简短而准确的关键字。
根据本发明的另一方面,还可以获取确切的关键字统计结果。从而,根据所述关键字进行统计,还可以指导发掘新的关键字。
根据本发明的另一方面,还可以获得呼入电话客户的行为信息,对制定有效的搜索引擎策略具有积极意义。
根据本发明的另一方面,还可以为前端的信息采编提供有价值的数据,有针对性的采集热门信息。以及为企业提供热门关键字列表以促进企业调整服务内容。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810094230.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:高速数据记录方法
- 下一篇:一种高压对辊成型机的自动控制方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置