[发明专利]语意识别搜索的方法及系统无效
申请号: | 201210229922.0 | 申请日: | 2012-07-04 |
公开(公告)号: | CN102831157A | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | 赵勇;黄诚 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L15/00;H04L29/08 |
代理公司: | 成都虹桥专利事务所 51124 | 代理人: | 刘世平 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语意 识别 搜索 方法 系统 | ||
技术领域
本发明涉及网络搜索的方法,具体的讲是用于网络的语意识别搜索的方法及系统。
背景技术
随着网络技术、电子技术的进步,互联网上的信息内容越来越庞大。目前的互联网用户对网络信息的获取已经很习惯的于通过互联网的搜索引擎进行搜索,并在搜索出的条目中找寻与自己真实搜索目的相关的内容。
在互联网发展的早期,以雅虎为代表的网站分类目录查询非常流行。网站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下。用户查询时,通过一层层的点击来查找自己想找的网站。也有人把这种基于目录的检索服务网站称为搜索引擎,但从严格意义上讲,它并不是搜索引擎。由于互联网信息量的增长速度太快,以至于采用由人工整理维护网站分类目录的方式不可能继续。新一代搜索引擎应运而生。在数据库维护上,搜索引擎把以前被搜索的条目进行整理汇总形成数据库;搜索引擎主动抓取索引信息对数据库进行增补,进一步提高搜索数据库的覆盖范围。当用户发起搜索请求时,搜索引擎在数据库中检索“关键词”并将包含关键词的HTML链接反馈给用户。目前的各种搜索引擎都是基于这种技术建立起来的。
但无论那种搜索引擎目前都不能对“关键词”进行“语意”的理解,更不能按照“语意”去为用户搜索所需的内容。每种搜索方式的核心都是基于“关键词”的文字表达在数据库中的检索。引擎反馈给用户的HTML链接也只是包含到“关键词”的特定网页。然而用户搜索命令的含义不仅为“关键词”的文字表达那么片面,是有其内涵并且含有期待的。
譬如,搜索“北京”一词,就有以下若干可能:
小学生搜索“北京”,可能希望了解北京的历史、人文。以丰富知识;
在外地搜索“北京”,可能是正在筹划一次旅行。希望知道的可能是航班、天气、旅游行程等;
工作人员搜索“北京”,可能是有工差需要前往。希望知道的可能是工差地的吃、住、行等信息。
那么利用现有的搜索引擎来搜索,得到的结果是广泛、无区别、不具针对性的。
随着互联网用户的增多,用户的搜索需求也更加复杂。
深入分析不同用户的潜在需求,缩小搜索结果范围、提高搜索精度,是对搜索引擎提出的新要求。
发明内容
针对上述的问题,本发明提供了一种语意识别搜索的方法及系统,能够准确理解用户输入条目的语意,并根据语意为用户用尽少的步骤搜索到用户真实关注的内容。并且系统具备知识集升级的功能。
本发明语意识别搜索的方法,包括:
客户端接收搜索关键词,并将搜索关键词和用户信息发送至语意搜索系统的语意库;
所述语意库结合用户信息中的至少一个属性,将搜索关键词解析为与所述属性相关的类别关键词,并通过语意搜索系统将解析后的类别关键词通过互联网发送到搜索引擎中进行搜索;
当语意库不能结合所述属性对搜索关键词进行解析时,语意搜索系统将搜索关键词发送至人工客服处,由人工结合所述属性将搜索关键词的语意解析为相关的类别关键词,并将解析后的类别关键词通过互联网发送到搜索引擎中进行搜索;
语意搜索系统将搜索引擎搜索的结果反馈至客户端进行显示;
人工客服处由人工将本次搜索关键词、用户信息和类别关键词以关联方式存储到所述语意库中。
对用户输入的搜索关键词先通过计算机系统进行语意的分析,当计算机系统不能解析关键词针对该用户的具体含义时,计算机系统将用户信息和搜索关键词发送到人工客服处,由人工进行解析。在人工解析时,可以是客服人员根据用户信息和搜索关键词直接进行判断和理解,也可以是通过和用户语音交流进行判断,最后将人工解析的结果和用户信息存入计算机系统的语意库中,对其进行升级,使语意库以后再遇到类似的用户信息和搜索关键词时,可以自行做出相应的语意解析。通过这种计算机系统和人工结合的方式,使用户的真实搜索需求得到了最大化的正确理解,明显提高了网络搜索的针对性和搜索效率。
可选的,所述的搜索关键词为语音信息,客户端接收语音信息的搜索关键词后对其进行PCM(脉码调制)编码,并将编码后的信息发送至语音识别引擎转换为文本格式,将所述的文本格式信息反馈至客户端后,由客户端将文本格式的搜索关键词和用户信息发送至语意搜索系统的语意库。语音输入与文字输入相比明显更快捷性和方便,但语音输入后需要在客户端将输入的语音转换为文本格式以便于后续计算机和人工的处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210229922.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电脑安用椅
- 下一篇:基于混合存储器的数据读写处理方法和装置