[发明专利]歌曲搜索中非语义、非词组的切换方法有效
| 申请号: | 201310211199.8 | 申请日: | 2013-05-31 |
| 公开(公告)号: | CN104216892B | 公开(公告)日: | 2018-01-02 |
| 发明(设计)人: | 王志常 | 申请(专利权)人: | 亿览在线网络技术(北京)有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
| 代理公司: | 北京亿腾知识产权代理事务所11309 | 代理人: | 陈霁 |
| 地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 歌曲 搜索 中非 语义 词组 切换 方法 | ||
1.一种信息处理方法,其特征在于包括以下步骤:
1)建立属性词典,根据需要查询的信息的属性,建立相应的属性词典,将属性词典存储到相应的属性词典存储模块,其中,所述的信息为歌曲信息,歌曲信息具体为歌手名、歌曲名和专辑名;
2)通过查询信息接收模块接收用户的查询信息,并将查询信息存储到相应的查询信息存储模块,
3)对接收到的查询信息进行首次判断,即判断是否属于最近预定时间段查询过的信息,如果是,则直接将最近的查询结果显示在显示模块上,同时将查询结果存储到查询信息存储模块中;
4)对接收到的查询信息进行第二次判断,判断查询信息是否属于属性词典中的信息,如果是,则将词典信息存储模块中存储的结果显示在显示模块上;
5)在判断不属于属性词典中的信息后,对接收到的查询信息采用复式切词模块进行复式切词,其中,采用复式切词模块进行复式切词具体指采取将一元词和二元词交叠出现,每个二元词是两边的一元词的组合;
6)采用搜索模块进行搜索;
7)将搜索到的结果显示在显示模块上。
2.根据权利要求1所述的信息处理方法,其特征是:所述步骤5)中的复式切词为混合切词,即一元切词和二元切词顺次交叠出现,每个二元词是两边的一元词的组合。
3.根据权利要求2所述的信息处理方法,其特征是:所述步骤5)中的复式切词为根据两个词在文档库中的相关度进行切词,同时根据其各自的TF/IDF得分,进行相应的丢弃。
4.根据权利要求1或2所述的信息处理方法,其特征是:所述步骤6)中搜索首先是按照二元词依次进行搜索和归并,如果根据前后的一元词的文档列表长度判断二元词文档列表过短,则将针对该二元词的搜索和归并转换为对前后两个一元词的搜索和归并。
5.一种信息处理装置,用于对信息搜索领域中的信息进行复式切词,并将结果快速准确的显示,该装置包括以下模块:
属性词典存储模块,用于存储相应的信息属性词典,其中,所述属性词典是由歌曲库中的歌手名、歌曲名和专辑名建立的歌曲属性词典;
查询信息接收模块,用于接收查询信息;
第一判断模块,用于判断输入的查询信息是否是最近预定时间段查询过的信息;
查询信息存储模块,用于存储查询信息及查询结果;
第二判断模块,用于判断查询信息是否属于属性词典中的信息;
复式切词模块,用于对接收到的查询信息进行一元二元混合切词,其中,所述复式切词模块对接收到的查询信息进行一元二元混合切词具体指采取将一元词和二元词交叠出现,每个二元词是两边的一元词的组合;
搜索模块,用于对切词后的查询信息进行搜索;
显示模块,用于显示搜索的结果;
打印模块,用于将搜索的结果进行打印输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亿览在线网络技术(北京)有限公司,未经亿览在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310211199.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种木塑板自动喷漆装置
- 下一篇:一种用于锚杆表面涂装的工装组件





