[发明专利]信息定向推送方法和系统无效
申请号: | 201010042818.1 | 申请日: | 2010-01-13 |
公开(公告)号: | CN102129440A | 公开(公告)日: | 2011-07-20 |
发明(设计)人: | 万春晓 | 申请(专利权)人: | 腾讯科技(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/08 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 何平;曾旻辉 |
地址: | 100080 北京市海淀区海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 定向 推送 方法 系统 | ||
【技术领域】
本发明涉及网络信息处理技术领域,特别是涉及一种信息定向推送方法和系统。
【背景技术】
信息定向推送是指针对用户需要和感兴趣的内容,向用户发送相应的信息,包括小知识、新闻、天气预报、广告等。
传统的互联网信息定向推送技术中,基于用户输入特征的方法主要是根据用户在聊天的对话框中输入的信息,提取出用户感兴趣的关键词,对用户的特征进行分析,从而得到用户的感兴趣点,进而实现信息的定向推送。
传统的互联网信息定向推送技术存在两个缺点:(1)用户输入特征不完整。软件的丰富性和多样性使得单纯通过聊天对话框进行的特征提取面过于狭窄,无法全面挖掘用户的特征信息。(2)用户输入特征提取不准确。复杂语句中准确提取关键词的技术存在缺陷,使得通过从语句中提取的用户特征的准确性较低。
上述的两个缺点最终会导致向用户推送的定向信息不准确的问题,也就是推送的定向信息不是用户感兴趣的、需要的信息。
【发明内容】
为了解决传统基于用户输入特征的信息定向推送方法推送钓定向信息不准确的问题,有必要提供一种准确的信息定向推送方法。
一种信息定向推送方法,包括如下步骤:采集用户的输入信息,所述输入信息包括通过输入法输入的词语;根据所述词语统计词频,根据词频对所述词语进行排序;查找与排序后的词语相匹配的定向信息;将所述匹配的定向信息输出给用户。
优选的,所述统计词频的步骤为:判断用户通过输入法输入的词语是否是名词,若是,则根据用户输入的名词统计词频。
优选的,采用大根堆统计用户输入的词语的词频并进行排序,所述大根堆的每个节点统计用户输入的词语及其词频。
优选的,所述查找定向信息的步骤具体是只对词频最高的50~100个词语进行查找。
优选的,所述用户的输入信息还包括用户标识号,所述用户标识号对应惟一用于统计用户输入词语及其词频的大根堆。
还有必要提供一种准确的信息定向推送系统。
一种信息定向推送系统,包括输入采集模块、词频统计及排序模块、定向信息匹配模块以及定向信息输出模块;输入采集模块用于采集用户的输入信息,所述输入信息包括通过输入法输入的词语;词频统计及排序模块统计输入的词语的词频,并根据词频对所述词语进行排序;定向信息匹配模块查找与排序后的词语相匹配的定向信息;定向信息输出模块接收所述定向信息匹配模块查找到的定向信息,并将该定向信息输出给用户。
优选的,所述词频统计及排序模块采用大根堆统计用户输入的词语的词频并进行排序,所述大根堆的每个节点统计用户输入的词语及其词频。
优选的,该系统还包括词性判断模块,所述词性判断模块用于判断所述输入采集模块采集到的词语是否是名词;若是,则将该词语传输到词频统计及排序模块中,采用大根堆统计其词频,然后根据词频对所述词语进行排序。
优选的,所述输入采集模块采集的输入信息还包括用户标识号,所述用户标识号对应惟一用于统计用户输入词语及其词频的大根堆,所述系统还包括用于存储所述大根堆的词频堆存储模块。
优选的,所述定向信息匹配模块只对词频最高的50~100个词语进行查找。
上述信息定向推送方法和系统,通过输入法采集用户输入的词语,不受聊天对话框的局限,提高了用户输入特征提取的全面性;从而能提高推送的信息的准确性,推送的信息用户更需要、更感兴趣。
通过判断输入的词是否是名词,提高了用户输入特征提取的准确性。
采用大根堆对词频数据进行统计和排序,时间复杂度为O(nlogn),复杂度低,排序效率高。
只对词频较高的50~100个词语进行匹配,能更准确的抓住用户的感兴趣点,提高推送的信息的准确性。
【附图说明】
图1是一个实施例中信息定向推送方法的流程图;
图2是一个实施例中信息定向推送方法服务器的流程图;
图3是一个实施例中信息定向推送方法客户端的流程图;
图4是一个实施例中信息定向推送系统的示意图;
图5是一个实施例中客户端的结构示意图;
图6是一个实施例中服务器的结构示意图。
【具体实施方式】
图1是一个实施例中信息定向推送方法的流程图。该方法预先建立定向信息列表,还包括以下步骤:
S110,采集用户的输入信息。用户的输入信息包括用户标识号和通过输入法输入的词语。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(北京)有限公司,未经腾讯科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010042818.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种在线专题地图动态构建方法
- 下一篇:一种词关系挖掘方法和装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置