[发明专利]信息挖掘方法和装置有效
| 申请号: | 201410710424.7 | 申请日: | 2014-11-27 |
| 公开(公告)号: | CN104346480B | 公开(公告)日: | 2018-06-26 |
| 发明(设计)人: | 刘松;孙凯;陶明远 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 路凯;胡彬 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 消息内容 特征描述信息 抓取 匹配成功 即时通信软件 方法和装置 特征识别 信息挖掘 解析 匹配 发布消息 人力成本 预先建立 自动捕获 监听 应用 保存 发布 | ||
1.一种信息挖掘方法,其特征在于,包括:
监听即时通信软件应用中发布的消息;
对监听到的消息进行解析,得到消息内容;
将所述消息内容与预先建立的特征识别词典中的关键词进行匹配;
在匹配成功时,抓取所述消息内容和所述消息内容的相关内容作为特征描述信息,并将所述特征描述信息进行保存;
其中,所述消息内容的相关内容包括:在与发布所述消息内容的用户建立会话并向所述用户发送消息内容补充请求后,所述用户返回的补充内容;或,所述消息内容的上下文消息和在与发布所述消息内容的用户建立会话并向所述用户发送消息内容补充请求后,所述用户返回的补充内容。
2.如权利要求1所述的方法,其特征在于,在监听即时通信软件应用中发布的消息之前,还包括:
在获取与所述即时通信软件应用对应的服务器的访问权限后,与所述服务器建立连接;
向所述服务器发送对所述即时通信软件应用中的群组账号或个人用户账号的加入请求;
所述监听即时通信软件应用中发布的消息,具体包括:
在接收到所述服务器返回的同意加入的响应消息后,监听加入的群组中的用户或加入的个人用户发布的消息。
3.如权利要求1所述的方法,其特征在于,建立所述特征识别词典,具体包括:
接收人工配置的特征识别词典中的关键词;或者,
在所述即时通信软件的聊天历史记录中查找人工收录的典型语句,根据该典型语句的上下文共现关系,挖掘出表达相应特征的关键词并添加在特征识别词典中。
4.如权利要求1所述的方法,其特征在于,在抓取所述消息内容和所述消息内容的相关内容作为特征描述信息之后、将所述特征描述信息进行保存之前,还包括:
将所述特征描述信息与预先建立的类别识别词典中的关键词进行匹配,根据匹配结果确定所述特征描述信息对应的类别;或,通过自然语言处理NLP模型确定所述特征描述信息对应的类别;或,采用预先根据已标注类别信息的特征描述文本训练出的概率模型确定所述特征描述信息对应的类别;
将所述特征描述信息进行保存包括:将确定的类别与所述特征描述信息进行关联保存。
5.如权利要求4所述的方法,其特征在于,通过自然语言处理NLP模型确定所述特征描述信息对应的类别,具体包括:
采用语义相似度算法模型和/或点击相似度算法模型,确定所述的特征描述信息对应的类别。
6.如权利要求4所述的方法,其特征在于,在确定所述特征描述信息对应的类别之后,还包括:
根据所述类别确定所述特征描述信息的接收方的信息;
根据所述接收方的信息将所述特征描述信息发送给所述接收方。
8.如权利要求1-7中任一所述的方法,其特征在于,所述特征识别词典中的关键词包含反映产品缺陷的关键词,所述特征描述信息为描述产品缺陷的信息。
9.一种信息挖掘装置,其特征在于,包括:
消息监听模块,用于监听即时通信软件应用中发布的消息;
消息解析模块,用于对监听到的消息进行解析,得到消息内容;
匹配模块,用于将所述消息内容与预先建立的特征识别词典中的关键词进行匹配;
特征描述信息处理模块,用于在匹配成功时,抓取所述消息内容和所述消息内容的相关内容作为特征描述信息,并将所述特征描述信息进行保存;
其中,所述消息内容的相关内容包括:在与发布所述消息内容的用户建立会话并向所述用户发送消息内容补充请求后,所述用户返回的补充内容;或,所述消息内容的上下文消息和在与发布所述消息内容的用户建立会话并向所述用户发送消息内容补充请求后,所述用户返回的补充内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410710424.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:自动短路功能的电连接器
- 下一篇:高效防浪涌、抗雷击转换器插座





