[发明专利]基于多维度报警信息文本相似度分析的推荐方法在审
申请号: | 201911270461.X | 申请日: | 2019-12-12 |
公开(公告)号: | CN111159387A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 朱沐尧;王全修;杨培文;吴培辛 | 申请(专利权)人: | 北京睿企信息科技有限公司;日照睿安信息科技有限公司;南京清月智能科技研发有限公司;上海清月人工智能科技有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F40/194;G06F40/295 |
代理公司: | 北京纽乐康知识产权代理事务所(普通合伙) 11210 | 代理人: | 范赤 |
地址: | 100013 北京市东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多维 报警 信息 文本 相似 分析 推荐 方法 | ||
本发明公开了一种基于多维度报警信息文本相似度分析的推荐方法,包括:非结构化公安文本是案情中涉及的报警信息文本,采用NLP技术对其格式进行预处理,输出为结构化公安文本格式;场景相关的多重深层语义相似度分析网络获取公安文本,输出为该文本不同级别的语义嵌入向量;基于多维度文本语义相似度的文本分析网络获取公安文本和不同级别的语义嵌入向量,输出为可抽取的多种实体特征;结合用户特征的报警信息文本推荐系统获取公安文本不同级别的语义嵌入向量和被抽取出的多种实体特征,输出为不同报警信息文本之间的相似度及相似报警信息推荐;相似文本推荐获取算法模型自动筛选生成综合的推荐列表,完成智能推送。
技术领域
本发明属于公安专用场景下的人工智能技术领域,具体涉及一种基于多维度报警信息文本相似度分析的推荐方法。
背景技术
现阶段我国的报警信息推荐系统分为两种,一种是基于用户的推荐,根据某用户的特性推荐相关信息;另一种是根据文本内容推荐,推荐与文本信息相似的内容,本申请采用的报警信息文本推荐主要是第二种,通常是基于报警信息文本相似度的推荐,文本相似度计算的发展可大体分为三个阶段:从最开始的字面匹配近似,到第二阶段的词汇匹配相似,再到第三阶段的语义相似。
一种常见的处理方式是:首先将文本数字化,并且数字化后还能保持文本的基本信息,即将文本向量化,可以使用文本分词得到的标记向量化,也可以使用 TF-IDF 方法,后者可以保留词在文档中的权重信息,即相当于保留了文本信息,其次,当文本获得向量化表达之后,就可以表述成向量空间的一个点,然后通过计算两个向量之间的相似度,即可表示原来文本之间的相似度。常用的向量相似度计算方法可以使用欧几里得距离、曼哈顿距离、切比雪夫距离、余弦相似度距离和海明距离等。最后,当获得文本之间的相似度之后,就可以根据相似度高低进行排序,推荐前若干个与被推荐文本相似度高的文本。
计算文本相似度的算法也可以大体分为基于词向量、基于具体字符、基于概率统计和基于词嵌入的文本相似度算法,结合上文的几种向量相似度计算方法,其中欧几里得距离、曼哈顿距离和余弦距离适用于词向量,而海明距离适用于基于字符的文本相似度度量方法。
发明内容
针对相关技术中的上述技术问题,本发明提出一种基于多维度报警信息文本相似度分析的推荐方法,能够结合公安领域专业知识和多维度深层次的文本语义,并针对用户特征提供不同粒度级别的报警信息文本推荐。
为实现上述技术目的,本发明的技术方案是这样实现的:一种基于多维度报警信息文本相似度分析的推荐方法,其特征在于,
S1非结构化公安文本是案情中涉及的报警信息文本;
采用NLP技术将非结构化公安文本进行格式预处理,融合多粒度深层次文本语义和公安领域知识的文本嵌入向量后输出给场景相关的深层语义相似度分析网络;
S2结构化公安文本是根据公安文本数据库提取的报警信息;
运用已经构建的统一数据视图的数据库系统,执行相应操作自动提取相对应的数据,融合多粒度深层次文本语义和公安领域知识的文本嵌入向量后输出给场景相关的深层语义相似度分析网络;
S3场景相关的深层语义相似度分析网络获取结构化报警信息文本;
采用 BiLSTM+CRF 模型转化报警信息文本成准确的公安文本信息,综合理解多粒度文本信息,分析并甄别刑事侦查细分的关注点、语义相似性数据集,输出为不同级别的语义嵌入向量;
S4基于多维度文本语义相似度的文本分析网络获取准确的公安文本和不同级别的语义嵌入向量,融入文本的多重深层语义特征,抽取得到实体链接信息归属和作案手法识别的实体特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京睿企信息科技有限公司;日照睿安信息科技有限公司;南京清月智能科技研发有限公司;上海清月人工智能科技有限公司,未经北京睿企信息科技有限公司;日照睿安信息科技有限公司;南京清月智能科技研发有限公司;上海清月人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911270461.X/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置