[发明专利]基于招商工作流程和阅读偏好的信息推送系统及方法在审
申请号: | 201810949454.1 | 申请日: | 2018-08-20 |
公开(公告)号: | CN109284500A | 公开(公告)日: | 2019-01-29 |
发明(设计)人: | 张连祥 | 申请(专利权)人: | 张连祥 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/9535;H04L29/08 |
代理公司: | 天津滨海科纬知识产权代理有限公司 12211 | 代理人: | 杨慧玲 |
地址: | 300060 天津*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 推送 工作流程 偏好 算法 信息推送 阅读 画像 信息推送系统 文本相似度 相似度比较 画像信息 量化处理 推送信息 文字信息 要素提取 载体信息 场景 智能 | ||
1.一种基于招商工作流程和阅读偏好的信息推送方法,其特征在于,包括:
S1:通过数学模型,建立企业画像、载体画像和招商信息三个专用分词库;
S2:企业、载体、信息量化处理;基于企业大数据信息,采用要素抽取算法,从不同维度给目标企业信息、载体信息、需要推送的信息进行标签化处理;
S3:设置信息推送类别;
S4:信息生成;
S5:标签筛选和比对;依据推送信息标签与企业标签、载体标签进行筛选和比对,挑选出具有针对性的信息推送给特定企业用户和招商人员;
S6:计算用户阅读偏好,并对每日每用户接收的信息量进行控制;
S7:信息推送。
2.根据权利要求1所述的方法,其特征在于,步骤S1所述分词库数学模型的建立方法包括:
S101:汉语言中所有的字组成一个观测集合,B,M,E,S组成一个状态集合,其中B表示词首字,E表示词尾字,M表示词中字,S表示单字成词;
S102:通过人工的数据清洗与标注工作,获得大量学习样本,即为训练集;训练集中均为有上下语义逻辑的已经分词完成的多个样本;
S103:在Viterbi算法中设计函数计算初始概率,状态转移概率,观测概率,同时统计出状态序列,观测序列,完成算法模型的搭建;其中观测序列即为待分词的语句;状态序列即为该语句中每个字所对应的状态,使用所述状态集合中的状态表示;初始概率,状态转移概率,观测概率均为语料库中状态与观测之间的对应关系所计算出的概率。
3.根据权利要求1所述的方法,其特征在于,步骤S1通过数学模型建立分词库的方法包括:
S201:根据数学模型,利用Viterbi算法预测每一条新进语句中的每个字在该句下所对应的状态;
S202:算法完毕以后,设计函数,针对每个字所对应的状态,可以将字组合成词,逢状态E即添加回车字符,最终可得到完成的分词文本。
4.根据权利要求1所述的方法,其特征在于,步骤S2需要以历史数据库中的企业介绍为学习样本,将中文分词转化为可以运算的数学形式,即分词向量化,实现方法包括:
S301:使用Word2Vec算法,通过该分词的前后N个词来推断该词出现的概率;
S302:利用最大似然估计法确定参数。
5.根据权利要求1所述的方法,其特征在于,步骤S3所述信息推送类别包括法定推送信息、特别约定信息和偏好推送信息三个类别;
法定推送信息:法定事项和相关重要法律、政策、实施细则等变化信息推送;
特别约定信息:当事人特别约定的事项以及时间节点;
偏好推送信息:符合个人偏好的企业信息、载体信息、服务信息、产业信息等资讯类信息,并对每日每个用户接收信息的总量进行限制。
6.根据权利要求1所述的方法,其特征在于,步骤S4所述信息包括:
(1)招商项目双方在查询、沟通、撮合、磋商、考察、谈判、落地服务、投诉协调等招商工作流程的各个阶段产生的约定事项及时间节点;
(2)根据招商工作流程和关键节点,以及合作对接和项目落地的流程和时间节点,不同时间节点推送不同的内容;
(3)向招商人员推送企业信息:依据招商规划自动匹配企业画像,根据企业画像检索企业信息库,将检索结果向招商人员推送;
(4)向企业推送载体招商信息:依据招商规划自动匹配企业画像,根据企业画像检索企业信息库,向符合企业画像的企业推送载体招商信息;
(5)向特定用户推送阅读偏好信息;根据用户阅读偏好,系统向用户推送相同标签的信息;
(6)法定事项和法律、政策法规、实施细则等发布、修订及解读。
7.一种基于招商工作流程和阅读偏好的信息推送系统,其特征在于,采用四层架构模式,包括系统软件层、运行环境层、基础架构层、应用服务层;
所述应用服务层设有:
场景获取:获取招商工作流程节点、法定事项的变化、用户阅读偏好信息,作为信息发送场景条件;
数据统计:统计用户阅读数据,包括同标签信息的点击率、阅读时长、分享操作、评价和评论信息;
发送服务:通过手机通知、微信、短信、邮件,给用户推送不同场景所需要的信息;
信息库:需要推送的信息数据库;
企业库:企业信息、项目信息数据库;
载体库:包括地区、区、功能区、园区等各种招商载体的信息数据库;
标签数据库:为企业、项目、载体建立的标签数据库;包括基于企业大数据信息,采用要素抽取算法,从不同维度给目标企业信息进行标签化的数据;
分词库:通过数学模型所建立的企业画像、载体画像和招商信息三个专用分词库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张连祥,未经张连祥许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810949454.1/1.html,转载请声明来源钻瓜专利网。