[发明专利]利用语义挖掘算法标识营销电话的方法及治理营销电话的系统有效
申请号: | 201711363955.3 | 申请日: | 2017-12-18 |
公开(公告)号: | CN108153727B | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 陈晓莉;林建洪;徐菁;徐佳丽;聂宜君;刘亭 | 申请(专利权)人: | 浙江鹏信信息科技股份有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F16/35;G06F16/36 |
代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 周希良 |
地址: | 311100 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 语义 挖掘 算法 标识 营销 电话 方法 治理 系统 | ||
本发明公开了利用语义挖掘算法标识营销电话的方法及治理营销电话的系统。本发明利用语义挖掘算法标识营销电话的方法具体步骤包括:S1、划分电话的标签为不同的种类;S2、建立词典库,词典库包括标签对应的词向量;S3、抽取词典库中属于同一种类的标签构成一层训练样本;S4、利用多层训练样本进行训练,得到分类模型;S5、根据分类模型,标识词典库中的词向量所属的种类;本发明还公开了一种利用语义挖掘算法治理营销电话的系统。本发明利用语义挖掘算法标识营销电话的方法及治理营销电话的系统,能够对营销电话进行精准的分类,用户能够自主选择接入电话的类别,达到了对营销电话精准拦截的目的。
技术领域
本发明属于电通信技术领域,尤其涉及一种利用语义挖掘算法标识营销电话的方法及治理营销电话的系统。
背景技术
据了解,电话营销已成为目前房地产、金融理财、教育培训等行业的主要营销模式,电话营销带来的业务量占近三分之二,也就是说,电话营销有其存在的土壤,部分市民也需要这些信息,营销电话作为骚扰电话中一个特殊的类型,不能简单地采用拦截或者关停的方式处置。据触宝电话统计,自2016年开始营销电话已经超越其他类型,成为手机用户最主要的骚扰类型。
目前已有很多软件可用于电话标记,如360手机卫士、腾讯手机管家、百度手机卫士等,华为、小米、vivo等手机也为用户提供电话标记功能。电话标记可以在一定程度上帮助用户避免经济损失,例如,如果A用户接到营销诈骗电话,并识别出来进行了标记,该电话再去骚扰用户B时,由于已有诈骗提醒,提高了用户B的防备心理。但在实际应用中,用户对电话的标记千差万别。例如,属于营销诈骗类型的电话,用户可能会标记为营销诈骗、响一声、疑似营销诈骗、诈骗钓鱼、骚扰电话、非法营销等。这种情况不仅会对用户准确识别电话类型带来一定的困难,同时也为运营商分析电话治理现状造成困扰。
因此,根据电话的不同标签,对电话进行标签的理解与分类,由用户自主设定需要拦截的分类,具有重要的现实意义。
本发明根据上述技术中对营销电话的标记和处理存在的缺陷,本发明人基于从事此类产品设计制造多年丰富的实务经验及专业知识,并配合学理的运用,积极加以研究创新,以期提出一种对营销电话标识和治理的方法,基于标签语义理解、整合与分类算法,通过建立标签词典库,利用历史标签划分构建分类模型,识别出已知标签大类与未知类别,对于未知类别重新用于模型训练。
如此,能够改进一般现有的对营销电话标识和治理的方法,进而准确识别出电话的类型,使其更具有实用性。经过不断的研究、设计,并经过反复试作样品及改进后,终于创设出确具实用价值的本发明。
发明内容
针对现有技术存在的上述技术问题,本发明提供了一种利用语义挖掘算法标识营销电话的方法及治理营销电话的系统,本发明利用机器学习算法对用户标记的营销电话标签进行语义理解与挖掘,对标签进行整合与分类,进而实现对营销电话的精准分类与处置,用以解决现有技术中不能对电话类型准备识别的缺陷,以达到对营销电话精准拦截的效果。
为达到上述技术目的,本发明采取如下技术方案:
一种利用语义挖掘算法标识营销电话的方法,包括:
S1、划分电话的标签为不同的种类;
S2、建立词典库,所述词典库包括标签对应的词向量;
S3、抽取所述词典库中属于同一种类的标签构成一层训练样本;
S4、利用多层所述训练样本进行训练,得到分类模型;
S5、根据所述分类模型,标识所述营销电话中标签所属的所述种类。
作为本发明的优选,步骤S2建立词典库具体包括:
S21、采集语料库制作训练文本;
S22、采用结巴工具对所述训练文本分词得到词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江鹏信信息科技股份有限公司,未经浙江鹏信信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711363955.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文本处理方法和装置
- 下一篇:一种关键词确定方法及装置