[发明专利]一种多维度网页浏览行为评估方法有效
| 申请号: | 201710054675.8 | 申请日: | 2017-01-24 |
| 公开(公告)号: | CN106886577B | 公开(公告)日: | 2020-02-07 |
| 发明(设计)人: | 朱全银;潘舒新;冯万利;李翔;贾笑颖;胡荣林;周泓;于柿民;赵阳;瞿学新;杨茂灿;唐海波;邵武杰 | 申请(专利权)人: | 淮阴工学院 |
| 主分类号: | G06F16/00 | 分类号: | G06F16/00 |
| 代理公司: | 32204 南京苏高专利商标事务所(普通合伙) | 代理人: | 梁耀文 |
| 地址: | 223005 江苏省*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 多维 网页 浏览 行为 评估 方法 | ||
本发明公开了一种多维度网页浏览行为评估方法,首先对搜狗语料库中的文本分词,以TF‑IDF作为文本特征,采用朴素贝叶斯方法对语料库进行训练得到文本训练集,将搜狗语料库中的文本折半切分,得到验证测试集,通过遍历得到最优拉普拉斯平滑参数Alpha,再爬取已浏览网页的指定文本内容,得到已浏览网页标题集,接着采用Alpha的朴素贝叶斯方法对已浏览网页标题集进行分类,得到已浏览网页分类集,并将大于阈值的网页信息加入文本训练集中,利用浏览网页时的停留时间、浏览终端等多维度数据,采用终端‑时间‑分类判别方法对网页浏览数据进行评估,得到评估结果。本发明方法有效分析了网页浏览信息,提高了网页浏览行为评估的准确度。
技术领域
本发明属于网页浏览行为分析技术领域,特别涉及一种基于TF-IDF和朴素贝叶斯多维度的网页浏览行为评估方法。
背景技术
浏览网页行为评估方法对实现人员的行为习惯分析有着重要的作用和意义。传统的网页浏览分析由问卷调查的方法已经不能满足社会信息化发展的需求。近年来针对不同种类人群的网络行为分析,研究者提出了相应的分析方法,如神经网络、支持向量机、决策树、KNN方法、遗传方法等。
朱全银、贾笑颖等人已有的研究基础包括:朱全银,严云洋,周培,谷天峰.一种基于线性插补与自适应滑动窗口的商品价格预测模型.山东大学学报.2012,Vol.42(5):53-58;朱全银,潘禄,刘文儒,等.Web科技新闻分类抽取方法[J].淮阴工学院学报,2015,24(5):18-24;李翔,朱全银.联合聚类和评分矩阵共享的协同过滤推荐[J].计算机科学与探索,2014,8(6):751-759;Quanyin Zhu,Sunqun Cao.A Novel Classifier-independentFeature Selection Algorithm for Imbalanced Datasets.2009,p:77-82;Quanyin Zhu,Yunyang Yan,Jin Ding,Jin Qian.The Case Study for Price Extracting of MobilePhone Sell Online.2011,p:282-285;Quanyin Zhu,Suqun Cao,Pei Zhou,Yunyang Yan,Hong Zhou.Integrated Price Forecast based on Dichotomy Backfilling andDisturbance Factor Algorithm.International Review on Computers and Software,2011,Vol.6(6):1089-1093;Zhu Quan-yin,Yin Yonghua,Yan Yun-yang,Gu Tian-feng.ANovel Efficient AdaptiveSliding Window Model for Week-ahead Price Forecasting.TELKOMNIKAIndonesian Journal of Electrical Engineering.2014.Vol.12(3):2219-2226;Zhu Quanyin,Pan Lu,Yin Yonghua LiXiang.Influence on Normalizationand Magnitude Normalization for PriceForecasting of AgriculturalProducts.Information Technology Journal(ITJ).2013.Vol.12(15):3046-3057;Quanyin Zhu,Jin Ding,Yonghua Yin,Pei Zhou.A Hybrid Approach for New ProductsDiscovery of Cell Phone Based on Web Mining.Journal of Information andComputational Science(JICS).2012,Vol.9(16):5039-5046。朱全银、贾笑颖等人申请、公开与授权的相关专利:朱全银,尹永华,严云杨,曹苏群等,一种基于神经网络的多品种商品价格预测的数据预处理方法.中国专利:ZL 201210325368.6,2016.06.08;朱全银,胡蓉静,何苏群,周培等.一种基于线性插补与自适应滑动窗口的商品价格预测方法.中国专利:ZL201110423015.5,2015.07.01;朱全银,曹苏群,严云洋,胡蓉静等,一种基于二分数据修补与扰乱因子的商品价格预测方法.中国专利:ZL201110422274.6,2015.07.01;朱全银,辛诚,李翔,潘舒新等,一种基于K-means和LDA双向验证的网络行为习惯聚类方法.中国专利公开号:CN106202480A,2016.12.07;朱全银,辛诚,刘斌,潘舒新等,一种基于分类语料库-关键词词频-记录关联的网络行为习惯量化方法.中国专利公开号CN106202498A,2016.12.07;李翔,朱全银,胡荣林,周泓.一种基于谱聚类的冷链物流配载智能推荐方法.中国专利公开号:CN105654267A,2016.06.08。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴工学院,未经淮阴工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710054675.8/2.html,转载请声明来源钻瓜专利网。





