[发明专利]基于大数据的网络语言分析方法在审
申请号: | 201810308863.3 | 申请日: | 2018-04-09 |
公开(公告)号: | CN110362811A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 谢碧青 | 申请(专利权)人: | 谢碧青 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610000 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 词组 语言片段 大数据 高频率 堆栈 统计 群体分析 相似片段 语言文本 导出 去除 词汇 分析 群体 语言 研究 | ||
本发明公开了基于大数据的网络语言分析方法,主要包括以下步骤:A、提取网络语言进入堆栈内;B、将堆栈内的语言文本进行对比,提取相同或相似语言片段或词组;C、将相同或相似片段导出,统计出显示几率;D、去除以往统计过高频率语言片段或词组,导出新出现的高频语言片段或词组;E、得出新型网络语言或流行词组;通过对比提取相同的语言片段或词组,统计频率,得出流行语言片段或词汇;提取语言的对象可以针对于不同的平台、不同的群体分析出不同的高频率网络语言或流行词组;针对不同平台、不同群体进行统计,可以做针对性的研究。
技术领域
本发明涉及一种大数据分析,具体涉及一种基于大数据的网络语言分析方法。
背景技术
大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。在日新月异的网络时代,其网络语言不紧时文化时代的新产物,网络语言从网络中产生或应用于网络交流的一种语言,包括中英文字母、标点、符号、拼音、图标、图片和文字等多种组合。这种组合,往往在特定的网络媒介传播中表达特殊的意义,在实际生活中,如能具体分析出这些语言片段,对其语言研究分析可提供很大的参考价值。
发明内容
本发明提供了基于大数据的网络语言分析方法用于分析网络高频词汇以便更加方便的进行网络语言的研究运用。
本发明通过下述技术方案实现:
基于大数据的网络语言分析方法,主要包括以下步骤:A、提取网络语言进入堆栈内;B、将堆栈内的语言文本进行对比,提取相同或相似语言片段或词组;C、将相同或相似片段导出,统计出显示几率;D、去除以往统计过高频率语言片段或词组,导出新出现的高频语言片段或词组;E、得出新型网络语言或流行词组。通过对比提取相同的语言片段或词组,统计频率,得出流行语言片段或词汇。
进一步的,提取语言的对象可以针对于不同的平台、不同的群体分析出不同的高频率网络语言或流行词组。针对不同平台、不同群体进行统计,可以做针对性的研究。
进一步的,在步骤C之后,还可以通过与目标词汇做对比,找出网络中与目标词汇相对应的人群。通过与目标人群的标志性词汇,在网络中找出目标人群。
本发明具有如下的优点和有益效果:
1、本发明通过对比提取相同的语言片段或词组,统计频率,得出流行语言片段或词汇;
2、本发明针对不同平台、不同群体进行统计,可以做针对性的研究;
3、本发明通过与目标人群的标志性词汇,在网络中找出目标人群。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例1
基于大数据的网络语言分析方法,主要包括以下步骤:A、提取网络语言进入堆栈内;B、将堆栈内的语言文本进行对比,提取相同或相似语言片段或词组;C、将相同或相似片段导出,统计出显示几率;D、去除以往统计过高频率语言片段或词组,导出新出现的高频语言片段或词组;E、得出新型网络语言或流行词;提取语言的对象可以针对于不同的平台、不同的群体分析出不同的高频率网络语言或流行词组;在步骤C之后,还可以通过与目标词汇做对比,找出网络中与目标词汇相对应的人群。实施时,可通过网络云夫妇平台进行语言处理,通过单位链之间的协同工作,对其大平台进行分析处理,通过设置过滤常用辅助形表达词汇,增加其对比效率。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谢碧青,未经谢碧青许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810308863.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文本分析方法及装置
- 下一篇:基于大数据的目标人群的分析方法