[发明专利]一种交通舆情感知特征提取方法有效
申请号: | 202011304311.9 | 申请日: | 2020-11-19 |
公开(公告)号: | CN113064989B | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 龚越;滕靖;刘韶杰 | 申请(专利权)人: | 龚越;滕靖;刘韶杰 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/242;G06F40/30 |
代理公司: | 上海科律专利代理事务所(特殊普通合伙) 31290 | 代理人: | 叶凤 |
地址: | 201804 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 交通 舆情 感知 特征 提取 方法 | ||
一种交通舆情感知特征模块及分析治理应用。步骤1,主题特征提取步骤:首先,将文本数据向量化;接着,建立多种文本分类模型;然后,采集并标注交通舆情数据,得到训练数据集和测试数据集;利用训练数据集训练并标定模型参数,得到具体的主题特征提取模型;步骤2,时空特征提取步骤,包括基于规则的交通舆情时间特征和基于空间词库的交通舆情空间特征提取两个方面;步骤3,情感特征提取方法:建立基于词典的交通类文本情感倾向性模型;步骤4,演变特征提取方法步骤。
技术领域
本发明交通舆情感知和特征提取技术。
背景技术
交通舆情是网络舆情研究的分支,是舆情研究在特定领域的体现。借鉴“舆情”定义,“交通舆情”是指“在一定的时间空间内,围绕中介性交通事件的发生、发展和变化,作为主体的民众对作为客体的交通要素、交通参与者和交通管理者产生和持有的信念、态度、意见和情绪等表现的总和”。
最接近的现有技术及其缺点:
交通舆情分析在本应用领域尚处于起步阶段。目前,行业对交通舆情的研究较少,特别是在交通舆情基本特征、特征提取方法等基础技术方面的研究尚为空白。
第一,部分交通运输管理部门舆情危机预警技术手段不足。危机主体信息获取和发布不及时,未形成交通网络舆情监测联动机制,交通舆情信息获取单一化和局部化;
第二,网络舆情信息抓取中交通术语特色空白。交通运输行业术语特色是目前所有商业类舆情监测的空白点,很难从已有的通用性词库中发掘行业本身语义特色,在网络舆情信息抓取时候易产生误判和丢失,且影响舆情的感知效率和精度。
第三,交通舆情感知特征未成体系,提取技术研究不足。舆情感知特征是进行交通舆情信息提取、危机预警以及应对的基础,交通运输的行业特色决定其舆情特征与通用舆情特征存在差异。
因此,有必要对交通舆情分析方法进行系统研究,建立交通舆情概念、特征、研究方法等技术体系。
发明内容
本发明目的在于克服现有技术不足,公开一种交通舆情感知特征模块及分析治理及监测应用。本发明首次面向交通监测与决策建立一种交通舆情感知特征模块,包括主题特征、时空特征、情感特征、演变特征四个特征,同时有体现出了交通拥堵、时间、地点等二级特征,为本领域开创新地构建了适用于交通舆情感知特征体系。
技术方案为:
一种交通舆情感知特征模块及分析治理应用,特征是,包括
步骤1,主题特征提取步骤
首先,将文本数据向量化;接着,建立多种文本分类模型;然后,采集并标注(本领域常规技术)交通舆情数据,得到训练数据集和测试数据集;利用训练数据集训练并标定模型参数,得到具体的主题特征提取模型;
步骤2,时空特征提取步骤,包括基于规则的交通舆情时间特征和基于空间词库的交通舆情空间特征提取两个方面
步骤3,情感特征提取方法
建立基于词典的交通类文本情感倾向性模型;
步骤4,演变特征提取方法步骤。
基于舆情的生命周期并面向交通监测与决策,本申请首次创设和建立了交通舆情感知特征体系。该体系理论原理及意义:
1)主题特征:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于龚越;滕靖;刘韶杰,未经龚越;滕靖;刘韶杰许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011304311.9/2.html,转载请声明来源钻瓜专利网。