[发明专利]一种人群的特定倾向性感知方法和系统在审
申请号: | 202110245534.0 | 申请日: | 2021-03-04 |
公开(公告)号: | CN112597400A | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 李芳芳;张健;路毅恒 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00;G06Q50/26 |
代理公司: | 长沙惟盛赟鼎知识产权代理事务所(普通合伙) 43228 | 代理人: | 黄敏华 |
地址: | 410000 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人群 特定 倾向性 感知 方法 系统 | ||
1.一种人群的特定倾向性感知方法,其特征在于,具体包括如下步骤:
S1:将输入法数据源作为待分析人群数据来源;
S2:根据输入法数据源和实际需求构建至少一个特征库,所述特征库具有至少一个特定倾向性特征的集合;
S3:将待分析人群的输入法数据源与特征库进行匹配,筛选出具有至少一个特定倾向性的目标人群。
2.按照权利要求1所述人群的特定倾向性感知方法,其特征在于,还包括:
S4:采集S3所获得的目标人群个体的输入法数据源中的文本信息,并结合输入法数据源中的输入时间、输入所在平台、设备标识码、注册账号及其它信息进行数据融合,形成基于输入法的单通道目标人群画像库。
3.按照权利要求1所述人群的特定倾向性感知方法,其特征在于,步骤S1包括:
S1.1多源数据归集:基于不同输入法采集数据,包括但不限于:输入文本、输入时间、输入所在平台、设备标识码、注册账号;
S1.2多源数据预处理:对所采集的数据进行预处理,根据清洗机制或筛除机制,清除噪音信息或空白信息;
S1.3输入法数据源基础库建立:基于预处理后的数据源构建输入法数据源基础库,进行存储管理并建立查询检索机制。
4.按照权利要求2所述人群的特定倾向性感知方法,其特征在于,步骤S2包括:
S2.1初始特征库构建:根据实际需求构建至少具有一个特定倾向性特征的集合的初始特征库;
S2.2分级标识:按分级标准对初始特征库的某个特定倾向进行属性分级和标识,在表征某特定倾向性特征时能够区分倾向性程度;
S2.3特征库补充:分析与研究S4中的文本信息,将新发现的用于表征特定倾向性特征的文本信息添加到相关特定倾向性特征库中;
S2.4特征库调整:根据S4中目标人群的输入法数据源中的文本信息,对表征特定倾向性特征的文本信息进行核对,并根据核对结果对相应特定倾向性特征库的内容和分级标识进行调整。
5.按照权利要求1所述人群的特定倾向性感知方法,其特征在于,还包括:
S5:多互联网平台网络账户关联,将经S3处理后的目标人群在所有互联网平台存在的网络账号进行关联;
S6:跨互联网平台网络数据融合,将S5中的多个互联网平台的异构网络数据融合,并经分析后对S2中的相关倾向性分级特征库进行调整和完善;
S7:用户业务支撑,基于S6中的融合数据,根据实际情况研发不同使用模型,包括但不限于:实体发现、目标活动轨迹还原和追踪、伴随关系分析、信息溯源和扩散分析、社会关系网络还原和社会关系网络挖掘或其他标准化基础数据分析模型。
6.一种人群的特定倾向性感知系统,其特征在于,包括:
输入法数据源子系统,归集和存储有待分析人群的输入法数据信息;
倾向性特征库子系统,具有至少一个特定倾向性的特征信息的集合;以及
倾向性匹配子系统,将输入法数据源子系统中的数据信息与倾向性特征库子系统中的特性信息进行比对,并对具有某一特定倾向性的人群进行标记,筛选出具有至少一个特定倾向性的目标人群。
7.按照权利要求6所述的人群的特定倾向性感知系统,其特征在于:所述输入法数据子系统包括
多源数据归集模块,对待分析人群的各种输入法数据进行归集,输入法数据包括但不限于:输入文本、输入时间、输入所在平台、设备标识码、注册账号;
多源数据预处理模块,对所采集的数据进行预处理,根据清洗机制或筛除机制,清除噪音信息或空白信息;以及
输入法数据库模块,基于预处理后的数据源构建输入法数据源基础库,进行存储管理并建立查询检索机制,提供多种数据接口支撑特定倾向性人群的挖掘。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110245534.0/1.html,转载请声明来源钻瓜专利网。