[发明专利]文本数据的处理方法和装置在审
申请号: | 201410328559.7 | 申请日: | 2014-07-10 |
公开(公告)号: | CN104090866A | 公开(公告)日: | 2014-10-08 |
发明(设计)人: | 黄佳嘉 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 吴贵明;张永明 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 数据 处理 方法 装置 | ||
技术领域
本发明涉及数据处理领域,具体而言,涉及一种文本数据的处理方法和装置。
背景技术
情绪是社会人群特有的一种情感趋向,情绪是一种看不见,摸不着的一种人造信息,对于通过文本数据所表达的情绪信息而言,这种信息的实际的捕捉力比较低、难以间接化测量,同时此种表达方式的情绪,不容易被直接可见的方式表达出来。
在大数据的环境下,情绪的表达范围不再是个体的情绪偏向,而是侧重于表达群体的情绪偏向,如果个人文本数据能够被获取和分析,并得到准确的个人地理定位,将可以表达个人情绪偏向,当个人情绪偏向聚集时,形成更为精确的集体情绪偏向。目前,主要通过对文本的语义进行拆分,并将拆分的词语与词库中的词语进行对比,获得相关词语的偏向值,从而获得代表情绪偏向的值。或者在海量文本对文本句子进行拆分,对相同词语进行叠加获取,然后获取总词汇的综合出现的文字,然后将这些文字与词库进行对比,从而获得海量文本的情感偏向。
不过,现有的情绪的测量方法基本固定,通过对文本的拆分,获取词语,通过筛选,去噪,从而获得清晰的信息,然后将这些处理过的文本的和词库里面的词语进行对比,获得这个词的词性的情感偏向。但是用户也很难直观的感受到情绪实际的偏向,阅读性,感知能力比较低,难以直观地说明情绪偏向,更难以将情绪的测量方法普及应用。
针对相关技术中难以对通过文本数据的情绪进行直观表达的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种文本数据的处理方法和装置,以解决现有技术中难以对通过文本数据传播的情绪进行直观表达的问题。
根据本发明的一个方面,提供了一种文本数据的处理方法。
根据本发明的文本数据的处理方法包括:获取用户发布的文本数据和所述用户所处的地理位置;对所述文本数据进行文字拆分,并从拆分后的文字中提取目标文字;对所述目标文字进行分析,得到所述目标文字对应的目标偏向值;关联所述地理位置和所述目标偏向值;以及在表示所述地理位置的区域内显示所述目标偏向值。
进一步地,在对所述目标文字进行分析,得到所述目标文字对应的目标偏向值之后,所述处理方法还包括:查找与所述目标偏向值对应的颜色,得到目标颜色,关联所述地理位置和所述目标偏向值包括:关联所述地理位置、所述目标偏向值和所述目标颜色,在表示所述地理位置的区域内显示所述目标偏向值包括:在表示所述地理位置的区域内,以所述目标颜色显示所述目标偏向值。
进一步地,在查找与所述目标偏向值对应的颜色,得到目标颜色之前,所述处理方法还包括:确定与第一预设偏向值对应的颜色为第一预设颜色;以及确定与第二预设偏向值对应的颜色为第二预设颜色,其中,所述第二预设偏向值大于所述第一预设偏向值,并且所述第一预设颜色和所述第二预设颜色为不同的颜色,查找与所述目标偏向值对应的颜色,得到目标颜色包括:从所述第一预设颜色至所述第二预设颜色的颜色渐变或跳变区间内,查找与所述目标偏向值对应的颜色,得到所述目标颜色。
进一步地,对所述目标文字进行分析,得到所述目标文字对应的目标偏向值包括:将所述目标文字与预设数据库中的预设文字进行比对,得到所述目标偏向值。
进一步地,获取所述用户所处的地理位置包括:获取所述用户使用的网络地址;以及解析所述网络地址,得到所述地理位置。
根据本发明的另一方面,提供了一种文本数据的处理装置。
根据本发明的文本数据的处理装置包括:获取单元,用于获取用户发布的文本数据和所述用户所处的地理位置;第一处理单元,用于对所述文本数据进行文字拆分,并从拆分后的文字中提取目标文字;第二处理单元,用于对所述目标文字进行分析,得到所述目标文字对应的目标偏向值;关联单元,用于关联所述地理位置和所述目标偏向值;以及显示单元,用于在表示所述地理位置的区域内显示所述目标偏向值。
进一步地,所述处理装置还包括:查找单元,用于查找与所述目标偏向值对应的颜色,得到目标颜色,所述关联单元还用于关联所述地理位置、所述目标偏向值和所述目标颜色,所述显示单元还用于在表示所述地理位置的区域内,以所述目标颜色显示所述目标偏向值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410328559.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频文件的分类方法及装置
- 下一篇:一种扩展智能终端外部接口的系统及方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置