[发明专利]一种评价信息的抽取方法、装置及设备有效
申请号: | 201810358721.8 | 申请日: | 2018-04-20 |
公开(公告)号: | CN108614814B | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 何溢;张浩川;余荣;谢嘉元;吴耿楠 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 510060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种评价信息抽取方法,通过对评论文本进行分词,得到由多个词组成的词序列,在得到词序列之后,只需要将词分别与该词相邻的预设个数的词组成词对,然后计算各个词对的相似度,并从中确定相似度最大的预设个数的词对,最后将其作为评价信息抽取出来,避免了对整句评论文本的分析,不需要预先已标注的训练词序列,也不需要构建复杂的模型或特征向量,更不需要考虑复杂的语法规则,大大降低了抽取评价信息的复杂度。此外,本发明还提供了一种评价信息的抽取装置、设备以及一种计算机可读存储介质,其作用与上述方法相对应。 | ||
搜索关键词: | 一种 评价 信息 抽取 方法 装置 设备 | ||
【主权项】:
1.一种评价信息的抽取方法,其特征在于,包括:对评论文本进行分词,得到由多个词组成的词序列;遍历所述词序列,将所述词与满足预设条件的词组成词对,其中,满足所述预设条件的词为在所述词序列中与该词相邻的且位于该词前的第一预设个数的词、以及位于该词后的第二预设个数的词;计算各个所述词对中词与词之间的相似度,得到多个相似度值;确定所述相似度值中最大的第三预设个数的相似度值,并将所述相似度值所对应的词对作为评价信息抽取出来。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810358721.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种股市题材舆情热度计算方法及系统装置
- 下一篇:句子交互方法和装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置