[发明专利]一种基于概念的语义识别方法及装置在审
| 申请号: | 201810748970.8 | 申请日: | 2018-07-10 |
| 公开(公告)号: | CN108984527A | 公开(公告)日: | 2018-12-11 |
| 发明(设计)人: | 董文平 | 申请(专利权)人: | 广州极天信息技术股份有限公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫 |
| 地址: | 510000 广东省广州市海珠*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 字符串 分词 词语概念 路径存储 语义识别 语义网 消歧 匹配 文本 词义 概念识别 文本语义 准确率 词语 输出 保存 成功 | ||
1.一种基于概念的语义识别方法,包括如下步骤:
步骤S1,对待分词的文本进行分词,获得多个已分词字符串;
步骤S2,将已分词字符串与语义网的所有节点进行匹配;
步骤S3,对成功匹配语义网节点的字符串进行词义消歧处理,得到消歧后的字符串的概念路径,保存于词语概念路径存储库内;
步骤S4,输出该待分词的文本的字符串在所述词语概念路径存储库内的概念路径。
2.如权利要求1所述的一种基于概念的语义识别方法,其特征在于:于步骤S1中,调用多语言语义网引擎对文本里的字符进行分词。
3.如权利要求2所述的一种基于概念的语义识别方法,其特征在于:于步骤S1之前,还包括如下步骤:对所述待分词的文本进行语种识别,以便步骤S1调用相应的语种的语义网引擎进行分词。
4.如权利要求1所述的一种基于概念的语义识别方法,其特征在于:于步骤S3中,如果成功与该语义网节点匹配的字符串与超过一个语义网节点匹配上,则对该字符串进行词义消歧,将消歧后的该字符串的概念路径R2保存到所述词语概念路径存储库内。
5.如权利要求4所述的一种基于概念的语义识别方法,其特征在于:于步骤S3中,如果成功与语义网节点匹配的字符串只能与语义网中一个节点匹配,则该字符串不需要进行词义消歧,将该字符串的概念路径R1保存到所述词语概念路径存储库内。
6.一种基于概念的语义识别装置,包括如下步骤:
分词单元,用于对待分词的文本进行分词,获得多个已分词字符串;
语义网匹配单元,用于将已分词所有字符串与语义网的所有节点进行匹配;
词义消歧处理单元,用于对成功匹配语义网节点的字符串进行词义消歧处理,得到消歧后的字符串的概念路径,保存于词语概念路径存储库内;
概念路径输出单元,用于输出该待分词的文本的字符串在所述词语概念路径存储库内的概念路径。
7.如权利要求6所述的一种基于概念的语义识别装置,其特征在于:所述分词单元调用多语言语义网引擎对文本里的字符进行分词。
8.如权利要求7所述的一种基于概念的语义识别装置,其特征在于:所述装置还包括语种识别单元,用于对所述待分词的文本进行语种识别,以便所述分词单元调用相应的语种的语义网引擎进行分词。
9.如权利要求6所述的一种基于概念的语义识别装置,其特征在于:如果成功与该语义网节点匹配的字符串与超过一个语义网节点匹配上,所述词义消歧处理单元则对该字符串进行词义消歧,将消歧后的该字符串的概念路径R2保存到所述词语概念路径存储库内。
10.如权利要求9所述的一种基于概念的语义识别方法,其特征在于:如果成功与语义网节点匹配的字符串只能与语义网中一个节点匹配,所述词义消歧处理单元则不对该字符串进行词义消歧,直接将该字符串的概念路径R1保存到所述词语概念路径存储库内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州极天信息技术股份有限公司,未经广州极天信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810748970.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于深度学习的文档主题向量抽取方法
- 下一篇:一种基于思维距离的社交方法





