[发明专利]具象名词识别方法、装置及计算机可读存储介质有效
申请号: | 201711226646.1 | 申请日: | 2017-11-29 |
公开(公告)号: | CN107918606B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 邵翔宇;乔忠良;万韶华 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 林锦澜 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具象 名词 识别 方法 装置 计算机 可读 存储 介质 | ||
1.一种具象名词识别方法,其特征在于,所述方法包括:
从待识别的第一句子中删除预设非具象名词,得到第二句子;
基于第二名词库,获取所述第二句子中的至少一个候选具象名词,所述第二名词库用于衡量所述第一句子中的任一单词是否为正确名词;
对于所述至少一个候选具象名词中的每个候选具象名词,将所述候选具象名词和所述候选具象名词的单词位置标识组成字符串,得到至少一个字符串;
当所述至少一个字符串中任意两个字符串的单词位置标识连续时,将所述两个字符串聚合为一个字符串;
删除每个字符串中的单词位置标识,将得到的至少一个单词作为所述第一句子中的正确具象名词。
2.根据权利要求1所述的方法,其特征在于,所述从待识别的第一句子中删除预设非具象名词,得到第二句子,包括以下至少一项:
当所述第一句子包含预设数字单词集合中的任一数字单词时,从所述第一句子中删除所述数字单词,所述预设数字单词集合包括至少一个数字单词;
当所述第一句子包含预设颜色单词集合中的任一颜色单词时,从所述第一句子中删除所述颜色单词,所述预设颜色单词集合包括至少一个颜色单词;
当所述第一句子包含预设物主代词单词集合中的任一代词时,从所述第一句子中删除所述代词,所述预设物主代词单词集合包括至少一个代词;
当所述第一句子包含第一预设词组集合中的任一词组时,从所述第一句子中删除所述词组,所述第一预设词组集合包括至少一个词组,所述至少一个词组中每个词组的语义不为具象名词,且所述每个词组中的单词依次为名词、介词和名词。
3.根据权利要求1所述的方法,其特征在于,所述基于第二名词库,获取所述第二句子中的至少一个候选具象名词,包括:
当所述第二句子中的任一单词属于所述第二名词库时,将所述单词作为候选具象名词;或,
当所述第二句子中的任一单词属于所述第二名词库,且所述单词不属于喻体单词集合时,将所述单词作为候选具象名词,所述喻体单词集合包括至少一个在所述第二句子中充当具象名词的喻体的单词。
4.根据权利要求3所述的方法,其特征在于,所述当所述第二句子中的任一单词属于所述第二名词库,且所述单词不属于喻体单词集合时,将所述单词作为候选具象名词之前,所述方法还包括:
当所述第二句子中包括预设物主代词时,获取所述第二句子中所述预设物主代词之后的第一个单词,将所述第一个单词添加至所述喻体单词集合中。
5.根据权利要求1所述的方法,其特征在于,所述从待识别的第一句子中删除预设非具象名词,得到第二句子之后,所述方法还包括:
获取第二预设词组集合,所述第二预设词组集合包括至少一个词组,所述至少一个词组中每个词组的语义为具象名词,且所述每个词组包括形容词和具象名词,且所述每个词组删除形容词后的语义和删除形容词前的语义不同;
当所述第二句子中包括第二预设词组集合中的任一词组时,将所述词组中的形容词作为候选具象名词。
6.根据权利要求1所述的方法,其特征在于,所述从待识别的第一句子中删除预设非具象名词,得到第二句子之后,所述方法还包括:
当所述第二句子中包括of时,获取所述第二句子中所述of的前一个单词;
当所述至少一个候选具象名词中包括所述of的前一个单词时,从所述至少一个候选具象名词中删除所述of的前一个单词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711226646.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种拖拉机牵引式草坪专用碾压装置
- 下一篇:一种喷灌滴灌一体装置