[发明专利]从文本中识别行业专有名词的方法和装置在审
申请号: | 202110274914.7 | 申请日: | 2021-03-15 |
公开(公告)号: | CN115081442A | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 张家豪;吴亦振;许达果 | 申请(专利权)人: | 慧科讯业有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216 |
代理公司: | 北京市君合律师事务所 11517 | 代理人: | 王再芊;毕长生 |
地址: | 中国香港湾仔告士打道*** | 国省代码: | 香港;81 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开涉及从文本中识别行业专有名词的方法和装置。该方法包括:对文本进行断词(11),获得经断词的文本;从经断词的文本中抽取种子词前后相邻的词语作为词夹(12),所述种子词是已知的行业专有名词;从文本中抽取词夹所夹的词语作为候选词(13);根据候选词对应的词夹计算候选词分数(14);根据候选词分数从候选词中选取行业专有名词(15)。本公开的技术方案利用已知的行业专有名词作为种子词从文本中抽取词夹,进而利用词夹从文本中抽取行业专有名词的候选词并且计算候选词分数,使得能够根据候选词分数高效且准确地从候选词中选取行业专有名词。 | ||
搜索关键词: | 文本 识别 行业 专有名词 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于慧科讯业有限公司,未经慧科讯业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110274914.7/,转载请声明来源钻瓜专利网。