[发明专利]一种医学术语词库词性标注方法有效
申请号: | 201610405125.1 | 申请日: | 2016-06-08 |
公开(公告)号: | CN106095754B | 公开(公告)日: | 2018-06-19 |
发明(设计)人: | 蒋君;冯前进;庞树茂 | 申请(专利权)人: | 广州同构医疗科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510063 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种医学术语词库词性标注方法,包括以下步骤:S1、收集待标注词条:通过人工或算法收集待标注的词条,将这些词条保存到数据库或一个文件;S2、合成词性标注验证码图像:将收集的每个词条均转换为图像,并加入随机干扰线,形成验证码图像;S3、建立词性标注验证码数据库:以全球唯一识别号为主键,将每个词条与验证码图像对应起来,存入数据库;S4、验证码获取请求配发;S5、验证码校验请求响应;S6、词性标注结果确认;该方法将医学术语词性的标注工作分散到互联网验证码中,大大降低了医学术语词库建设的人工成本,使词库词汇量的扩充成为一个可持续的工作。 1 | ||
搜索关键词: | 验证码 词性标注 医学术语 词条 词库 图像 标注 数据库 词条保存 获取请求 结果确认 全球唯一 人工成本 随机干扰 校验请求 词汇量 词性 配发 算法 合成 互联网 响应 转换 建设 | ||
【主权项】:
1.一种医学术语词库词性标注方法,其特征在于,包括以下步骤:S1、收集待标注词条:通过人工或算法收集待标注的词条,将这些词条保存到数据库或一个文件;S2、合成词性标注验证码图像:将收集的每个词条均转换为图像,并加入随机干扰线,形成验证码图像;S3、建立词性标注验证码数据库:以全球唯一识别号为主键,将每个词条与验证码图像对应起来,存入数据库;S4、验证码获取请求配发:开放词性标注验证码图像数据库访问接口,为有验证码需求的网站页面免费提供验证码,需求方发送验证码获取请求后,本地系统将随机从数据库抽取一幅图像,图像名与全球唯一识别号相同,并返回至需求方,需求方在验证码输入页面配置若干个词性标注框,以便用户在指定词性的标注框内输入验证码图像中的肉眼识别内容;S5、验证码校验请求响应:远端网页用户输入验证内容并提交后,网页后台将用户输入内容、用户词性标注结果、验证图像全球唯一识别号一并以特定格式封装,发送至本地系统,本地系统根据词性标注验证码数据库比对全球唯一识别号与用户输入内容的一致性,并刷新用户对该词条的词性标注结果及词性标注次数;S6、词性标注结果确认:当某个词条被用户标注的次数达到一定阈值后,选取概率最高的用户标注结果作为该词条对应的词性,同时,系统会删除该词条,不再对该词条进行标注。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州同构医疗科技有限公司,未经广州同构医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610405125.1/,转载请声明来源钻瓜专利网。