[发明专利]基于依存分析实现菜名实体识别的方法有效
申请号: | 201910354720.0 | 申请日: | 2019-04-29 |
公开(公告)号: | CN110222332B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 杨晓燕;庄泽彬;陈子扬;徐戈;李佐勇 | 申请(专利权)人: | 闽江学院 |
主分类号: | G06F40/295 | 分类号: | G06F40/295 |
代理公司: | 厦门原创专利事务所(普通合伙) 35101 | 代理人: | 徐东峰 |
地址: | 350108 福建*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 依存 分析 实现 实体 识别 方法 | ||
1.一种基于依存分析实现菜名实体识别的方法,其特征在于,包括以下步骤:
S1,建立菜名语料库;
S2,对所述菜名语料库中每一语料通过哈工大语言技术平台工具进行预处理,包括分词、词性标注、父亲词所在位置的标注以及依存关系的标注;
哈工大语言技术平台工具采用863词性标注集,其各个词性含义如下:a表示形容词、b表示名词修饰语、c表示连词、d表示副词、e表示感叹词、g表示词素、h表示前缀、i表示习语、j表示缩写词、k表示后缀、m表示数量、n表示一般名词、nd表示方位名词、nh表示人名、ni表示组织名称、nl表示位子名词、ns表示地名、nt表示时间名词、nz表示其他专有名词、o表示拟声词、p表示介词、q表示量词、r表示代词、u表示助词、v表示动词、wp表示标点符号、ws表示外语词汇和x表示非词位;
哈工大语言技术平台工具采用的依存句法分析标注依存关系,其含义如下:SBV表示主谓关系、VOB表示动宾关系、IOB表示间宾关系、ATT定中关系、ADV表示状中结构、CMP表示动补结构、COO表示并列关系、POB表示介宾关系、LAD表示左附加关系、RAD表示右附加关系、IS表示独立结构和HED表示核心关系;
S3,读取当前行,并寻找词性是名词的词语作为候选词;
S4,判断候选词与其父亲词的依存关系,判断所述依存关系是否为定中关系、主谓关系或并列关系,是,输出满足依存关系的候选词作为候选菜名并进入步骤S5,否,读取下一行,并进入步骤S3;
S5,获取候选菜名的父亲词,并判断候选菜名的父亲词与root的关系是否为核心关系,是,输出满足依存关系的候选词作为实际菜名,否,读取下一行,并进入步骤S3。
2.如权利要求1所述的基于依存分析实现菜名实体识别的方法,其特征在于,所述建立菜名语料库的步骤包括:
从网络上下载客户对商家的评论文本建立菜名语料库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于闽江学院,未经闽江学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910354720.0/1.html,转载请声明来源钻瓜专利网。