[发明专利]分词方法、装置、电子设备和可读存储介质有效
| 申请号: | 202110217357.5 | 申请日: | 2021-02-26 |
| 公开(公告)号: | CN112949298B | 公开(公告)日: | 2022-10-04 |
| 发明(设计)人: | 郑国凯 | 申请(专利权)人: | 维沃移动通信有限公司 |
| 主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/30 |
| 代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;王淑梅 |
| 地址: | 523863 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 分词 方法 装置 电子设备 可读 存储 介质 | ||
1.一种分词方法,其特征在于,包括:
接收输入第一字符的第一输入;
在所述第一字符包括目标字符的情况下,对第一分词模型的语义特征维度进行筛选,得到包括第一语义特征维度的第二分词模型;
基于所述第一语义特征维度增加所述目标字符对应的第二语义特征维度,获得第三分词模型;
基于所述第三分词模型对所述第一字符分词。
2.根据权利要求1所述的分词方法,其特征在于,所述对第一分词模型的语义特征维度进行筛选,得到包括第一语义特征维度的第二分词模型,包括:
确定所述第一分词模型中第N个语义特征维度的特征值与第M个语义特征维度的特征值的第一差值,其中N不等于M;
在所述第一差值的绝对值大于或等于第一预设值的情况下,删除所述第N个语义特征维度;
基于删除后的语义特征维度筛选第一语义特征维度,获得包括第一语义特征维度的第二分词模型。
3.根据权利要求1所述的分词方法,其特征在于,所述对第一分词模型的语义特征维度进行筛选,得到包括第一语义特征维度的第二分词模型,包括:
确定所述第一分词模型的语义特征维度的平均特征值;
确定所述平均特征值与所述第一分词模型中每个语义特征维度的特征值的第二差值;
基于所述第二差值筛选得到第一语义特征维度,获得包括第一语义特征维度的第二分词模型。
4.根据权利要求1所述的分词方法,其特征在于,所述对第一分词模型的语义特征维度进行筛选,得到包括第一语义特征维度的第二分词模型,包括:获取所述目标字符对应的第二语义特征维度的平均特征值;
确定所述平均特征值与所述第一分词模型中每个语义特征维度的特征值的第三差值;
基于所述第三差值筛选得到第一语义特征维度,获得包括第一维度的第二分词模型。
5.根据权利要求1至4中任一项所述的分词方法,其特征在于,所述基于所述第三分词模型对所述第一字符分词,具体包括:
基于所述第三分词模型对所述第一字符进行标注;
根据标注结果对所述第一字符进行分词。
6.一种分词装置,其特征在于,包括:
接收单元,用于接收输入第一字符的第一输入;
筛选单元,用于在所述第一字符包括目标字符的情况下,对第一分词模型的语义特征维度进行筛选,得到包括第一语义特征维度的第二分词模型;
确定单元,用于基于所述第一语义特征维度增加所述目标字符对应的第二语义特征维度,获得第三分词模型;
分词单元,用于基于所述第三分词模型对所述第一字符分词。
7.根据权利要求6所述的分词装置,其特征在于,所述筛选单元具体用于,
确定所述第一分词模型中第N个语义特征维度的特征值与第M个语义特征维度的特征值的第一差值,其中N不等于M;
在所述第一差值的绝对值大于或等于第一预设值的情况下,删除所述第N个语义特征维度;
基于删除后的语义特征维度筛选第一语义特征维度,
获得包括第一语义特征维度的第二分词模型。
8.根据权利要求6所述的分词装置,其特征在于,所述筛选单元具体用于,
确定所述第一分词模型的语义特征维度的平均特征值;
确定所述平均特征值与所述第一分词模型中每个语义特征维度的特征值的第二差值;
基于所述第二差值筛选得到第一语义特征维度,获得包括第一语义特征维度的第二分词模型。
9.根据权利要求6所述的分词装置,其特征在于,所述筛选单元具体用于,
获取所述目标字符对应的第二语义特征维度的平均特征值;
确定所述平均特征值与所述第一分词模型中每个语义特征维度的特征值的第三差值;
基于所述第三差值筛选得到第一语义特征维度,获得包括第一维度的第二分词模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于维沃移动通信有限公司,未经维沃移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110217357.5/1.html,转载请声明来源钻瓜专利网。





