[发明专利]藏文分词信息处理方法、系统、存储介质、终端及应用在审
申请号: | 202110380044.1 | 申请日: | 2021-04-09 |
公开(公告)号: | CN113051913A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 刘清民;程国艮 | 申请(专利权)人: | 中译语通科技股份有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/284;G06F40/242;G06N3/04;G06N3/08 |
代理公司: | 北京万贝专利代理事务所(特殊普通合伙) 11520 | 代理人: | 马红 |
地址: | 100131 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于信息处理技术领域,公开了一种藏文分词信息处理方法、系统、存储介质、终端及应用,所述藏文分词信息处理方法通过词向量、卷积神经网络以及条件随机场对分词语料进行学习,生成藏文单词分界规则,最终实现对藏文的分词。所述藏文分词信息处理系统包括:词向量预处理模块;模型结构搭建模块;词向量训练模块;词向量训练停止判断模块。在藏文中,本发明使用人工神经网络和深度学习解决,通过学习藏文词向量,利用卷积神经网络(CNN)模型和条件随机场(CRF)来预测单词的边界;将句子中的字符序列与手动标记的单词边界的序列进行匹配来迭代地训练网络,获得权重,也就是最后的参数。 | ||
搜索关键词: | 藏文 分词 信息处理 方法 系统 存储 介质 终端 应用 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中译语通科技股份有限公司,未经中译语通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110380044.1/,转载请声明来源钻瓜专利网。