[发明专利]一种公式识别模型的训练方法及装置在审

申请号：	202111155060.7	申请日：	2021-09-29
公开（公告）号：	CN113919293A	公开（公告）日：	2022-01-11
发明（设计）人：	刘水;辛晓哲	申请（专利权）人：	北京搜狗科技发展有限公司
主分类号：	G06F40/126	分类号：	G06F40/126;G06F40/30;G06N20/00
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	储倩
地址：	100084 北京市海淀区中关***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种公式识别模型训练方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种公式识别模型的训练方法，根据训练公式轨迹和训练公式轨迹对应的公式，训练得到公式识别模型。在训练公式识别模型时，对训练公式轨迹进行特征提取，得到特征序列；在第一解码时刻：对第一语义向量和特征序列进行解码，得到第一上下文向量，其中，第一语义向量根据第二解码时刻解码得到的第一隐层向量得到，第二解码时刻为第一解码时刻的前一解码时刻；基于第一上下文向量以及标签，对公式识别模块的参数进行调整。由此可见，在模型训练阶段，基于第一语义向量和特征序列进行解码，从而使得训练得到的公式识别模型，能够自适应融合语义信息，从而使得该公式识别模型的识别准确度更高。

技术领域

本申请涉及数据处理领域，特别是涉及一种公式识别模型的训练方法及装置。

背景技术

目前，机器学习模型可以对公式轨迹进行识别，以得到所述公式轨迹对应的公式。但是，目前用于识别公式轨迹的公式识别模型，并不能准确的识别出公式轨迹对应的公式。本申请中提及的公式轨迹，包括组成公式的一个个轨迹点。

因此，急需一种方案，能够准确是根据公式轨迹识别得到对应的公式。

发明内容

本申请所要解决的技术问题是公式识别模型并不能准确的识别出公式轨迹对应的公式，提供一种公式识别模型的训练方法及装置。

第一方面，本申请实施例提供了一种公式识别模型的训练方法，所述方法包括：

获取训练公式轨迹和所述训练公式轨迹对应的标签，所述训练公式轨迹对应的标签，用于指示所述训练公式轨迹对应的公式；

基于所述训练公式轨迹和所述标签，通过如下方式训练得到公式识别模型：

对所述训练公式轨迹进行特征提取，得到特征序列；

在第一解码时刻：