[发明专利]一种实现信息处理的方法、装置、计算机存储介质及终端有效

申请号：	201911308581.4	申请日：	2019-12-18
公开（公告）号：	CN111178066B	公开（公告）日：	2023-05-09
发明（设计）人：	李嘉琛;付骁弈;陈栋;姜旭	申请（专利权）人：	北京明略软件系统有限公司
主分类号：	G06F40/289	分类号：	G06F40/289;G06F40/295;G06F40/30;G06F18/22
代理公司：	北京安信方达知识产权代理有限公司 11262	代理人：	王康;栗若木
地址：	100084 北京市海淀区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种实现信息处理方法装置计算机存储介质终端
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种实现信息处理的方法、装置、计算机存储介质及终端，包括：对预测语句和标准语句分别进行分词和依存句法分析；从依存句法分析的结果中，分别提取预测语句的第一集合和标准语句的第二集合；对第一集合和第二集合中包含的语义组成信息进行匹配处理；根据匹配处理的结果确定文本预测模型的准确度信息；其中，所述预测语句由所述文本预测模型生成；所述第一集合和所述第二集合包括以下一项或任意组合的语义组成信息：实体、实体与关系、及实体与属性。本发明实施例提升了对文本预测模型进行评估的准确度。

技术领域

本文涉及但不限于文本分析技术，尤指一种实现信息处理的方法、装置、计算机存储介质及终端。

背景技术

现有评估文本预测模型的指标大多是字词匹配，即评估的是预测语句和标准语句共有词语的数量；当使用表达方式和词汇不同时，相关技术无法对文本预测模型进行准确评估；例如：A shiny metal pot filled with some diced veggies(一个闪亮的金属锅放满了切碎的蔬菜)和The pan on the stove has chopped vegetables in it(炉子上一个平底锅里有切过的蔬菜)，语义虽然相似，但因没有共有词语被评估为相似度低。此外，一些预测语句和标准语句虽然包含的共有词语的数量较多，但语句描述的主体和场景可能不同，通过共有词语的数量进行评估并不准确；例如：A young girl is standing on top ofa tennis court.(一个年轻女孩站在网球场上)和A giraffe is standing on top of agreen field(一个长颈鹿站在草地上)，虽然都包括了“is standing on top of a”这几个单词，但评估预测语句和标准语句相似，显然是不准确的。

综上，如何提升对文本预测模型进行评估的准确度，成为一个有待解决的技术问题。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本发明实施例提供一种实现信息处理的方法、装置、计算机存储介质及终端，能够提升对文本预测模型进行评估的准确度。

本发明实施例提供了一种实现信息处理的方法，包括：

对预测语句和标准语句分别进行分词和依存句法分析；

从依存句法分析的结果中，分别提取预测语句的第一集合和标准语句的第二集合；

对第一集合和第二集合中包含的语义组成信息进行匹配处理；

根据匹配处理的结果确定文本预测模型的准确度信息；

其中，所述预测语句由所述文本预测模型生成；所述第一集合和所述第二集合包括以下一项或任意组合的语义组成信息：实体、实体与关系、及实体与属性。

在一种示例性实施例中，所述第一集合和所述第二集合为：

各所述语义组成信息通过对应的元组记录的集合。