[发明专利]一种实现信息处理的方法、装置、计算机存储介质及终端有效
申请号: | 201911308581.4 | 申请日: | 2019-12-18 |
公开(公告)号: | CN111178066B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 李嘉琛;付骁弈;陈栋;姜旭 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/295;G06F40/30;G06F18/22 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 王康;栗若木 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实现 信息处理 方法 装置 计算机 存储 介质 终端 | ||
一种实现信息处理的方法、装置、计算机存储介质及终端,包括:对预测语句和标准语句分别进行分词和依存句法分析;从依存句法分析的结果中,分别提取预测语句的第一集合和标准语句的第二集合;对第一集合和第二集合中包含的语义组成信息进行匹配处理;根据匹配处理的结果确定文本预测模型的准确度信息;其中,所述预测语句由所述文本预测模型生成;所述第一集合和所述第二集合包括以下一项或任意组合的语义组成信息:实体、实体与关系、及实体与属性。本发明实施例提升了对文本预测模型进行评估的准确度。
技术领域
本文涉及但不限于文本分析技术,尤指一种实现信息处理的方法、装置、计算机存储介质及终端。
背景技术
现有评估文本预测模型的指标大多是字词匹配,即评估的是预测语句和标准语句共有词语的数量;当使用表达方式和词汇不同时,相关技术无法对文本预测模型进行准确评估;例如:A shiny metal pot filled with some diced veggies(一个闪亮的金属锅放满了切碎的蔬菜)和The pan on the stove has chopped vegetables in it(炉子上一个平底锅里有切过的蔬菜),语义虽然相似,但因没有共有词语被评估为相似度低。此外,一些预测语句和标准语句虽然包含的共有词语的数量较多,但语句描述的主体和场景可能不同,通过共有词语的数量进行评估并不准确;例如:A young girl is standing on top ofa tennis court.(一个年轻女孩站在网球场上)和A giraffe is standing on top of agreen field(一个长颈鹿站在草地上),虽然都包括了“is standing on top of a”这几个单词,但评估预测语句和标准语句相似,显然是不准确的。
综上,如何提升对文本预测模型进行评估的准确度,成为一个有待解决的技术问题。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本发明实施例提供一种实现信息处理的方法、装置、计算机存储介质及终端,能够提升对文本预测模型进行评估的准确度。
本发明实施例提供了一种实现信息处理的方法,包括:
对预测语句和标准语句分别进行分词和依存句法分析;
从依存句法分析的结果中,分别提取预测语句的第一集合和标准语句的第二集合;
对第一集合和第二集合中包含的语义组成信息进行匹配处理;
根据匹配处理的结果确定文本预测模型的准确度信息;
其中,所述预测语句由所述文本预测模型生成;所述第一集合和所述第二集合包括以下一项或任意组合的语义组成信息:实体、实体与关系、及实体与属性。
在一种示例性实施例中,所述第一集合和所述第二集合为:
各所述语义组成信息通过对应的元组记录的集合。
在一种示例性实施例中:
所述实体与关系包括以下一项或任意组合:主谓宾关系、介宾关系;
所述实体与属性包括以下一项或任意组合:形容词性修饰关系、名词性修饰关系、名词性复合修饰关系。
在一种示例性实施例中,所述对第一集合和第二集合中包含的语义组成信息进行匹配处理,包括:
确定所述第一集合和所述第二集合中各元组包含的元素个数;
对所述第一集合和所述第二集合中元素个数相同的元组进行匹配处理。
在一种示例性实施例中,所述对第一集合和第二集合中元素个数相同的元组进行匹配处理,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911308581.4/2.html,转载请声明来源钻瓜专利网。