[发明专利]一种文本检测方法和装置有效
| 申请号: | 202111375440.1 | 申请日: | 2021-11-19 | 
| 公开(公告)号: | CN114065742B | 公开(公告)日: | 2023-08-25 | 
| 发明(设计)人: | 李长林;蒋宁;王洪斌;吴海英;权佳成;曹磊 | 申请(专利权)人: | 马上消费金融股份有限公司 | 
| 主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F40/279;G06F40/211;G06F18/241;G06F18/214 | 
| 代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新 | 
| 地址: | 401120 重庆市渝北区*** | 国省代码: | 重庆;50 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 文本 检测 方法 装置 | ||
本发明公开一种文本检测方法和装置,用以解决文本检测不准确和普适性差的问题。本方案包括:获取至少一个待检测文本,待检测文本包括通讯记录,通讯记录包括基于顺序的多条语句;将待检测文本输入情感识别模型,得到待检测文本的情感极性集合,情感极性集合用于按序表征多条语句各自对应的情感极性;根据情感极性集合确定待检测文本的情感评分值;根据情感评分值确定待检测文本的文本类型。上述情感极性集合能表征文本的情感变化顺序。基于情感变化顺序确定待检测文本的情感评分值,能使情感评分值准确表达待检测文本的情感,进而有效提高文本分类的准确性。而且,本方案可以应用通用型的情感识别模型,无需针对应用场景做模型训练,普适性强。
技术领域
本发明涉及文本检测领域,尤其涉及一种文本检测方法和装置。
背景技术
在文本检测领域,可以通过识别文本内容进行文本分类。由于不同的应用场景要进行的检测往往不同,所以通常要预先训练适用于场景的模型。在训练过程中,需要依赖大量标注样本执行训练,而这些样本需要耗费大量的人力与时间进行打标。训练得到的模型能够适配于所需的应用场景,但不便于扩展迁移到其他应用场景,普适性差。
虽然现有技术中有通用型的情感识别模型,能简单识别单句文本的情感,但这种模型难以对整段、整篇文本的情感进行识别。离散地识别出文本中各句表达的情感,也无法准确确定文本整体表达的情感,识别准确性差。
如何提高文本检测的准确性和普适性,是本申请所要解决的技术问题。
发明内容
本申请实施例的目的是提供一种文本检测方法和装置,用以解决文本检测不准确和普适性差的问题。
第一方面,提供了一种文本检测方法,包括:
获取至少一个待检测文本,所述待检测文本包括通讯记录,所述通讯记录包括基于顺序的多条语句;
将所述待检测文本输入情感识别模型,得到所述待检测文本的情感极性集合,所述情感极性集合用于按序表征所述多条语句各自对应的情感极性;
根据所述情感极性集合确定所述待检测文本的情感评分值;
根据所述情感评分值确定所述待检测文本的文本类型,其中,所述文本类型包括第一类文本以及第二类文本。
第二方面,提供了一种文本检测装置,包括:
获取模块,获取至少一个待检测文本,所述待检测文本包括通讯记录,所述通讯记录包括基于顺序的多条语句;
识别模块,将所述待检测文本输入情感识别模型,得到所述待检测文本的情感极性集合,所述情感极性集合用于按序表征所述多条语句各自对应的情感极性;
第一确定模块,根据所述情感极性集合确定所述待检测文本的情感评分值;
第二确定模块,根据所述情感评分值确定所述待检测文本的文本类型,其中,所述文本类型包括第一类文本以及第二类文本。
第三方面,提供了一种电子设备,该电子设备包括处理器、存储器及存储在该存储器上并可在该处理器上运行的计算机程序,该计算机程序被该处理器执行时实现如第一方面的方法的步骤。
第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质上存储计算机程序,该计算机程序被处理器执行时实现如第一方面的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司,未经马上消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111375440.1/2.html,转载请声明来源钻瓜专利网。





