[发明专利]文本标点确定方法与装置、存储介质、电子设备在审
申请号: | 202010261395.6 | 申请日: | 2020-04-03 |
公开(公告)号: | CN111414745A | 公开(公告)日: | 2020-07-14 |
发明(设计)人: | 聂镭;李睿;聂颖 | 申请(专利权)人: | 龙马智芯(珠海横琴)科技有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/289;G06N20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 519000 广东省珠海市横琴新区环岛*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 标点 确定 方法 装置 存储 介质 电子设备 | ||
1.一种文本标点确定方法,其特征在于,所述方法包括:
获取待处理话术文本,并确定与所述待处理话术文本对应的话术类别;
对所述待处理话术文本进行分段,并对所述分段后的所述待处理话术文本进行分词处理,得到分词处理结果;
将所述分词处理结果转换成词向量,以根据所述词向量和所述话术类别确定与所述待处理话术文本对应的目标话术类别;
将所述待处理话术文本输入至与所述目标话术类别对应的机器学习模型中,得到添加标点后的目标话术文本。
2.根据权利要求1所述的文本标点确定方法,其特征在于,所述话术类别包括:开场白类别、产品介绍类别、免责声明类别和投保确认类别。
3.根据权利要求1所述的文本标点确定方法,其特征在于,所述将所述待处理话术文本输入至与所述目标话术类别对应的机器学习模型中,得到添加标点后的目标话术文本,包括:
确定预先训练好的多个机器学习模型,并根据所述目标话术类别在所述多个机器学习模型中确定目标机器学习模型;
将所述待处理话术文本输入至所述目标机器学习模型中,得到添加标点后的目标话术文本。
4.根据权利要求3所述的文本标点确定方法,其特征在于,在所述将所述目标话术类别输入至目标机器学习模型中之前,所述方法还包括:
获取话术文本样本以及与所述话术文本样本对应的目标话术样本;
将所述话术文本样本输入至待训练机器学习模型中,以使所述待训练机器学习模型输出与所述话术文本样本对应的目标文本;
若所述目标文本与所述目标话术样本不匹配,调整所述待训练机器学习模型的参数,以使所述目标文本与所述目标话术样本相同。
5.根据权利要求1所述的文本标点确定方法,其特征在于,所述将所述分词处理结果转换成词向量,以根据所述词向量和所述话术类别确定与所述待处理话术文本对应的目标话术类别,包括:
将所述分词处理结果转换成词向量,并根据所述词向量和所述话术类别确定与所述待处理话术文本对应的待校正话术类别;
对所述待处理话术文本进行滑窗处理,得到滑窗处理结果;
确定与所述滑窗处理结果对应的标准话术类别,并根据所述标准话术类别对所述待校正话术类别进行校正,得到目标话术类别。
6.根据权利要求5所述的文本标点确定方法,其特征在于,所述将所述分词处理结果转换成词向量,包括:
利用词频-逆文本模型对所述分词处理结果进行转换,得到词频向量;
利用潜在语义索引模型对所述词频向量进行转换,得到词向量。
7.根据权利要求1所述的文本标点确定方法,其特征在于,所述对所述待处理话术文本进行分段,并对所述分段后的所述待处理话术文本进行分词处理,得到分词处理结果,包括:
根据预设文本字数对所述待处理话术文本进行分段,得到分段处理结果;
利用N元模型对所述分段处理结果进行分词处理,得到分词处理结果。
8.一种文本标点确定装置,其特征在于,包括:
类别确定模块,被配置为获取待处理话术文本,并确定与所述待处理话术文本对应的话术类别;
分词处理模块,被配置为对所述待处理话术文本进行分段,并对所述分段后的所述待处理话术文本进行分词处理,得到分词处理结果;
向量转换模块,被配置为将所述分词处理结果转换成词向量,以根据所述词向量和所述话术类别确定与所述待处理话术文本对应的目标话术类别;
标点添加模块,被配置为将所述待处理话术文本输入至与所述目标话术类别对应的机器学习模型中,得到添加标点后的目标话术文本。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7中任意一项所述的文本标点确定方法。
10.一种电子设备,其特征在于,包括:
处理器;
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器被配置为经由执行所述可执行指令来执行权利要求1-7中任意一项所述的文本标点确定方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于龙马智芯(珠海横琴)科技有限公司,未经龙马智芯(珠海横琴)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010261395.6/1.html,转载请声明来源钻瓜专利网。