[发明专利]一种文本编辑方法、装置、设备及可读存储介质在审
| 申请号: | 201810262255.3 | 申请日: | 2018-03-28 | 
| 公开(公告)号: | CN110321534A | 公开(公告)日: | 2019-10-11 | 
| 发明(设计)人: | 占吉清;陈志刚;胡国平;胡郁 | 申请(专利权)人: | 科大讯飞股份有限公司 | 
| 主分类号: | G06F17/24 | 分类号: | G06F17/24;G06F17/27 | 
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 | 
| 地址: | 230031 安徽*** | 国省代码: | 安徽;34 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 原始文本数据 目标命令 用户编辑 可读存储介质 语义 编辑操作 编辑命令 文本编辑 申请 文本编辑过程 准确度 人工操作 综合考虑 | ||
本申请公开了一种文本编辑方法、装置、设备及可读存储介质,本申请获取到待编辑的原始文本数据及用户编辑命令,确定该编辑命令对应的编辑操作,以及根据原始文本数据,与用户编辑命令所包含的各词的语义相关性,从用户编辑命令中确定目标命令词,最后按照编辑操作,对原始文本数据中的目标命令词进行编辑。本申请方案用户仅需要输入编辑命令,即可实现自动对原始文本数据进行编辑的过程,极大减少了人工操作,提高了编辑效率。并且,本申请确定目标命令词时综合考虑了原始文本数据与用户编辑命令所包含各词的语义相关性,大大提高了目标命令词确定的准确度,能够更准确的按照用户的意愿完成整个文本编辑过程。
技术领域
本申请涉及自然语言处理技术领域,更具体地说,涉及一种文本编辑方法、装置、设备及可读存储介质。
背景技术
文本编辑即指的,对原始文本进行文字的排版、编辑。传统的文本编辑方法都是借助键盘和鼠标来实现文本编辑。这种方式无疑会占用用户的双手,且编辑过程耗时耗力。
随着人工智能时代的到来,越来越多的人希望通过自动的方法来实现对文本数据的编辑,以提高编辑效率且减少人工操作。
发明内容
有鉴于此,本申请提供了一种文本编辑方法、装置、设备及可读存储介质,以实现减少编辑过程人工操作,提高编辑效率。
为了实现上述目的,现提出的方案如下:
一种文本编辑方法,包括:
获取待编辑的原始文本数据及用户编辑命令;
确定所述用户编辑命令对应的编辑操作;
根据所述原始文本数据,与所述用户编辑命令所包含的各词的语义相关性,从所述用户编辑命令中确定目标命令词;
按照所述编辑操作,对所述原始文本数据中的所述目标命令词进行编辑。
优选地,所述根据所述原始文本数据,与所述用户编辑命令所包含的各词的语义相关性,从所述用户编辑命令中确定目标命令词,包括:
根据所述用户编辑命令中每一词与所述原始文本数据的语义相关性,确定对应词的相关性特征;
利用预先训练的命令词确定模型,以及所述用户编辑命令中各词的相关性特征,从所述用户编辑命令包含的各词中确定目标命令词;
所述命令词确定模型预训练时的训练样本包括:与训练文本数据对应的用户编辑命令所包含训练词的词向量,及依据所述训练词与所述训练文本数据的语义相关性所确定的训练词的相关性特征;样本标签包括:所述训练词是否为目标命令词的标注结果。
优选地,所述根据所述用户编辑命令中每一词与所述原始文本数据的语义相关性,确定对应词的相关性特征,包括:
对所述用户编辑命令及所述原始文本数据进行分词及词向量化,得到各自包含的分词的词向量;
分别确定所述用户编辑命令及所述原始文本数据各自包含的分词的i元词条,i取值[1,N],N为设定常数;
根据所述用户编辑命令包含的分词的i元词条,与所述原始文本数据中每个分词的i元词条的匹配情况,确定所述用户编辑命令包含的分词的相关性特征。
优选地,所述根据所述用户编辑命令包含的分词的i元词条,与所述原始文本数据中每个分词的i元词条的匹配情况,确定所述用户编辑命令包含的分词的相关性特征,包括:
计算所述用户编辑命令包含的分词的i元词条,与所述原始文本数据中每个分词的i元词条的匹配得分;
根据所述匹配得分与设定匹配得分阈值的大小关系,确定所述用户编辑命令包括的分词的i元词条,在所述原始文本数据中的覆盖度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810262255.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种知识产权编码关键字系统
- 下一篇:儿童读物处理方法及装置





