[发明专利]文本处理方法、装置、计算机可读存储介质和计算机设备有效
申请号: | 201910427138.2 | 申请日: | 2019-05-22 |
公开(公告)号: | CN110175273B | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 肖求根;吕家明;贾斌峰;杨正云;吴银光;洪侠;吕雪;田沐燃;龙柏炜;金刚铭;范跃伟 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06F16/9535 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 李文渊;何平 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 处理 方法 装置 计算机 可读 存储 介质 设备 | ||
本申请涉及一种文本处理方法、装置、计算机可读存储介质和计算机设备,所述方法包括:获取输入文本;将输入文本中的字符分别转化为相应的字向量;根据字向量确定输入文本中末尾字符属于预设的各词中位置标注状态的概率和属于意图结束字符的概率;获取基于文本语料统计的输入文本对应的统计特征;根据末尾字符属于各词中位置标注状态的概率、属于意图结束字符的概率和统计特征进行分类,得到输入文本对应的完整程度。本申请提供的方案可以提高搜索效率。
技术领域
本申请涉及计算机技术领域,特别是涉及一种文本处理方法、装置、计算机可读存储介质和计算机设备。
背景技术
搜索引擎(Search Engine)不仅可以从互联网上搜集信息,还可以对收集的信息进行组织和处理后,根据用户在搜索输入框中输入的文本为用户提供准确的搜索服务,并将与用户输入的文本相关的搜索结果展示给用户。
提供精准搜索服务的前提是能够准确理解用户的搜索意图,目前的搜索引擎通常的处理方式是,根据用户输入的文本提供能够确定用户搜索意图的推荐联想词,然后根据用户选取的推荐联想词返回相应的搜索结果。然而,这种方式每次都要用户选取某个推荐联想词,导致搜索效率比较低。
发明内容
基于此,有必要针对现有的搜索引擎搜索效率较低的技术问题,提供一种文本处理方法、装置、计算机可读存储介质和计算机设备。
一种文本处理方法,包括:
获取输入文本;
将所述输入文本中的字符分别转化为相应的字向量;
根据所述字向量确定所述输入文本中末尾字符属于预设的各词中位置标注状态的概率和属于意图结束字符的概率;
获取基于文本语料统计的所述输入文本对应的统计特征;
根据所述末尾字符属于各所述词中位置标注状态的概率、属于意图结束字符的概率和所述统计特征进行分类,得到所述输入文本对应的完整程度。
一种文本处理装置,所述装置包括:
输入文本获取模块,用于获取输入文本;
字向量生成模块,用于将所述输入文本中的字符分别转化为相应的字向量;
概率确定模块,用于根据所述字向量确定所述输入文本中末尾字符属于预设的各词中位置标注状态的概率和属于意图结束字符的概率;
统计特征获取模块,用于获取基于文本语料统计的所述输入文本对应的统计特征;
分类预测模块,用于根据所述末尾字符属于各所述词中位置标注状态的概率、属于意图结束字符的概率和所述统计特征进行分类,得到所述输入文本对应的完整程度。
一种文本处理方法,包括:
获取输入文本并将所述输入文本发送至服务器;
获取所述服务器在所述输入文本对应的完整程度大于预设阈值时所直接返回的与所述输入文本对应的搜索结果,并展示所述搜索结果;或者,
获取所述服务器在所述输入文本对应的完整程度小于或等于预设阈值时所返回的与所述输入文本匹配的推荐联想词,并在获取到从所述推荐联想词中选取的任一推荐联想词时,获取所述服务器返回与选取的所述推荐联想词对应的搜索结果,并展示所述搜索结果;
所述完整程度,是通过所述服务器将所述输入文本中的字符分别转化为相应的字向量,根据所述字向量确定所述输入文本中末尾字符属于预设的各词中位置标注状态的概率和属于意图结束字符的概率,获取基于文本语料统计的所述输入文本对应的统计特征,根据所述末尾字符属于各所述词中位置标注状态的概率、属于意图结束字符的概率和所述统计特征进行分类后得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910427138.2/2.html,转载请声明来源钻瓜专利网。