[发明专利]用于移动终端的用户反馈纠错方法、装置及其设备在审
申请号: | 201711173999.X | 申请日: | 2017-11-22 |
公开(公告)号: | CN107832447A | 公开(公告)日: | 2018-03-23 |
发明(设计)人: | 肖求根;詹金波;郑利群;邓卓彬;付志宏 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 移动 终端 用户 反馈 纠错 方法 装置 及其 设备 | ||
1.一种用于移动终端的用户反馈纠错方法,其特征在于,包括以下步骤:
获取用户通过移动终端发送的纠错举报请求,其中,所述请求包括:举报信息所属的文本信息,以及与所述举报信息对应的一个或多个原始分词片段,其中,所述移动终端根据本地存储的分词数据库对所述文本信息进行归一化及分词处理,确定与所述举报信息对应的一个或多个原始分词片段;
提取所述一个或多个原始分词片段的第一特征信息,应用预设模型对所述第一特征信息进行计算获取所述原始分词片段的置信度,若判断获知所述置信度小于预设阈值,则根据预先建立的短语替换表获取与所述原始分词片段对应的一个或多个候选分词片段;
根据所述原始分词片段和对应的候选分词片段提取第二特征信息,应用预设模型对所述第二特征信息进行计算获取所述候选分词片段的分值;
应用预设的解码算法对所述候选分词片段的分值进行解码处理,若判断获知与解码结果对应的解码分词片段满足预设的干预条件,则将所述解码分词片段作为目标分词片段替换对应的原始分词片段。
2.如权利要求1所述的方法,其特征在于,所述原始分词片段的第一特征信息,包括:
所述原始分词片段及上下文在语料中的出现频次;和/或,
所述原始分词片段及上下文在搜索应用场景中的改动频次;和/或,
所述原始分词片段与上下文的语义相似度。
3.如权利要求1所述的方法,其特征在于,在所述根据预先建立的短语替换表获取与所述原始分词片段对应的一个或多个候选分词片段之前,还包括:
采集用户在搜索引擎中对搜索词的主动修改信息;
采集用户输入的搜索词与大搜标题之间的映射信息;
采集用户输入的搜索词与搜索引擎提供的纠错信息;
根据所述主动修改信息、所述映射信息和所述纠错信息建立所述短语替换表。
4.如权利要求1所述的方法,其特征在于,所述移动终端对所述文本信息进行注音,并将声母韵母映射到对应的分词片段位置;
在所述根据所述原始分词片段和对应的候选分词片段提取第二特征信息之前,还包括:
根据预先建立的拼音替换表获取与所述原始分词片段对应的一个或多个候选分词片段。
5.如权利要求1所述的方法,其特征在于,所述根据所述原始分词片段和对应的候选分词片段提取第二特征信息,包括:
所述候选分词片段的质量特征、所述原始分词片段的质量特征、所述原始分词片段和所述候选分词片段的组合特征、当前用户的历史行为特征中的一种或多种特征组合。
6.如权利要求1所述的方法,其特征在于,在所述应用预设的解码算法对所述候选分词片段的分值进行解码处理之后,还包括:
若判断获知与解码结果对应的解码分词片段不满足预设的干预条件,则通过人工定义目标分词片段替换对应的原始分词片段;
若判断获知与解码结果对应的解码分词片段满足预设的替换黑名单,则确定为无效举报,不进行纠错处理。
7.一种用于移动终端的用户反馈纠错方法,其特征在于,包括以下步骤:
获取用户对文本信息中举报信息的选取操作,根据所述移动终端存储的分词数据库对所述文本信息进行归一化及分词处理,向所述用户显示所述文本信息的分词片段界面;
获取用户在所述分词片段界面中对与所述举报信息对应的一个或多个原始分词片段的选取操作,并获取所述用户对当前应用界面中纠错举报功能入口的触发操作,进而向服务器发送纠错举报请求,其中,所述请求包括:所述文本信息,以及与所述举报信息对应的一个或多个原始分词片段;
获取所述服务器发送的用于替换所述原始分词片段的目标分词片段,并显示给所述用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711173999.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种配置项信息的搜索方法及计算设备
- 下一篇:数据库操作方法、装置及设备