[发明专利]基于人工智能的纠错举报处理方法、装置及可读介质有效
申请号: | 201711238103.1 | 申请日: | 2017-11-30 |
公开(公告)号: | CN108090043B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 肖求根;张玉东;黄华;方晓敏;陈杰;杨风光;杨宏生;费晓旭;何径舟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/232 | 分类号: | G06F40/232 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 纠错 举报 处理 方法 装置 可读 介质 | ||
1.一种基于人工智能的纠错举报处理方法,所述方法包括:
获取用户从内容服务器的前端举报的目标语句的错误信息,所述错误信息中包括所述目标语句所在的文章标识以及所述目标语句中的疑似错别字的位置;
根据所述目标语句和所述疑似错别字、以及预先训练的置信度打分模型,预测所述疑似错别字的真实错误置信度;
若所述疑似错别字的真实错误置信度大于或者等于预设置信度阈值时,向所述内容服务器举报所述目标语句所在的文章标识、所述目标语句、所述目标语句中所述疑似错别字的位置以及所述疑似错别字的真实错误置信度,以供所述内容服务器根据所述疑似错别字的真实错误置信度,对所述文章标识对应的文章中的所述目标语句中的所述疑似错别字进行纠错处理;
所述方法还包括:若所述疑似错别字的真实错误置信度小于预设置信度阈值时,根据所述疑似错别字被举报的次数与所述文章被浏览的次数,获取所述疑似错别字的错误举报比例,以供所述内容服务器根据所述疑似错别字的错误举报比例,对所述文章标识对应的文章中的所述目标语句中的所述疑似错别字进行纠错处理。
2.根据权利要求1所述的方法,其特征在于,所述错误信息中还包括所述目标语句的位置信息;所述目标语句的位置信息包括所述目标语句为对应的文章的标题、所述目标语句为对应的文章的句首、或者所述目标语句为对应的文章的非句首。
3.根据权利要求1所述的方法,其特征在于,若所述疑似错别字的真实错误置信度小于预设置信度阈值时,所述方法还包括:
获取所述目标语句中的所述疑似错别字被举报的次数,获取所述目标语句所在的文章被浏览的次数,以根据所述疑似错别字被举报的次数与所述文章被浏览的次数,获取所述疑似错别字的错误举报比例;
若所述疑似错别字的错误举报比例大于或者等于第一预设比例阈值时,向所述内容服务器举报所述目标语句所在的文章标识、所述目标语句、所述目标语句中所述疑似错别字的位置以及所述疑似错别字的错误举报比例,以供所述内容服务器根据所述疑似错别字的错误举报比例,对所述文章标识对应的文章中的所述目标语句中的所述疑似错别字进行纠错处理。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取所述目标语句所在的文章中的所有疑似错别字被举报的次数;
根据所述所有疑似错别字被举报的次数与所述文章被浏览的次数,获取所述文章的错误举报比例;
若所述文章的错误举报比例大于或者等于第二预设比例阈值时,向所述内容服务器举报所述文章标识以及所述文章的错误举报比例,以供所述内容服务器根据所述文章的错误举报比例,对所述文章标识对应的所述文章进行纠错处理。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取所述文章的来源中的所有文章中发生过错别字纠错的文章的数目;
获取所述文章的来源中的所有文章的数目;
根据所述文章的来源中的所有文章中发生过错别字纠错的文章的数目以及所述文章的来源中的所有文章的数目,获取所述文章的来源的错误举报比例;
若所述文章的来源的错误举报比例大于或者等于第三预设比例阈值时,向所述内容服务器举报所述文章的来源标识以及所述文章的来源的错误举报比例,以供所述内容服务器根据所述文章的来源的错误举报比例,对所述文章的来源的所有文章进行纠错处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711238103.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于识别文本主题的方法和装置
- 下一篇:联系方式的识别方法和装置