[发明专利]一种基于贝叶斯的开放性答案决策方法有效
申请号: | 201810329661.7 | 申请日: | 2018-04-13 |
公开(公告)号: | CN108596800B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 王宁;暴雨晴 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06Q50/20 | 分类号: | G06Q50/20;G06N7/00;G06F40/205;G06F40/216 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 黄晓军 |
地址: | 100044 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 贝叶斯 开放性 答案 决策 方法 | ||
一种基于贝叶斯的开放性答案决策方法,属于计算机程序技术领域。利用工人以往表现,建立工人质量模型;先验概率预处理步骤:通过对填空内容的预处理,当填空内容的加入使得候选答案个数增加后,需要对所有候选答案的先验概率重新计算,保障答案决策更加准确;贝叶斯决策步骤;对多选题的答案决策算法进行优化,给出时间复杂度较低的近似算法;收到工人的答案及质量后,先对问题候选答案及先验概率进行预处理,得到处理结果后根据工人对问题的回答情况,建立贝叶斯概率模型,得出问题候选答案的后验概率分布;更新工人质量模型步骤:工人质量模型随工人回答问题数量的变化而动态更新,建立更新工人质量模型,保障工人的质量在答案决策过程中是可信的。
技术领域
本发明涉及一种基于贝叶斯的开放性答案决策方法,属于计算机程序技术领域。
背景技术
现实生活中往往存在一些计算机难以处理或者处理效果不佳的问题,如给图像打标签、衡量两个记录是不是同一个实体、评价一个商品等。这类机器难以处理的问题可以借助于众包来完成。众包直接将任务发布到互联网上,通过集合互联网上的未知大众来解决传统计算机单独难以处理的问题。
由于工人来自不同的地域,年龄和文化背景不尽相同,回答问题的质量难以保证。众包平台的任务发布者希望通过冗余的方式得到一个更可信的答案,因此会将任务发布给多个工人进行回答,根据多个工人的答案推测出最终的结果。众包的一个重要技术挑战是在众包工人可能给出错误答案的情况下,如何进行高质量的答案决策。此外,众包平台上的任务类型是多种多样的,有填空题、选择题(分单选题和多选题)、选择和填空的混合等类型,目前众包技术中的答案决策算法主要是基于单选题类型提出的,不能兼容多种任务类型,尤其无法处理包含填空等开放性答案的任务类型。
近年来,国内外学者对答案的决策算法进行了大量的研究。Feng A.等人于2011年提出了MV方法,它考虑每个候选答案的工人个数,主要思想是少数服从多数,但是众包中不同工人的经验水平是不同的,MV方法没有考虑工人质量,因此它决策出来的答案不可靠。Xuan Liu等人于2012年提出基于贝叶斯的决策模型,它将工人的准确性考虑到答案决策过程中,根据工人回答问题的准确性以及答案,计算每个候选答案的后验概率分布,后验概率最大的答案作为决策答案,该方法对工人质量采用的是固定策略,实质上工人的质量应该随着工人回答问题个数的变化而动态改变。Amazon Mechanical Turk(AMT)是目前国内外应用比较广泛的平台,它根据工人质量以及工人的答案,利用Expectation Maximization(EM)算法不断迭代更新工人质量和答案后验概率分布,直至后验概率分布收敛为止,得到最终决策的答案,由于EM算法需要大量的迭代,运行时间较长。Jianhong Feng等人于2014年提出一个可以在保证决策质量的同时减少运行时间的Inquire方法,该方法对每个工人建立了一个质量模型,用于计算工人回答问题的准确性。Inquire方法的主要思想是:根据第一个工人的准确性以及答案得到候选答案的后验概率分布,将该后验概率作为下一个工人回答该问题的先验概率,进一步计算答案的后验概率,直至回答这个问题的工人个数达到要求为止;在得到最终的后验概率分布后,更新所有工人的质量模型矩阵。JianhongFeng等人通过实验比较了各种方法,结果显示:MV方法的准确性最低,EM算法的运行时间最长,Inquire方法的准确率与EM算法的准确率大致相同,但运行时间减少了很多。此外,在现有的文献中,多选题是通过转换成多个单选题进行决策的,至于填空题,则简单地将与大多数答案都相似的答案作为决策答案。
目前众包答案决策算法存在的问题如下:
(1)工人回答问题的准确性是不断变化的,以往对工人建立的质量模型矩阵大小是固定的,仅适用于候选答案固定的情况。
(2)目前的答案决策方法基于单一任务类型提出,缺少能兼容多种任务类型,并能处理开放性答案的决策方法,且决策的准确性和效率有待提高。
发明内容
为了克服现有技术的不足,本发明提供一种基于贝叶斯的开放性答案决策方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810329661.7/2.html,转载请声明来源钻瓜专利网。