[发明专利]构建医疗训练样本的方法及装置、医疗文本的检索方法在审
| 申请号: | 202110041663.8 | 申请日: | 2021-01-13 |
| 公开(公告)号: | CN113571196A | 公开(公告)日: | 2021-10-29 |
| 发明(设计)人: | 康战辉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G16H50/70 | 分类号: | G16H50/70;G06F16/332;G06F40/35;G06F40/289 |
| 代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 朱黎 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 构建 医疗 训练 样本 方法 装置 文本 检索 | ||
本申请涉及人工智能技术领域,具体提供了一种构建医疗训练样本的方法及装置、医疗文本的检索方法,构建医疗训练样本的方法包括:获取问答集合;根据回复文本的来源作者所属医疗机构的机构权威等级特征和回复文本的来源作者对应的医疗职称特征,计算回复文本的权威度分数;根据回复文本的权威度分数在问答集合中进行问答语料筛选,并将筛选到的问答语料添加到候选问答集合中;将候选问答集合中的回复文本进行组合,得到对应于目标医疗主题的目标科普文章;将目标科普文章与目标问答语料进行关联,得到医疗训练样本,目标问答语料是从候选问答集合中获取的一问答语料;本方案实现了自动构建医疗训练样本。
技术领域
本申请涉及人工智能技术领域,具体而言,涉及一种构建医疗训练样本的方法及装置、医疗文本的检索方法。
背景技术
为了提高检索效率,基于人工智能技术构建的医疗问答模型被应用于医疗相关问题的检索中,通过将医疗提问文本输入至该医疗问答模型中,由该医疗问答模型在理解医疗提问文本的基础上自动输出针对该医疗提问文本的医疗答案文本,以此实现自动检索针对医疗提问文本的医疗答案文本。
为了保证医疗问答模型针对医疗提问文本所输出医疗答案文本的准确性,需要通过若干医疗训练样本对其进行训练。医疗训练样本是问题-答案-文章三元组语料,其中,问题即医疗提问文本,答案即针对医疗提问文本的医疗答案文本,文章即该医疗答案文本所来源的科普文章。相关技术中,该问题-答案-文章三元组的医疗训练样本通过人工来构建的,存在工作量大且效率低的问题。
发明内容
本申请的实施例提供了一种构建医疗训练样本的方法及装置、医疗文本的检索方法,以实现自动构建医疗训练样本。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种构建医疗训练样本的方法,包括:
获取问答集合,所述问答集合包括针对目标医疗主题的若干问答语料,所述问答语料包括提问文本和回复文本;
根据所述回复文本的来源作者所属医疗机构的机构权威等级特征和所述回复文本的来源作者对应的医疗职称特征,计算所述回复文本的权威度分数;
根据所述回复文本的权威度分数在所述问答集合中进行问答语料筛选,并将筛选到的问答语料添加到候选问答集合中;
将所述候选问答集合中的回复文本进行组合,得到对应于所述目标医疗主题的目标科普文章;
将所述目标科普文章与目标问答语料进行关联,得到医疗训练样本,所述目标问答语料是从所述候选问答集合中获取的一问答语料;所述医疗训练样本用于对医疗问答模型进行训练,其中,所述医疗问答模型用于从若干医疗科普文章中获取针对所输入医疗提问文本的医疗答案文本。
根据本申请实施例的一个方面,提供了一种医疗文本的检索方法,包括:
获取检索请求,所述检索请求指示了医疗提问文本;
通过医疗问答模型从若干医疗科普文章中获取针对所述医疗提问文本的医疗答案文本;所述医疗问答模型是利用上述构建医疗训练样本的方法所构建的医疗训练样本进行训练的;
以所述医疗答案文本作为对应于所述医疗答案文本所在医疗科普文章的文本摘要;
向所述检索请求的发起方返回所述医疗答案文本所在医疗科普文章的地址信息和文本摘要。
根据本申请实施例的一个方面,提供了一种构建医疗训练样本的装置,包括:
问答集合获取模块,用于获取问答集合,所述问答集合包括针对目标医疗主题的若干问答语料,所述问答语料包括提问文本和回复文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110041663.8/2.html,转载请声明来源钻瓜专利网。





