[发明专利]一种基于两个三元组的中文问题生成方法在审
申请号: | 201910946043.1 | 申请日: | 2019-10-01 |
公开(公告)号: | CN111104517A | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 董泽桉;邵红;董黎刚;蒋献 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/332 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林松海 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 两个 三元 中文 问题 生成 方法 | ||
1.一种基于两个三元组的中文问题生成方法,其特征在于,包括如下步骤:
1-1)分别用Bi-LSTM+CRF模型和GRU+AM模型,提取文本中的实体对和实体关系,构建知识图谱,将与两个及以上实体存在关系的实体定义为公共实体,将与公共实体构成三元组的实体称为其他实体;
1-2)对于包含同一公共实体的两个三元组,若其关系相同,则根据知识图谱生成是非疑问句或特殊疑问句,是非疑问句生成句式为“公共实体+实体间关系+其他实体吗+问号”,特殊疑问句生成句式为“疑问词+实体间关系+其他实体+问号”,此时答案为公共实体,或“公共实体+实体间关系+疑问词+问号”,此时答案为其他实体,疑问句中实体出现的顺序与实体关系方向一致,特殊疑问句的疑问词根据实体类别选择;
1-3)对于包含同一公共实体的两个三元组,若其关系不同,则根据知识图谱生成是非疑问句或特殊疑问句,是非疑问句的句式为“实体关系A+实体A+的+公共实体+实体关系B+实体B+吗+问号”,特殊疑问句生成句式为“实体关系A+实体A+的+疑问词+实体关系B+实体B+问号”,此时答案为公共实体,疑问句中实体出现的顺序与实体关系方向一致,特殊疑问句的疑问词根据实体类别选择;
1-4)当三元组间出现多个公共实体,则围绕每一个公共实体依次按1-2和1-3步骤生成问题,生成时视剩余的公共实体为其他实体。
2.根据权利要求1所述的一种基于两个三元组的中文问题生成方法,其特征在于,所述的步骤1-2)和1-3)中,用CRF对实体进行实体分类并选择提问该实体时使用的疑问词,疑问词的选择规则为:事物或属性使用 “什么” ,人名或称谓使用 “谁” ,地点使用 “哪里” ,所属用 “谁的” ,选择使用 “哪个” ,时间使用 “什么时候” ,方式、情况或状态使用 “怎么样” ,原因使用 “为什么” ,数量使用 “多少” 。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910946043.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:测量时间确定、驻留小区确定、参数确定方法和装置
- 下一篇:一种钢丝除锈机