[发明专利]扩展口语对话系统语料库的方法和系统有效
申请号: | 201611255063.7 | 申请日: | 2016-12-30 |
公开(公告)号: | CN106649278B | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 周进华;崔计平 | 申请(专利权)人: | 三星电子(中国)研发中心;三星电子株式会社 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/332;G06F16/36 |
代理公司: | 11018 北京德琦知识产权代理有限公司 | 代理人: | 蒋欢;王琦<国际申请>=<国际公布>=< |
地址: | 210012江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 扩展 口语 对话 系统 语料库 方法 | ||
1.一种扩展口语对话系统语料库的方法,其特征在于,包括:
对无法解析的语句进行二次语义解析,得到候选解析结果;所述无法解析的语句为结合用户专属的预处理规则库、基于副语料库和主语料库都解析失败的语句;
如果用户从候选解析结果中选择了候选,则在所述语句与用户所选择的候选之间生成映射规则,将所生成的规则添加进用户专属的预处理规则库,并将用户所选的候选语句及对应的语义信息存入所述用户对应的专属的副语料库;
在解析用户语句时,结合用户专属的预处理规则库、基于副语料库生成的规则辅助主语料库进行语义解析。
2.根据权利要求1所述的方法,其特征在于,所述在解析用户语句时,结合用户专属的预处理规则库、基于副语料库生成的规则辅助主语料库进行语义解析包括:
如果基于主语料库进行语义解析的成功率大于设定的第一阈值,则先基于主语料库进行语义解析,如果成功,则根据解析结果响应用户;如果解析失败,再基于副语料库进行语料库解析;
如果基于主语料库进行语义解析的成功率小于设定的第二阈值,则先基于副语料库进行语义解析;如果基于副语料库解析失败,再基于主语料库进行语义解析。
3.根据权利要求2所述的方法,其特征在于:
如果基于副语料库解析成功,则根据解析结果响应用户;
如果基于副语料库和主语料库都解析失败,则对语句进行二次解析。
4.根据权利要求2或3所述的方法,其特征在于:
在基于副语料库进行语句解析前,先以待解析语句依次匹配预处理规则库中的规则前件,如果匹配,则以规则后件替换待解析的语句,然后基于副语料库进行语义解析;如果全部规则前件都匹配失败,则直接基于副语料库进行语义解析。
5.根据权利要求3所述的方法,其特征在于:
所述对语句进行二次解析为:基于比上一次解析更宽松的约束条件对语句进行解析。
6.一种扩展口语对话系统语料库的系统,其特征在于,包括:语义解析模块、前端交互模块和副语料库管理模块,其中:
语义解析模块,用于在解析用户语句时,结合用户专属的预处理规则库、基于副语料库生成的规则辅助主语料库进行语义解析;在语义解析模块解析失败时,进行二次语义解析,生成候选解析结果交给前端交互模块;
前端交互模块,用于将语义解析模块生成的候选解析结果反馈给用户进行交互,包含交互界面和交互处理;
副语料库管理模块,用于在主语料库的基础上创建用户专属的副语料库和预处理规则库,将从前端交互模块接收的候选语句及对应的语义信息写入副语料库,并将用户语句到候选语句的映射规则写入预处理规则库,并负责基于副语料库中的语句生成语义解析规则。
7.根据权利要求6所述的系统,其特征在于,所述语义解析模块按照以下方式进行语义解析:
如果基于主语料库进行语义解析的成功率大于设定的第一阈值,则先基于主语料库进行语义解析,如果成功,则根据解析结果响应用户;如果解析失败,再基于副语料库进行语料库解析;
如果基于主语料库进行语义解析的成功率小于设定的第二阈值,则先基于副语料库进行语义解析;如果基于副语料库解析失败,再基于主语料库进行语义解析。
8.根据权利要求7所述的系统,其特征在于:
如果基于副语料库解析成功,则语义解析模块根据解析结果响应用户;
如果基于副语料库和主语料库都解析失败,则语义解析模块对语句进行二次解析。
9.根据权利要求7或8所述的系统,其特征在于:
语义解析模块在基于副语料库进行语句解析前,先以待解析语句依次匹配预处理规则库中的规则前件,如果匹配,则以规则后件替换待解析的语句,然后基于副语料库进行语义解析;如果全部规则前件都匹配失败,则直接基于副语料库进行语义解析。
10.根据权利要求8所述的系统,其特征在于:
所述对语句进行二次解析为:基于比上一次解析更宽松的约束条件对语句进行解析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子(中国)研发中心;三星电子株式会社,未经三星电子(中国)研发中心;三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611255063.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种词典录入方法及系统
- 下一篇:特定信息自动生成系统和方法