[发明专利]对话状态跟踪器的训练方法及系统有效
| 申请号: | 201810538670.7 | 申请日: | 2018-05-30 |
| 公开(公告)号: | CN108847220B | 公开(公告)日: | 2020-04-28 |
| 发明(设计)人: | 俞凯;谢凯歌 | 申请(专利权)人: | 苏州思必驰信息科技有限公司;上海交通大学 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/22 |
| 代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 方挺;黄谦 |
| 地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明实施例提供一种对话状态跟踪器的训练方法。该方法包括:通过已标注对话集(L)预训练对话状态跟踪器,以确定未标注对话集(U)中各未标注对话的预测概率和对话轮数;来确定各未标注对话的时间代价参数和/或稳定性参数和/或多元化参数;根据所述参数,确定对应各未标注对话的优先权;按照优先权从未标注对话集(U)中选取部分的未标注对话进行标注,添加至已标注对话集(L);通过添加后的已标注对话集(L)训练对话状态跟踪器。本发明实施例还提供一种对话状态跟踪器的训练系统。本发明实施例的对话状态跟踪器的训练方法根据考虑不同的未标注对话具有不同的时间代价,增加了待标注对话的选择方式而提升对话状态跟踪器的训练效果。 | ||
| 搜索关键词: | 对话 状态 跟踪 训练 方法 系统 | ||
【主权项】:
1.一种对话状态跟踪器的训练方法,包括:通过已标注对话集(L)预训练对话状态跟踪器,以确定未标注对话集(U)中各未标注对话的预测概率和对话轮数;根据各未标注对话的对话轮数,确定各未标注对话的时间代价参数;和/或根据各未标注对话的预测概率和对话轮数,确定各未标注对话的熵作为稳定性参数;和/或提取所述已标注对话集(L)中各已标注对话的第一特征向量集合(VL),并对所述第一特征向量集合(VL)均值聚类以确定至少一个聚点,提取所述未标注对话集中各未标注对话的第二特征向量集合(VU),并根据所述第二特征向量集合(VU)中各特征向量与所述至少一个聚点的最大距离,确定各未标注对话的多元化参数;根据所确定的所述多元化参数和/或所述稳定性参数和/或所述时间代价参数,确定对应于各未标注对话的优先权;按照优先权从高到低从所述未标注对话集(U)中选取部分数量的未标注对话进行标注,添加至所述已标注对话集(L);通过添加后的所述已标注对话集(L)训练对话状态跟踪器。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司;上海交通大学,未经苏州思必驰信息科技有限公司;上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810538670.7/,转载请声明来源钻瓜专利网。





