[发明专利]一种面向非自由谈话式汉语口语的对话行为分析方法有效
申请号: | 201711087012.2 | 申请日: | 2017-11-07 |
公开(公告)号: | CN107832293B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 季竞;庞在虎;朱风云;吴昊 | 申请(专利权)人: | 北京灵伴即时智能科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/211;G06F40/253;G06F40/205 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 自由 谈话 汉语 口语 对话 行为 分析 方法 | ||
1.一种用于智能对话系统的面向非自由谈话式汉语口语的对话行为分析方法,包括如下步骤:
步骤一、对文本或语音识别的文本进行分词和词性标注;
步骤二、对分词及词性标注后的文本句子进行句法分析;所述句法分析包括句类分析和对言语行为动词进行标注;所述句类分析指为每个句子加注标签;
步骤三、对分词及词性标注后的文本句子进行信息结构分析;所述信息结构分析是指对名词性成分的指称范畴进行标注;
步骤四、对文本句子进行话轮和话段的划分;
步骤五、根据句类和信息结构对话轮进行邻近对分析,再得到各个话轮的对答类型分析;
步骤六、通过邻近对类型得到话段对答形式结构标签;
步骤七、根据对答类型、句类和信息结构确定话轮的交际功能;所述交际功能分为任务管理、任务内容相关和任务内容无关三大类;所述交际功能由对答类型、任务进程、句法特征和信息结构来判定;
步骤三中,根据所述名词性成分的激活代价,确定其指称范畴标签;激活代价分为三种,如果一个名词性成分在上文已经提及,再次提及时由于听者头脑中已经激活,激活代价最低;如果一个名词性成分在提及时是未激活的新信息,则激活代价最高;若一个名词性成分虽未在上文中提及,但与已出现的名词性成分有直接关联,则为半激活状态,激活代价居中;
步骤四中,所述话轮的结尾以说话者或听话者的角色互换或各方的沉默为标志,在话轮标注的同时也标注出话语来源;若同一话轮中的句子分属不同主题,则将所述话轮分割为不同话段的两个话轮;
步骤五中,所述邻近对是指将对答的话轮分为引发语和应答语;在对答类型分析时,首先确定话轮的角色为引发语还是应答语,再确定其所属邻近对类别,根据这两者来添加对答类型标签;对答类型分为社交对答类型、信息转移类型、行为商讨类型和非有效话轮;
步骤七中,采用任务进程对所述交际功能进行分类时,所述任务进程以任务开启和任务结束两个节点划分为任务开始前,任务进行中和任务结束后三个阶段;任务开启的标志是第一个充当引发语的信息转移或行为商讨类话轮;任务结束的标志是最后一个不含社交对答类型的话段的结束;
利用面向非自由谈话式汉语口语的对话行为分析方法对真实客服与用户的对话进行标注,再利用标注后的文本作为训练集训练智能对话系统模型。
2.如权利要求1所述的一种用于智能对话系统的面向非自由谈话式汉语口语的对话行为分析方法,其特征在于:步骤二中,所述句类分析是将句子根据语气分为陈述句、疑问句、祈使句和感叹句;并将疑问句分为是非问、特指问、选择问和反问句;对言语行为动词进行标注指对五种类型的动词进行标注,分别是断言式、指令式、承诺式、表情式和宣告式。
3.如权利要求1所述的一种用于智能对话系统的面向非自由谈话式汉语口语的对话行为分析方法,其特征在于:步骤六中,所述对答形式结构分为毗邻式和嵌入式两大类,所述毗邻式又分为毗邻双部式和毗邻多部式;所述嵌入式又分为单层嵌入式、多层嵌入式、毗邻与嵌入综合式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京灵伴即时智能科技有限公司,未经北京灵伴即时智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711087012.2/1.html,转载请声明来源钻瓜专利网。