[发明专利]一种从会话内容中提取会话对的方法有效
申请号: | 201710076035.7 | 申请日: | 2017-02-13 |
公开(公告)号: | CN106657157B | 公开(公告)日: | 2020-04-07 |
发明(设计)人: | 陈包容 | 申请(专利权)人: | 长沙军鸽软件有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L29/08 |
代理公司: | 合肥左心专利代理事务所(普通合伙) 34152 | 代理人: | 吴朝 |
地址: | 410000 湖南省长沙市高新开发*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 会话 内容 提取 方法 | ||
本发明提供的从会话内容中提取会话对的方法,通过采集会话内容,根据会话内容中会话句的语义,确定会话内容中的发起句和回复句,根据预设的类型判断规则,确定发起句和回复句的类型包括:判断单句、复句、非标准单句、非标准复句以及非标准句群类型的所述发起句是否有自己的上文和下文连续会话句,若有,则进一步判断所述发起句是否可与自己的上文和下文连续会话句合并成语义关联的句群,若是,则将所述发起句的类型衍生扩展为句群发起句类型,否则不进行衍生扩展。此外,针对一些复杂或非标准结构的会话句,本发明实施例能精准提取完整性好和实用性高的会话对。
技术领域
本发明涉及通信技术领域,具体涉及一种从会话内容中提取会话对的方法。
背景技术
目前,从会话内容中提取的会话对或问答对,往往是一问一答的会话对形式,而在实际的会话过程中,通讯双方进行会话并非完全符合一问一答的会话模式,例如针对通讯对方发送的会话句,通讯方可能回复了几条会话句,或针对通讯对方发送的多条会话句,通讯方可能只回复了一条会话句。
故如果仅仅采取一问一答的形式提取对话对,可能存在以下问题:
(1)对于一些没有以一问一答形式展现的会话内容,从会话内容中提取会话对的难度较大,且精度较低。例如对于多个发起句+多个回复句形式的会话内容,从中提取会话对时,需要分析与每一个发起句匹配的回复句,过程复杂,难度大,且精度较低。
(2)由于现有根据会话内容提取的问答对或会话对一般都是比较标准的会话句,或结构比较简单的会话句,从而导致针对一些复杂或非标准结构的会话句不能精准提取完整性好和实用性高的会话对。
(3)此外,由于以一问一答形式提取的会话对的完整性容易被破坏,从而导致提取的会话对不能准确模拟真实会话。针对上述问题,本发明提出了一种根据发起句和回复句的类型从会话内容中提取会话对的方法。
发明内容
本发明提供了一种从会话内容中提取会话对的方法,以解决现有技术提取会话对的难度较大,精度较低的技术问题。
本发明提供的从会话内容中提取会话对的方法,包括:
采集会话内容;
根据会话内容中会话句的语义,确定会话内容中的发起句和回复句;
根据预设的类型判断规则,确定发起句和回复句的类型包括:判断单句、复句、非标准单句、非标准复句以及非标准句群类型的所述发起句是否有自己的上文和下文连续会话句,若有,则进一步判断发起句是否可与自己的上文和下文连续会话句合并成语义关联的句群,若是,则将发起句的类型衍生扩展为句群发起句类型,否则不进行衍生扩展;
根据发起句以及发起句与下一条发起句之间的回复句提取基础会话对;
根据基础会话对,基础会话对中发起句和回复句的类型,提取至少一个会话对。
进一步地,根据会话内容中会话句的语义,确定会话内容中的发起句和回复句包括:
判断会话内容中的会话句在预设时间区间内是否有通讯对方发送的上文,若无,则将会话句确定为发起句;
若有,则判断会话句是否与通讯对方发送的上文无语义关联,若是,则将会话句确定为发起句,否则将会话句确定为回复句。
进一步地,根据预设的类型判断规则,确定发起句的类型包括:
判断发起句是否为具有完整独立语义的语句,若是,则判断发起句是否由多个具有完整独立语义的单句组成,若是,则将发起句的类型确定为复句发起句类型,否则为单句发起句类型;若否,则判断发起句是否包含具有完整独立语义的单句,若包含,则将发起句的类型确定为非标准复句发起句类型,若不包含,则为非标准单句发起句类型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙军鸽软件有限公司,未经长沙军鸽软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710076035.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:新型验钞磁头
- 下一篇:纸币清分机双边磁力耦合传动装置
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法