[发明专利]多人会话场景中发言人角色确定方法、智能会议方法及系统有效

申请号：	201711341133.5	申请日：	2017-12-14
公开（公告）号：	CN107993665B	公开（公告）日：	2021-04-30
发明（设计）人：	高建清;王智国;胡国平;胡郁;刘庆峰	申请（专利权）人：	科大讯飞股份有限公司
主分类号：	G10L17/14	分类号：	G10L17/14;G10L17/04;G10L17/02;G10L15/26;G10L15/16;G10L17/18
代理公司：	北京华圣典睿知识产权代理有限公司 11510	代理人：	陈国伟
地址：	230088 安徽省***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	会话场景发言人角色确定方法智能会议系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种多人会话场景中发言人角色确定方法，该方法包括：预先构建发言人角色识别模型；接收发言人语音数据；对所述发言人语音数据进行识别，得到发言人文本数据；从所述发言人文本数据、或者所述发言人文本数据及所述发言人语音数据中提取角色识别特征；将提取的角色识别特征输入所述发言人角色识别模型，根据所述发言人角色识别模型的输出确定发言人角色。利用本发明，可以自动识别发言人的角色。本发明还公开一种智能会议方法及系统，可以向会议系统用户提供更丰富的会议相关信息，方便会议系统用户更好、更快地掌握会议内容。

技术领域

本发明涉及语音信号处理领域，具体涉及一种多人会话场景中发言人角色确定方法，还涉及一种智能会议方法及系统。

背景技术

近年来，随着人工智能逐渐成为新时代科技发展的方向，整个语音行业也迅速成长，尤其是听写技术发展最为迅速，目前已广泛在语音输入、语音搜索、语音助手等产品中得到应用并日臻成熟。

音频、视频、文字作为文化信息传播的不同表现形式，其中文字这种载体表现形式最为直观。无论是政企会议、公检法办案，还是教学培训、记者采访、个人录音等场合均需要形成完整的文字记录材料，音视频文件也需要形成字幕。为解决这些场景下的音频转文字问题，让各行各业的人不再为速记费用昂贵、人工整理录音复杂、录音质量低劣等问题而苦恼，自动进行语音转文本功能的产品应运而生，其中最具代表性的产品即会议转写系统。

现有的会议转写系统方案大致如下：接收会议中发言人语音数据，并提取所述语音数据的识别特征；根据提取的识别特征及预先训练好的识别模型，对语音数据进行识别，得到识别文本；对识别文本进行后处理，如断句、加标点、顺滑等，并将最终结果展示出来。

现有的会议转写系统中，其关注的重点一般是发言人的讲话内容，因而最终显示的也仅仅是对会议现场中各发言人语音进行转写得到的文本及相应标点，这样的显示内容及显示方式，由于没有更多的会议相关信息，因而对于一些事先未了解会议相关内容的用户或者中途加入的用户，难以较好、较快地融入会议中。

发明内容

本发明实施例一方面提供一种多人会话场景中发言人角色确定方法，能够根据发言人的语音数据自动识别发言人的角色。

本发明实施例另一方面提供一种智能会议方法及系统，可以向会议系统用户提供更丰富的会议相关信息，方便会议系统用户更好、更快地掌握会议内容。

为此，本发明提供如下技术方案：

一种多人会话场景中发言人角色确定方法，所述方法包括：

预先构建发言人角色识别模型；

接收发言人语音数据；

对所述发言人语音数据进行识别，得到发言人文本数据；

从所述发言人文本数据、或者所述发言人文本数据及所述发言人语音数据中提取角色识别特征；

将提取的角色识别特征输入所述发言人角色识别模型，根据所述发言人角色识别模型的输出确定发言人角色。