[发明专利]一种会议记录生成方法和装置在审
申请号: | 201910038460.6 | 申请日: | 2019-01-16 |
公开(公告)号: | CN109767757A | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 吴欢;田甜 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/08;G10L17/00;G06F16/60 |
代理公司: | 北京汇思诚业知识产权代理有限公司 11444 | 代理人: | 冯晓平 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音片段 会议记录 方法和装置 会议语音 人工智能技术 一一对应关系 内容生成 聚类 发言 费力 分割 | ||
本发明实施例提供了一种会议记录生成方法和装置。本发明涉及人工智能技术领域,该方法包括:获取会议语音;将会议语音进行分割,得到N个语音片段,N为大于等于2的自然数;将N个语音片段进行聚类,得到M个类别的语音片段,M为大于等于2的自然数,M≤N,M个类别的语音片段分别与M个发言人具有一一对应关系;确定M个类别的语音片段中每个类别的语音片段对应的发言人;根据M个类别的语音片段确定M个发言人中每个发言人的发言内容;根据M个发言人中每个发言人的发言内容生成会议记录。因此,本发明实施例提供的技术方案能够解决现有技术中人工整理会议记录费时费力、效率低的问题。
【技术领域】
本发明涉及人工智能技术领域,尤其涉及一种会议记录生成方法和装置。
【背景技术】
在会议过程中,由记录人员把会议的各个发言人的发言内容记录并整理,形成会议记录。当会议时间比较长,需要记录的内容比较多的时候,人工整理会议记录费时费力、效率低。
【发明内容】
有鉴于此,本发明实施例提供了一种会议记录生成方法和装置,用以解决现有技术中人工整理会议记录费时费力、效率低的问题。
一方面,本发明实施例提供了一种会议记录生成方法,所述方法包括:获取会议语音;将所述会议语音进行分割,得到N个语音片段,N为大于等于2的自然数;将所述N个语音片段进行聚类,得到M个类别的语音片段,M为大于等于2的自然数,M≤N,所述M个类别的语音片段分别与M个发言人具有一一对应关系;确定所述M个类别的语音片段中每个类别的语音片段对应的发言人;根据所述M个类别的语音片段确定所述M个发言人中每个发言人的发言内容;根据所述M个发言人中每个发言人的发言内容生成会议记录。
进一步地,所述确定所述M个类别的语音片段中每个类别的语音片段对应的发言人,包括:从所述M个类别的语音片段中每个类别的语音片段中各选择至少一个语音片段转换成文本片段,得到L个文本片段,L为自然数,L≥M;向用户展示所述L个文本片段和发言人列表,所述发言人列表包括所述M个发言人中每个发言人的信息;接收匹配指令,所述匹配指令为所述用户发出的用于指示将所述L个文本片段中每个文本片段与发言人进行匹配的指令;根据所述匹配指令确定所述M个类别的语音片段中每个类别的语音片段对应的发言人。
进一步地,所述确定所述M个类别的语音片段中每个类别的语音片段对应的发言人,包括:从所述M个类别的语音片段中每个类别的语音片段中各选择至少一个语音片段,得到Z个语音片段,Z为自然数,Z≥M;向用户播放选择出的所述Z个语音片段并展示发言人列表,所述发言人列表包括所述M个发言人中每个发言人的信息;接收匹配指令,所述匹配指令为所述用户发出的用于指示将所述Z个语音片段中每个语音片段与发言人进行匹配的指令;根据所述匹配指令确定所述M个类别的语音片段中每个类别的语音片段对应的发言人。
进一步地,所述将所述N个语音片段进行聚类,包括:S1:从所述N个语音片段中随机选择M个语音片段,将选择的M个语音片段作为M个类别的聚类中心;S2:对于剩余的N-M个语音片段中的第i个语音片段,计算所述第i个语音片段与M个聚类中心中每个聚类中心之间的距离,并将所述第i个语音片段归类到与所述第i个语音片段距离最近的聚类中心对应的类别中,i依次取1至N-M之间的自然数;S3:当所述M个语音片段归类完成之后,根据所述M个类别中每个类别包括的语音片段重新计算所述M个类别的聚类中心,并更新所述M个类别的聚类中心,循环执行S2和S3,直到所述M个类别中每个类别的相邻两次聚类中心的距离在预设距离之内。
进一步地,所述将所述会议语音进行分割,得到N个语音片段,包括:确定所述会议语音中的静音片段;去除所述会议语音中的静音片段;根据所述静音片段对去除所述静音片段后的会议语音进行分割,得到W个长语音片段,W为大于等于2的自然数,W<N;提取所述W个长语音片段中每一个长语音片段的声学特征;对所述W个长语音片段中每一个长语音片段的声学特征进行相对熵分析;根据相对熵分析的结果对所述W个长语音片段进行切分,得到所述N个语音片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910038460.6/2.html,转载请声明来源钻瓜专利网。