[发明专利]对白角色预测方法、装置、电子设备及存储介质有效
| 申请号: | 202011099233.3 | 申请日: | 2020-10-14 |
| 公开(公告)号: | CN112270169B | 公开(公告)日: | 2023-07-25 |
| 发明(设计)人: | 潘政林;白洁;王毅 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F18/214;G06N20/20 |
| 代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 谷春静 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 对白 角色 预测 方法 装置 电子设备 存储 介质 | ||
1.一种对白角色预测方法,包括:
按照从头到尾的顺序遍历文本中的对白,将遍历到的每句对白分别作为待处理的对白;从所述文本中获取所述待处理的对白的上下文;
获取所述上下文中的上文中的各句文本内容的第一标签,所述第一标签为非对白或角色信息,所述角色为对白的说话人;
根据所述上下文及所述第一标签预测出所述对白的角色信息,包括:构建包含所述上下文、所述第一标签及所述待处理的对白的输入信息,将所述输入信息输入角色预测模型,得到预测出的所述待处理的对白的角色信息,所述角色预测模型为利用构建出的训练样本训练得到的,每条训练样本分别对应于文本中的一句对白,其中包括:所述对白对应的所述输入信息及第二标签,所述第二标签为所述对白的角色信息。
2.根据权利要求1所述的方法,还包括:
将被引号包围的文本内容作为对白;
和/或,针对任一句文本内容,利用预先训练得到的分类模型确定所述文本内容是否为对白。
3.一种对白角色预测装置,包括:
第一获取模块,用于按照从头到尾的顺序遍历文本中的对白,将遍历到的每句对白分别作为待处理的对白;从所述文本中获取所述待处理的对白的上下文;
第二获取模块,用于获取所述上下文中的上文中的各句文本内容的第一标签,所述第一标签为非对白或角色信息,所述角色为对白的说话人;
预测模块,用于根据所述上下文及所述第一标签预测出所述对白的角色信息,包括:构建包含所述上下文、所述第一标签及所述待处理的对白的输入信息,将所述输入信息输入角色预测模型,得到预测出的所述待处理的对白的角色信息,所述角色预测模型为利用构建出的训练样本训练得到的,每条训练样本分别对应于文本中的一句对白,其中包括:所述对白对应的所述输入信息及第二标签,所述第二标签为所述对白的角色信息。
4.根据权利要求3所述的装置,其中,
所述第一获取模块进一步用于,将被引号包围的文本内容作为对白,和/或,针对任一句文本内容,利用预先训练得到的分类模型确定所述文本内容是否为对白。
5.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-2中任一项所述的方法。
6.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1-2中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011099233.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种帕拉米韦杂质M及其制备方法和用途
- 下一篇:一种茶叶的灌装糊盒生产线





