[发明专利]基于多文档生成演示文稿内容的方法、装置及设备在审
申请号: | 202211679889.1 | 申请日: | 2022-12-26 |
公开(公告)号: | CN115795027A | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 李亮城;高飞宇;于智 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F16/335;G06F16/33;G06F40/258;G06F40/30;G06N3/0455;G06N3/08 |
代理公司: | 北京同钧律师事务所 16037 | 代理人: | 柴海平;许怀远 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文档 生成 演示 文稿 内容 方法 装置 设备 | ||
1.一种基于多文档生成演示文稿内容的方法,其特征在于,包括:
响应于演示文稿内容生成指令,获取用于生成演示文稿内容的多个素材文档;
对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个所述素材文档中每个句子的融合语义表征;
根据所述多个素材文档中句子的融合语义表征,从所述多个素材文档中筛选出作为演示文稿内容的备选句子;
根据所述备选句子的融合语义表征,生成演示文稿的多个标题信息,并确定每一所述标题信息对应的备选句子。
2.根据权利要求1所述的方法,其特征在于,所述对同一素材文档内的句子进行文档内的语义融合,对不同素材文档的句子进行文档间的语义融合,生成每个所述素材文档中每个句子的融合语义表征,包括:
将每一所述素材文档中的每个句子映射为嵌入向量;
通过文档内融合编码器,对于每个素材文档中的任意的第一句子,将所述第一句子的嵌入向量与同一素材文档中第二句子的嵌入向量融合,得到所述第一句子的第一融合表征;并通过文档间融合编码器,将所述第一句子的嵌入向量与不同素材文档中的第三句子的嵌入向量融合,得到所述第一句子的第二融合表征;
将所述第一句子的第一融合表征与第二融合表征拼接,得到所述第一句子的融合语义表征。
3.根据权利要求2所述的方法,其特征在于,所述根据所述多个素材文档中句子的融合语义表征,从所述多个素材文档中筛选出作为演示文稿内容的备选句子,包括:
通过内容筛选网络,根据所述多个素材文档中句子的融合语义表征计算每个句子作为演示内容的可用性信息;
根据每个句子作为演示内容的可用性信息,筛选出可用性信息大于或等于可用性阈值的句子,得到作为演示文稿内容的备选句子。
4.根据权利要求3所述的方法,其特征在于,还包括:
获取多文档的训练集,所述训练集包括多条训练数据,每一训练数据包括多个样本文档,以及所述多个样本文档对应的文献综述,所述文献综述包含的句子被标注为作为演示文稿内容的目标句子;
针对每条训练数据,通过所述文档内融合编码器和文档间融合编码器,对同一样本文档内的句子进行文档内的语义融合,对不同样本文档的句子进行文档间的语义融合,并生成每个所述样本文档中每个句子的融合语义表征;
并通过所述内容筛选网络,根据所述多个样本文档中句子的融合语义表征,从所述多个样本文档中筛选出作为演示文稿内容的备选句子;
根据所述备选句子和所述目标句子,优化所述文档内融合编码器、所述文档间融合编码器和所述内容筛选网络。
5.根据权利要求4所述的方法,其特征在于,所述根据所述备选句子和所述目标句子,优化所述文档内融合编码器、所述文档间融合编码器和所述内容筛选网络,包括:
根据所述备选句子和所述目标句子,计算交叉熵损失函数值,并根据所述备选句子的融合语义表征和所述目标句子的语义表征,计算KL散度值;
根据所述交叉熵损失函数值和所述KL散度值,优化所述文档内融合编码器、所述文档间融合编码器和所述内容筛选网络的模型参数。
6.根据权利要求4所述的方法,其特征在于,所述获取多文档的训练集,包括:
获取多个样本文档,使用引用网络检索同时引用了所述多个样本文档的文献;
将所述文献中的一个作为所述多个样本文档对应的文献综述,所述多个样本文档及对应的文献综述组成一条训练数据。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述根据所述备选句子的融合语义表征,生成演示文稿的多个标题信息,并确定每一所述标题信息对应的备选句子,包括:
根据所述备选句子的融合语义表征,生成多个标题信息;
通过指针网络解码器,将所述标题信息的语义表征和所述备选句子的融合语义表征进行语义匹配,确定每一所述标题信息对应的备选句子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211679889.1/1.html,转载请声明来源钻瓜专利网。