[发明专利]一种文档分类方法及装置在审
申请号: | 201810983329.2 | 申请日: | 2018-08-27 |
公开(公告)号: | CN109241284A | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 陈洪辉;刘俊先;蔡飞;舒振;陈涛;罗爱民;潘志强;张鑫;陈皖玉 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/08 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 马骁;于洁 |
地址: | 410003*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档分类 输入源 交互层 矩阵 交互矩阵 交互信息 文本表示 语义联系 平均化 最大化 构建 文档 注意力 转化 | ||
1.一种文档分类方法,其特征在于,包括:
根据获取的输入源元素和输入背景,确定所述输入源元素和输入背景的交互,其中所述输入背景根据所述输入源元素来构建;
将所有交互信息表示成交互矩阵;
通过平均化交互层、最大化交互层和注意力层将所述交互矩阵转化为文本表示。
2.根据权利要求1所述的方法,其特征在于,所述根据获取的输入源元素和输入背景,确定所述输入源元素和输入背景的交互,其中所述输入背景根据所述输入源元素来构建,包括:
将获取的输入源元素进行向量化,得到输入源元素向量;
通过多层感知器分别得到所述输入源元素的隐形表示和获取的输入背景的隐形表示,其中所述输入背景是将每个输入源元素视为对应的背景;
确定所述输入源元素和所述输入背景的交互。
3.根据权利要求2所述的方法,其特征在于,所述确定所述输入源元素和所述输入背景的交互,包括:
使用注意力机制确定所述输入源元素和所述输入背景的交互。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述通过平均化交互层、最大化交互层将所述交互矩阵转化为文本表示,包括:
在平均化交互层采用平均池化,将所述交互矩阵转化为文本表示;
在最大化交互层应用最大化池化,将所述交互矩阵转化为文本表示。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述通过注意力层将所述交互矩阵转化为文本表示,包括:
将交互矩阵中的每个交互通过多层感知器来获得对应的隐式表示;
获得所述交互对应的隐形表示的权重分布;
根据获得的权重分布,在注意力层将交互矩阵转化为固定维度的文本表示。
6.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
所述注意力层在词水平上采用标准注意力机制,在句子水平上采用自交互注意力机制。
7.一种文档分类装置,其特征在于,包括:
交互模块,用于根据获取的输入源元素和输入背景,确定所述输入源元素和输入背景的交互,其中所述输入背景根据所述输入源元素来构建;
矩阵模块,用于将所述交互模块的所有交互信息表示成交互矩阵;
转化模块,用于通过平均化交互层、最大化交互层和注意力层将所述矩阵模块的交互矩阵转化为文本表示。
8.根据权利要求7所述的装置,其特征在于,所述交互模块包括:
向量子模块,用于将获取的输入源元素进行向量化,得到输入源元素向量;
隐形子模块,用于通过多层感知器分别得到所述输入源元素的隐形表示和获取的输入背景的隐形表示,其中所述输入背景是将每个输入源元素视为对应的背景;
交互处理子模块,用于确定所述输入源元素和所述输入背景的交互。
9.根据权利要求7或8所述的装置,其特征在于,所述转化模块包括:
平均化交互层子模块,用于在平均化交互层采用平均池化,将所述交互矩阵转化为文本表示;
最大化交互层子模块,用于在最大化交互层应用最大化池化,将所述交互矩阵转化为文本表示。
10.根据权利要求9所述的装置,其特征在于,所述转化模块还包括:
注意力层子模块,用于将交互矩阵中的每个交互通过多层感知器来获得对应的隐式表示,获得所述交互对应的隐形表示的权重分布,根据获得的权重分布,在注意力层将交互矩阵转化为固定维度的文本表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810983329.2/1.html,转载请声明来源钻瓜专利网。