[发明专利]一种融入常识知识的生成式对话摘要方法有效
申请号: | 202011104023.9 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112148863B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 冯骁骋;冯夏冲;秦兵;刘挺 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/295;G06N3/04 |
代理公司: | 哈尔滨华夏松花江知识产权代理有限公司 23213 | 代理人: | 岳昕 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融入 常识 知识 生成 对话 摘要 方法 | ||
一种融入常识知识的生成式对话摘要方法,属于自然语言处理领域。本发明解决了现有生成式对话摘要方法未利用常识知识而导致生成的对话摘要不准确,抽象性低的问题。本发明方法包括:获取常识知识库ConceptNet与对话摘要数据集SAMSum;利用获取的常识知识库ConceptNet为对话摘要数据集SAMSum引入元组知识,构建异构对话图;练步骤三中构造的对话异构神经网络模型,通过训练的对话异构神经网络模型从一段对话中生成最终对话摘要。本发明应用于对话摘要的生成。
技术领域
本发明涉及自然语言处理领域,具体涉及一种融入常识知识的生成式对话摘要方法。
背景技术
基于自然语言处理—自动文本摘要(AutomaticSummarization)[1](题目:Constructing literature abstracts by computer:techniques and prospects,作者:Chris D Paice,年份:1990年,文献引自Information ProcessingManagement)领域下的生成式对话摘要(Abstractive DialogueSummarization),即给定一段多人对话的文字记录,生成一段简短的、包含对话关键信息的文本描述,如图1,展示了一个多人对话及其对应的标准摘要。
对于对话摘要,现有工作大多集中于生成式(Abstractive)方法,即允许最终摘要包含原文没有的新颖的词汇和短语。例如Liu等人[2][题目:Automatic dialogue summarygeneration for customer service,作者:Chunyi Liu,年份:2019年,文献引自Proceedings of the 25th ACM SIGKDD International Conference on KnowledgeDiscoveryData Mining]针对客服对话摘要任务,采用多步生成方式生成对话摘要,Liu等人[3][题目:Topic-aware pointer-generator networks for summarizing spokenconversations,作者:Zhengyuan Liu,年份:2019年,文献引自arXiv preprint]针对医患对话摘要任务,融入主题信息建模对话,生成最终摘要。Ganesh等人[4][题目:Abstractivesummarization of spoken and written conversation,作者:Prakhar Ganesh,年份:2019年,文献引自arXiv preprint]利用对话篇章结构作为规则去除对话中的无用句子,然后生成对话摘要。近期,在对话回复生成[5][题目:Commonsense knowledge awareconversation generation with graph attention.,作者:Hao Zhou,年份:2018年,文献引自IJCAI,]和对话上下文建模[6][题目:Masking orchestration:Multi-taskpretraining for multi-role dialogue representation learning,作者:Tianyi Wang,年份:2020年,文献引自AAAI]等任务中显示,尽管目前基于神经网络的摘要模型已经有很强的学习能力,但是现有方法忽略了常识知识的利用,一方面会导致模型无法更好的理解对话文本,生成质量低的摘要;另一方面缺少常识知识,会导致生成摘要抽象性较低。通过融入显式的常识知识可以帮助模型更好的完成任务,融入常识知识的对话摘要可以帮助模型理解对话背后的高层含义;还可以作为不连贯句子之间的桥梁,帮助更好的理解对话。然而,现有的对话摘要系统却忽视了常识知识的利用。
常识知识可以帮助对话摘要系统生成更高质量的摘要。如图1,通过“接”和“车坏了”可以知道鲍勃希望汤姆让他“搭便车”,引入显式的常识知识“搭便车”,可以帮助更好的生成对话摘要。在融入常识知识之后,为了更好的建模说话人,句子和常识知识三类数据,可利用异构图神经网络建模三类数据,并生成最终摘要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011104023.9/2.html,转载请声明来源钻瓜专利网。