[发明专利]面向知识内容的语义概念扩展生成方法与装置有效
申请号: | 201710295522.2 | 申请日: | 2017-04-28 |
公开(公告)号: | CN107256227B | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 蒋宏飞;陈飞;崔培君;乔思龙;张青;晋耀红;杨凯程 | 申请(专利权)人: | 北京神州泰岳软件股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 知识 内容 语义 概念 扩展 生成 方法 装置 | ||
本发明实施例公开了一种面向知识内容的语义概念扩展生成方法与装置。所述方法包括:接收知识内容;根据所述知识内容的特征信息确定所述知识内容的结构类型;从预存储的抽取规则中选择与所述知识内容的结构类型相匹配的目标抽取规则;按照所述目标抽取规则抽取所述知识内容中的字符段,得到第一组语义概念。与现有技术相比,本方案能够基于概念扩展技术,以语义概念对应的知识内容自动生成扩展语义概念,不仅代替了人工操作,能够大量节省时间,提高效率,而且,本方案以知识内容作为参考信息,所生成的语义概念也更为全面。
技术领域
本发明实施例涉及信息处理技术领域,尤其涉及一种面向知识内容的语义概念扩展生成方法与装置。
背景技术
目前,随着人们生活质量的提高,服务行业所提供的服务项目也越来越完善,为了节省人力成本,同时也为了向人们提供更加快捷方便的服务,服务行业的办事机构,例如,银行办事大厅等,通常设置智能问答设备,用户可在智能问答设备中输入想了解的知识内容的语义概念,触发智能问答设备显示相应的知识内容。
基于智能问答设备的功能,通常,在投入使用之前,相关工作人员需要根据该服务行业的常见问题及其解答,整理得到每一条语义概念及其相应知识内容的对应关系,并将该对应关系存储到智能问答设备的数据库中,从而使得智能问答设备在接收到用户输入的语义概念时,根据对应关系调取与语义概念相应的知识内容,并向用户显示。
然而,由于用户的自主性较强,对应同一条知识内容的调取,不同用户所输入的语义概念可能不同,例如,调取一条支付流程相关的知识内容,用户A输入“怎么支付”,用户B输入“怎么付款”,用户C输入“支付流程是什么”,所以,为了提高智能问答设备的适用性,相关工作人员需要将一条知识内容对应的多条可能的语义概念全部整理,并输入到数据库。由此可见,现有的通过人工整理语义概念的方式,不仅时间长,效率低,而且,人工整理的语义概念也很难覆盖的较为全面。
发明内容
本发明实施例提供了一种面向知识内容的语义概念扩展生成方法与装置,以解决现有技术时间长,效率低,而且语义概念覆盖不全面的问题。
第一方面,本发明实施例提供了一种面向知识内容的语义概念扩展生成方法,该方法包括:
接收知识内容;
根据所述知识内容的特征信息确定所述知识内容的结构类型;
从预存储的抽取规则中选择与所述知识内容的结构类型相匹配的目标抽取规则;
按照所述目标抽取规则抽取所述知识内容中的字符段,得到第一组语义概念。
结合第一方面,在第一方面第一种可能的实现方式中,在得到第一组语义概念之后,还包括:
判断所述知识内容所包含的字符的数量是否大于或者等于预设阈值;
如果所述知识内容所包含的字符的数量大于或者等于所述预设阈值,提取所述知识内容中的关键词或者关键句作为第二组语义概念;
如果所述知识内容所包含的字符的数量小于所述预设阈值,从所述知识内容中抽取业务词;从预先接收的参考语义概念中抽取关键词;将所述业务词和所述参考语义概念的关键词组合,得到所述第二组语义概念;其中,所述业务词是所述知识内容中属于预设业务类型的词;
提取所述第一组语义概念和所述第二组语义概念中相同的语义概念作为扩展语义概念。
结合第一方面,在第一方面第二种可能的实现方式中,所述从所述知识内容中抽取业务词包括:
对所述知识内容执行分词操作,得到若干个基础词;
去除所述基础词中的停用词,得到待分类词;
根据所述待分类词的字符分别遍历预先创建的词库中的字符;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州泰岳软件股份有限公司,未经北京神州泰岳软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710295522.2/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法