[发明专利]基于自然语言的企业决策要素提取方法及其系统在审
申请号: | 201710745216.4 | 申请日: | 2017-08-25 |
公开(公告)号: | CN107491438A | 公开(公告)日: | 2017-12-19 |
发明(设计)人: | 宋小鹏;田丁丁 | 申请(专利权)人: | 前海梧桐(深圳)数据有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 深圳市精英专利事务所44242 | 代理人: | 冯筠 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自然语言 企业 决策 要素 提取 方法 及其 系统 | ||
技术领域
本发明涉及企业决策要素提取方法,更具体地说是指基于自然语言的企业决策要素提取方法及其系统。
背景技术
提高决策水平是企业经营管理的关键,而要提高决策水平,就要寻找影响决策的要素,只有在影响决策的要素实现突破,才能从根本上提升企业的决策能力。产业决策的诱因是信息的输入,决策者通过各种渠道获得产业相关信息,而这些信息迎合或激发了决策者现实或潜在的投资需求,这时就激发了决策冲动。由此可以看出,产业决策的外部诱因是信息,内部动因是投资需求。
对于上述提及的输入信息,现有的数据信息服务都是由信息直接提供的,或者对当前的信息进行简单分类后,进行信息服务,对于信息内容是否对使用者是否有用处或者影响都没有进行判断,也无法对信息内可能蕴含的企业经营决策要素进行提取,以至于无法依据该信息辅助使用者进行企业决策。
中国专利201110236683.7公开了一种基于三元组的用户评论摘要的生成方法与系统,该方法包括如下步骤:建立对象的特征词库、映射词表与情感词库,并根据特征词库构建特征树;抓取用户评论网页;接收用户评论;对每一个用户评论逐一进行处理,生成各自基于评论三元组的评论摘要;归纳整合所有用户评论的评论三元组,生成决策三元组;计算特征和情感词极性相同的决策三元组的数量;抽取所有的决策三元组生成决策摘要。利用本方法或系统,为每个用户评论生成评论摘要,以便于用户查看参考,并且将所有的评论三元组归纳整合,生成具有指导意义的决策三元组,并抽取全部决策三元组生成能反映总体评价结果、具有决策辅助作用的决策摘要,从而辅助用户快速地做出正确决策。
上述的专利无法实时更新对象的特征词库、映射词表与情感词库,容易导致用户做出的决策准确度不高。
因此,有必要设计一种基于自然语言的企业决策要素提取方法,实现更进一步提取信息可能蕴含的对于使用者的决策要素,真正实现信息辅助决策,随着资讯样本量增加,词库和映射表会更加丰富和精确,并且结合对企业态势的感知,信息服务更加即时有效和具有针对性,有利于更好感知企业态势。
发明内容
本发明的目的在于克服现有技术的缺陷,提供基于自然语言的企业决策要素提取方法及其系统。
为实现上述目的,本发明采用以下技术方案:基于自然语言的企业决策要素提取方法,所述方法包括:
获取企业公开资讯;
利用企业公开资讯建立事件与决策要素的映射关系,形成样本资讯库;
获取企业动态信息;
对所述企业动态信息进行清洗,获取分词;
判断所述分词是否与事件词库中的词同义;
若是,则根据分词在事件样本资讯库中提取决策要素;
若否,则进行动态信息转发和简单分类。
其进一步技术方案为:利用企业公开资讯建立事件与决策要素的映射关系,形成样本资讯库的步骤,包括以下具体步骤:
提取企业公开资讯中的实体、事件、关键词、决策要素以及事件与决策要素的映射关系;
保存所述资讯原文、摘要、实体、事件、关键字以及事件与决策要素的映射关系,形成样本资讯库。
其进一步技术方案为:获取企业公开资讯的步骤之前,还包括:
建立事件词库以及实体词库。
其进一步技术方案为:利用企业公开资讯建立事件与决策要素的映射关系,形成样本资讯库的步骤之后,还包括:
将事件词库中的词根据自然语义进行同义词合并;
将实体词库中的词根据自然语义进行同义词合并。
其进一步技术方案为:对所述企业动态信息进行清洗,获取分词的步骤,包括以下具体步骤:
对所述企业动态信息的文本内容进行分段处理以及分句处理,获取每段文本以及每句文本;
对每段文本以及每句文本进行分词处理,获取每段以及每句中的分词。
其进一步技术方案为:判断所述分词是否与事件词库中的词同义的步骤之后,还包括:
判断事件词库或样本资讯库是否能覆盖动态信息;
若能,则进入结束步骤;
若不能,则采用机器学习方式扩充现有的事件词库和样本资讯库。
本发明还提供了基于自然语言的企业决策要素提取系统,包括资讯获取单元、样本资讯库形成单元、动态信息获取单元、分词获取单元、判断单元、提取决策要素以及简单处理单元;
所述资讯获取单元,用于获取企业公开资讯;
所述样本资讯库形成单元,用于利用企业公开资讯建立事件与决策要素的映射关系,形成样本资讯库;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于前海梧桐(深圳)数据有限公司,未经前海梧桐(深圳)数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710745216.4/2.html,转载请声明来源钻瓜专利网。