[发明专利]一种基于人工智能技术的储氢材料数据库构建方法在审
申请号: | 202210500451.6 | 申请日: | 2022-05-10 |
公开(公告)号: | CN114817448A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 孙立贤;林怀周;蔡丹;徐芬;邹勇进 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/951;G06F40/151;G06F40/289;G06F40/295;G06F40/216;G06F16/35;G06F16/34;G06F16/28;G06F16/22 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工智能 技术 材料 数据库 构建 方法 | ||
本发明公开了一种基于人工智能技术的储氢材料数据库构建方法,通过以下9个步骤实现:1、论文的查询和整理;2、论文的下载和归档;3、文本格式转换;4、文本预处理;5、化学命名实体识别;6、文本分类;7、文本关系抽取;8、三元化归档;9、多端存储。相对于现有技术,本发明解决了以下问题:1、解决了数据库数据来源单一的问题,即实现从公开论文获取数据;2、解决了数据库数据收集依赖人工的问题,即通过人工智能技术实现数据自动化提取;3、解决了数据库应用单一的问。
技术领域
本发明涉及数据库维护技术领域,具体涉及一种基于人工智能技术的储氢材料数据库构建方法。
背景技术
随着材料基因工程概念的提出以及现代人工智能技术的发展,将大数据、机器学习与材料科学相结合已经成为近年来国内外研究的热点;从科研论文可以获取大量的研究数据,然而如果完全通过人工进行数据提取既费时费力又易出错,改用机器代替人工便有其必要性;因此,我们开发了一种基于人工智能的论文数据自动化提取工具,并提出了一种可自动补充丰富数据的方法用于构建和完善储氢材料数据库,以便开展后续的研究工作。
例如,现有技术1(Baricco M , Palumbo M , Pinatel E , et al.Thermodynamic Database for Hydrogen Storage Materials[J]. Advances in Science Technology, 2010, 72:213-218.),M Baricco等人在2010年建立了一个比较完备的储氢材料热力学数据库,但是其数据主要来源于课题组内,导致数据在数量极其有限,无法满足机器学习的要求;
因此,为了解决上述问题,现有技术2(Coppola C M , Tolbatov I , Tranca I C, et al. A database approach for materials selection for hydrogen storage inaerospace technology[J]. Rendiconti Lincei. Scienze Fisiche e Naturali, 2019,30(10).),CM Coppola等人在 2019年提出了一种航空航天储氢材料选择的数据库方法,通过人工的方法获取相应研究方向上的论文数据与课题组内数据,并取得了较好的效果。但是此技术仍然存在问题:数据的获得依赖传统的人工提取,其效率低下,无法满足大数据的要求;
因此,为了解决上述问题,建立各种材料相关的数据库并用于后续大数据分析和机器学习,是当前的研究重点,其中,2021年,中科院物理所自主开发的Atomly材料科学数据库和国家超算广州中心自主开发了超算、数据与AI一体化平台是此类应用的代表,可以实现数据库与超算的结合,提高材料科学的研究效率;对上述技术分析后可知,其具有以下2个特点:
1、虽然,实现了数据源由于单一课题组扩充到了其他多个合作的课题组,但是,其数据来源仍然具有局限性,无法满足机器学习的要求;
2、其数据库虽然数据量较为庞大,但是,所涉及材料类别较为单一,无法满足细分领域的应用。
具体到本发明所涉及的储氢材料领域,现有数据库技术的应用存在以下困难:
1、由于储氢材料性能名称多,并且,存在大量专有名词,因此,将已应用于上述数据库内材料类型的机器学习模型应用于储氢材料领域,无法获得相应的效果;
2、上述现有工作的数据源均源于多个合作课题组内部共享的数据,尽管在数据的数量上得到了扩充,但是其数据量只占整个储氢材料研究领域内的所有课题组保有的数据量的小部分;因此需要对全储氢材料研究领域内的数据进行检索和收集,才能扩展现有储氢材料数据库的数据源;
3、针对收集后的储氢材料数据进行机器学习,也会存在数据量少、数据质量低、参与预测的变量少等困难,导致机器学习预测模型效果无法满足实际应用要求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210500451.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种机器人柔性关节摩擦力解析与建模方法
- 下一篇:船用无轴电动推进器