[发明专利]一种内嵌式机器学习系统的软件体系结构设计方法有效
| 申请号: | 201811622278.7 | 申请日: | 2018-12-28 |
| 公开(公告)号: | CN109582294B | 公开(公告)日: | 2022-02-22 |
| 发明(设计)人: | 华绿绿;乔雪;杨婷;段贺;彭晨 | 申请(专利权)人: | 中国科学院电子学研究所苏州研究院 |
| 主分类号: | G06F8/20 | 分类号: | G06F8/20 |
| 代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 楼高潮 |
| 地址: | 215000 江苏省苏州市工*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 内嵌式 机器 学习 系统 软件 体系 结构设计 方法 | ||
1.一种内嵌式机器学习系统的软件体系结构设计方法,其特征在于,该方法在软件开发时,将整体的软件结构分为主调模块、算法I/O模块、算法接口模块、训练数据模块、模型配置模块、机器学习模块和可视化界面模块,其中:
主调模块,实现在主调的信息管理系统中启动机器学习系统,将整个软件中除机器学习系统相关功能之外的所有程序代码与机器学习系统启动代码共同抽象成主调模块,将对机器学习系统的调用抽象成一个类,通过该类的实例化对象管理数据资源,完成文本信息的处理,该类共有六个接口函数,分别是负责初始化并接收主调模块提供的文本信息的初始化函数,负责写输入文件input.txt的writeinput函数,负责读取结果文件result.txt的readresult函数,负责调用机器学习算法的excute函数,负责将结果字符串解析成结果对象序列的analysis函数以及负责更改系统中模型配置文件的changeconfig函数;
算法I/O模块,实现主调模块使用机器学习系统时所进行的输入以及机器学习系统工作完成后对结果的获取和使用;
算法接口模块,实现机器学习系统具体分类识别、信息抽取以及配置文件管理功能的调用;
训练数据模块,将机器学习训练阶段所需的语料库抽象成单独的模块,用以管理和整合所需的训练数据;
模型配置模块,实现机器学习系统中生成的数据模型与配置文件的管理,管理形式为添加、删除、替换、导入与导出;
机器学习模块,实现具体的机器学习算法,算法的输入由算法I/O模块提供,算法使用的训练数据由训练数据模块提供,算法使用的相关用户配置文件由模型配置模块提供,算法的模型输出结果被模型配置模块获取,算法的分类抽取结果被算法I/O模块获取;
可视化界面模块,实现可视化的机器学习系统模型训练、配置管理以及样例测试。
2.根据权利要求1所述的内嵌式机器学习系统的软件体系结构设计方法,其特征在于,所述主调模块为文本信息管理系统,文本信息管理系统管理文本信息,对于其中内嵌的机器学习系统,主调模块提供文本名与文本内容,并使用机器学习系统生成的结果进行文本信息管理的进一步操作,主调模块和机器学习系统并行独立工作,所述主调模块为机器学习系统提供文本信息并启动机器学习系统、以及获取机器学习系统最终反馈的数据类。
3.根据权利要求1所述的内嵌式机器学习系统的软件体系结构设计方法,其特征在于,所述算法I/O模块为机器学习系统启动后的第一步工作,算法I/O模块获取主调模块提供的文件信息,将其处理为格式化数据并写入机器学习算法的输入接口,当机器学习算法完成后,结果写在机器学习算法的输出接口中,算法I/O模块读取机器学习算法输出接口中的格式化数据,并将其解析为实现约定的不同的数据对象序列,将数据对象序列反馈给主调模块。
4.根据权利要求1所述的内嵌式机器学习系统的软件体系结构设计方法,其特征在于,所述算法接口模块为调用机器学习系统中具体提供的多种方法,并定义相关数据类,算法接口模块中将调用机器学习系统抽象为一个对象,提供初始化对象、更换模型配置、执行分类抽取三个方法的接口,以便于实现主调模块中对机器学习系统调用逻辑的灵活需求。
5.根据权利要求1或2所述的内嵌式机器学习系统的软件体系结构设计方法,其特征在于,所述训练数据模块是机器学习算法所用的语料库的单独的抽象,该机器学习算法所用的语料库为文本语料库,采用全体语料库的一个子集进行编写和测试,机器学习系统编写完成并内嵌到文本信息管理系统中后再将训练数据模块中的语料库子集更新成全体语料库。
6.根据权利要求1所述的内嵌式机器学习系统的软件体系结构设计方法,其特征在于,所述模型配置模块提供对机器学习算法所需要用到和生成的模型配置文件的管理功能,所述模型配置模块管理的数据包含机器学习系统的文本分类模型与用户字典文件,模型配置模块管理方式为提供两种类型的接口,其一为面向算法接口模块的接口,其二为面向可视化界面模块的接口,提供的两种方式对文本分类模型与用户字典文件进行增删、修改、查看、生成四类操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院电子学研究所苏州研究院,未经中国科学院电子学研究所苏州研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811622278.7/1.html,转载请声明来源钻瓜专利网。





