[发明专利]一种基于机器学习的家庭场景语义理解辅助方法有效
申请号: | 201710994075.X | 申请日: | 2017-10-23 |
公开(公告)号: | CN107833573B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 叶伟 | 申请(专利权)人: | 上海百芝龙网络科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/18;G10L15/22;H04L12/28;G06N20/00 |
代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 孟旭彤 |
地址: | 200335 上海市长*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 家庭 场景 语义 理解 辅助 方法 | ||
一种基于机器学习的家庭场景语义理解辅助方法,用电流感应器来采集家用电器的使用状态;使用智能终端采集用户的电器操作行为;智能终端还采集温湿度传感器、天气数据、PM2.5、室内外光照数据;所述智能终端按采集时间对采集到的数据进行合并,相同采集时间整理为一条记录,对合并后的数值数据进行标准化处理,使各数值均为0~1之间的小数;对标准化处理后的数据标注各电器的开关状态;对标准化的数据进行特征工程,再进行训练得到模型后,通过该模型对家用电器状态进行预测;在用户发出电器控制的语音指令,无法准确判定其含义时,参照机器学习模型对电器的预测结果,综合进行判断,实现语义识别。
技术领域
本发明属于人工智能技术领域,特别涉及一种基于机器学习的家庭场景语义理解辅助方法。
背景技术
近来语音识别技术得到了迅速发展,语音识别系统的应用领域越来越广。例如:车载语音识别系统、远场语音识别系统,语音输入法系统以及智能家居系统。
目前,虽然语音识别准确率得到了大大的提高。但是在非标普通话且在远场语音识别环境中,识别准确率会大幅度降低。语音识别中的错误,会严重降低后续语义理解准确率,从而大大影响用户体验。因此迫切需要提出各种切实可行的方案,提升非理想情况下语义理解的准确率。
发明内容
本发明提供了一种基于机器学习的家庭场景语义理解辅助方法,以提高语义理解的准确率。
一种基于机器学习的家庭场景语义理解辅助方法,该方法包括步骤:
步骤1,用电流感应器来采集家用电器的使用状态;
步骤2,使用智能终端采集用户的电器操作行为;
步骤3,智能终端还采集温湿度传感器、天气数据、PM2.5、室内外光照数据;
步骤4,所述智能终端按采集时间对采集到的数据进行合并,相同采集时间整理为一条记录,对合并后的数值数据进行标准化处理,使各数值均为0~1之间的小数;
步骤5,对标准化处理后的数据标注各电器的开关状态;
步骤6,对标准化的数据进行特征工程,再进行训练得到模型后,通过该模型对家用电器状态进行预测;
步骤7,在用户发出电器控制的语音指令,无法准确判定其含义时,参照机器学习模型对电器的预测结果,综合进行判断,实现语义识别。
在步骤4中,将采集的数据与电器的开关状态按照采集时间合并为一条记录,并进行标准化,将所有温度、湿度等连续数值标准化为0~1之间的小数,开关状态为0或1,采集的数据包括:采集时间、室内温度、室内湿度、室内光照、室内PM2.5、室内氧气、吸顶灯亮度、室外温度、室外光照、电视状态、空调状态和新风状态。
所述步骤6进一步包括,将标准化的数据进行特征工程,用作机器学习算法的输入,具体步骤有:
3.1,将所述0~1之间的小数,划分为:高(0.8~1.0),偏高(0.6~0.8),中(0.4~0.6),偏低(0.2~0.4),低(0.0~0.2),用来减少模型的复杂度;
3.2,将电视状态、空调状态、新风状态等开关量,整理为:
a.平均每天打开的时间
b.已经打开时间
c.距离上次关闭的时间
d.距离上次最高打开时长的时间;
3.3,将3.2中的a,b,c,d项加入表一的结构中,其中电视状态、空调状态、新风状态作为预测目标,其余选项作为特征输入模型,从而进行建模。
所述步骤6进一步包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海百芝龙网络科技有限公司,未经上海百芝龙网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710994075.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种模拟用户说话的语音合成方法及系统
- 下一篇:用于提供语音服务的方法和装置