[发明专利]一种基于机器学习的家庭场景语义理解辅助方法有效
申请号: | 201710994075.X | 申请日: | 2017-10-23 |
公开(公告)号: | CN107833573B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 叶伟 | 申请(专利权)人: | 上海百芝龙网络科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/18;G10L15/22;H04L12/28;G06N20/00 |
代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 孟旭彤 |
地址: | 200335 上海市长*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 家庭 场景 语义 理解 辅助 方法 | ||
1.一种基于机器学习的家庭场景语义理解辅助方法,其特征在于,该方法包括步骤:
步骤1,用电流感应器来采集家用电器的使用状态;
步骤2,使用智能终端采集用户的电器操作行为;
步骤3,智能终端还采集温湿度传感器、天气数据、PM2.5、室内外光照数据;
步骤4,所述智能终端按采集时间对采集到的数据进行合并,相同采集时间整理为一条记录,对合并后的数值数据进行标准化处理,使各数值均为0~1之间的小数;
步骤5,对标准化处理后的数据标注各电器的开关状态;
步骤6,对标准化的数据进行特征工程,再进行训练得到模型后,通过该模型对家用电器状态进行预测;
步骤7,在用户发出电器控制的语音指令,无法准确判定其含义时,参照机器学习模型对电器的预测结果,综合进行判断,实现语义识别,
在步骤4中,将采集的数据与电器的开关状态按照采集时间合并为一条记录,并进行标准化,将所有温度、湿度等连续数值标准化为0~1之间的小数,开关状态为0或1,采集的数据组成数据表,包括:采集时间、室内温度、室内湿度、室内光照、室内PM2.5、室内氧气、吸顶灯亮度、室外温度、室外光照、电视状态、空调状态和新风状态,
所述步骤6进一步包括,将标准化的数据进行特征工程,用作机器学习算法的输入,具体步骤有:
将所述0~1之间的小数,划分为:高(0.8~1.0),偏高(0.6~0.8),中(0.4~0.6),偏低(0.2~0.4),低(0.0~0.2),用来减少模型的复杂度;
将电视状态、空调状态、新风状态开关量,整理为:
a.平均每天打开的时间
b.已经打开时间
c.距离上次关闭的时间
d.距离上次最高打开时长的时间;
a,b,c,d项加入数据表结构中,其中电视状态、空调状态、新风状态作为预测目标,其余选项作为特征输入模型,从而进行建模,
所述步骤6进一步包括:
将训练后的模型部署在智能终端,采集后的数据进行标准化,特征处理后,作为参数输入给模型,对家用电器的使用状态做出预测,其预测结果N为0~100之间的整数;
使用语义理解+传感器辅助的方式,进行综合判断用户的实际意图,以此给所有意图进行打分,得分高者认定为最终意图,
其公式为:
M80分时,Y=M
M=80分,且M70时,Y=M
M=80分,且M=70时,Y=M+Wb*N
Y代表此时用户的意图;
M:代表基于语音语义理解的评分,此评分由语音语义模块输出;
Wb:传感器数据的权重,此数值会动态调整,其值为0~1之间的小数;
N:代表传感器的评分,即为由所述模型给出的预测结果;
Wb的调整方法包括,以M来来确定Wb,当M的评分超过设定值,则判定此时语音语义模块输出为正确,此时判定传感器答案是否正确,如正确则有:Wb=Wb+0.05,否则Wb=Wb–0.05,
进一步的,Wb不可超过最大值,且不可小于最小值,这里的最大值与最小值为预设值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海百芝龙网络科技有限公司,未经上海百芝龙网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710994075.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种模拟用户说话的语音合成方法及系统
- 下一篇:用于提供语音服务的方法和装置