[发明专利]一种基于音频的个性化推荐方法、装置和移动终端有效
申请号: | 201910070182.2 | 申请日: | 2019-01-24 |
公开(公告)号: | CN109558512B | 公开(公告)日: | 2020-07-14 |
发明(设计)人: | 朱玉婷 | 申请(专利权)人: | 广州荔支网络技术有限公司 |
主分类号: | G06F16/635 | 分类号: | G06F16/635;G06N3/04 |
代理公司: | 广州佳睿知识产权代理事务所(普通合伙) 44610 | 代理人: | 李健富 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 音频 个性化 推荐 方法 装置 移动 终端 | ||
本发明实施例提供了一种基于音频的个性化推荐方法、装置和移动终端,该方法包括:根据音频样本集训练音频识别模型,所述音频识别模型由卷积神经网络、循环神经网络级联得到;获取目标用户的目标音频特征;将所述目标音频特征输入至所述音频识别模型中,得到目标音频向量;根据所述目标音频向量从候选对象列表中获取目标对象;将所述目标对象推荐给所述目标用户。可以通过音频识别模型获取到目标音频向量(声音特征),以将用户喜欢的声音输入推荐给用户,有助于提高推荐成功率。
技术领域
本发明涉及音频识别的技术领域,特别是涉及一种基于音频的个性化推荐方法、装置和移动终端。
背景技术
广播电台通过音频向用户提供信息,例如,车载广播系统可以方便驾驶人员获取路况、或音乐、或其他信息。在实际应用中,还可以向用户进行音频的个性化推荐,即从主播列表中找到与用户喜欢的主播相似的主播。
现有技术中,通常可以根据主播的基本信息进行音频的个性化推荐,其中,基本信息包括:主播性别、年龄、节目类型等。具体地,首先,从用户的历史收听记录中获取用户历史收听次数较多的主播的性别、年龄、节目类型,作为目标信息;然后,将目标信息与主播列表中的主播的基本信息进行匹配,得到基于匹配度的主播排序序列;最后,排序在靠前位置的主播推荐给用户。例如,用户经常收听的主播的性别为女、年龄为25岁、节目类型为音乐节目,从而可以将性别为女、年龄为25岁、节目类型为音乐节目的主播优先推荐给用户。
然而,上述推荐过程并未考虑主播的声音特征,而通常情况下,用户喜欢主播的原因在于主播的声音,在该场景下推荐成功率较低。
发明内容
本发明公开了一种基于音频的个性化推荐方法、装置和移动终端,以解决推荐过程未考虑主播的声音特征,导致推荐成功率较低的问题。
第一个方面,本发明提供了一种基于音频的个性化推荐方法,包括:
根据音频样本集训练音频识别模型,所述音频识别模型由卷积神经网络、循环神经网络级联得到;
获取目标用户的目标音频特征;
将所述目标音频特征输入至所述音频识别模型中,得到目标音频向量;
根据所述目标音频向量从候选对象列表中获取目标对象;
将所述目标对象推荐给所述目标用户。
可选地,所述目标音频特征为梅尔频率倒谱系数,所述获取目标用户的目标音频特征,包括:
从历史收听记录中获取目标用户的目标音频,所述目标用户对所述目标音频的收听频率大于预设收听频率阈值;
从所述目标音频中提取梅尔频率倒谱系数。
可选地,所述音频样本集包括参考样本、正样本、负样本,所述音频样本集中的每个音频样本包括样本梅尔频率倒谱系数、样本对象,所述根据音频样本集训练音频识别模型,包括:
分别将所述参考样本、正样本、负样本的样本梅尔频率倒谱系数输入至卷积神经网络中,得到第一特征向量;
分别将所述参考样本、正样本、负样本的第一特征向量输入至循环神经网络中,得到第二特征向量;
分别将所述参考样本、正样本、负样本的第二特征向量输入至Sigmoid激活函数中,得到第三特征向量;
基于所述参考样本、正样本、负样本的第三特征向量,计算三元组损失值;
根据所述三元组损失值确定针对所述音频识别模型的训练是否结束。
可选地,所述基于所述参考样本、正样本、负样本的第三特征向量,计算三元组损失值的步骤,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州荔支网络技术有限公司,未经广州荔支网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910070182.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种听写报读方法及装置
- 下一篇:一种内容推荐方法、装置、终端及存储介质