[发明专利]一种细粒度电台音频内容个性化组织推荐方法有效
申请号: | 201710007193.7 | 申请日: | 2017-01-05 |
公开(公告)号: | CN106953887B | 公开(公告)日: | 2020-04-24 |
发明(设计)人: | 宋明丽;曹轶臻;王琦;张小平 | 申请(专利权)人: | 北京中瑞鸿程科技开发有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;H04L29/06;H04L12/58;G10L15/04;G10L15/14;G10L21/0216;G06F16/9535 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100024 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种细粒度的电台音频内容个性化组织推荐方法,依据语义将电台的音频节目自动切分标注,并基于互联网大数据挖掘用户喜好,自动编排个性化节目单以及进行实时节目推送,涉及音频处理、机器学习、大数据分析、推荐系统、数据挖掘等领域。本发明给出一种将传统广播音频节目按语义自动切分并标注的算法过程,并给出基于互联网大数据进行个性化内容推荐的技术方案,实现细粒度的音频内容个性化组织推荐方法。本发明综合考虑了冷启动问题、结合用户收听时间的节目单组织生成、实时节目切换以及实时推送节目等因素,改变当下电台地将FM直播移植到互联网流媒体播出的简单模式,从受众用户角度而言,满足了用户在恰当的时间收听到自己感兴趣节目的内容。 | ||
搜索关键词: | 一种 细粒度 电台 音频 内容 个性化 组织 推荐 方法 | ||
【主权项】:
一种细粒度电台音频内容个性化组织推荐方法,其特征在于:首先,对音频进行分帧;第二步,进行预处理,消除趋势项和直流分量第三步,进行降噪;第四步,进行预加重;第五步,然后进行特征提取,特征提取是基于帧处理的;第六步,采用端点检测方法检测出语音的端点,从包含语音的一段信号中确定出语音的起始点和结束点的位置;通过端点检测,把音频切分成一个个句子;第七步,经过端点检测的音频首先经过SVM1,将帧分为语音/非语音/静音,对语音帧通过SVM1分成纯语音帧以及带噪语音帧,对纯语音帧再通过SVM3分为男声/女声;对非语音帧通过SVM4分为音乐以及噪声;第八步,对纯人声分离出的男声/女声以及现场报道通过说话人分割与聚类技术,将说话人相同的顺序音频段进行合并;分析出最多音频段的男性声音和女性声音,即为男主持人和女主持人;第九步,对分离完成的说话人段进行语音识别并存储;最后,构建广播语义网,使用文本分析技术对相邻的说话人段进行分析处理,对有相似语义的说话人段进行合并并提取摘要进行标注;个性化节目组织推荐系统的节目推荐方法包括以下四大类:(1)提出一种解决冷启动的新用户节目推荐方法:采集登录用户的新浪微博内容构建“博文内容‑兴趣主题‑节目”模型,并结合注册信息进行用户画像,生成新用户的节目单;(2)提出一种结合时间上下文的个性化节目单推荐生成方法:采集电台用户的显式和隐式行为数据构建“用户‑时间上下文‑节目偏好”模型和“用户‑节目‑评分矩阵”模型,结合时间上下文和基于物品的协同过滤算法进行个性化节目单生成;(3)实时节目切换功能:对正在收听的节目提供“换一换”机制,根据用户兴趣进行实时节目切换;(4)节目实时推送功能:利用Storm技术实现基于在线节目收听量等进行实时节目推送提醒。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中瑞鸿程科技开发有限公司,未经北京中瑞鸿程科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710007193.7/,转载请声明来源钻瓜专利网。
- 上一篇:纽扣式防溺水浮标
- 下一篇:一种快速抛射式水上救生浮具装置
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法