[发明专利]基于智能文稿分析的个性化新闻线索推荐方法有效
| 申请号: | 201810189147.8 | 申请日: | 2018-03-08 |
| 公开(公告)号: | CN108399257B | 公开(公告)日: | 2021-05-18 |
| 发明(设计)人: | 顾建国;苏琦;吴昊;马晨阳;王亮;许辰铭;侯方天 | 申请(专利权)人: | 江苏省广播电视总台 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
| 代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
| 地址: | 210008*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 智能 文稿 分析 个性化 新闻线索 推荐 方法 | ||
基于记者工作属性的线索自动推荐系统,通过智能分析新闻文稿系统中的线索、报题、文稿及播出串联的线索信息,提取对应的标签并存入系统;通过互联网采集系统收集全网信息;同时结合电视台或广播台文稿系统,Autonomy创建了一个新的信息层:智能信息操作层IDOL,自动把各个信息源和各种文件格式统一在一个智能的信息操作系统之下,这个智能信息操作系统能够提供多种信息操作的功能,包括信息的实施自动链接,信息自动分类,内容概括,信息聚类。
技术领域
本发明涉及信息发布技术,具体而言涉及一种基于云记者工作属性(新闻工作属性)的线索自动推荐。
背景技术
大数据已经进入了人类社会和生活的方方面面。媒体产业是“信息消费”的主力军,本身就拥有大量的视音频和用户数据。在其与互联网越来越紧密的融合趋势下,已经成为大数据应用的另一个主战场。媒体大数据主要有如下三大来源:
1.新型媒体业务产生的用户行为数据
2.传统广播电视台长期积累的媒体资源数据
3.来自于互联网的媒体大数据
媒体大数据的战略意义不在于掌握多么庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。长期以来我们把更多的研究方向放在了大数据实现盈利的方向,花费大量的精力去探索新闻传播规律,我们经常能看到绝大多数的报告都是在研究媒体与运营市场如何精准定位,怎样实现精准媒体广告营销支撑,如何做到传播力影响力检测监管等等,而忽略了新闻生产最根本的需求——新闻线索。如果你是一个在媒体新闻工作者,那么你可以经常看到,记者忙忙碌碌费劲心思的上网搜索、电话咨询,只是为了找到一个合适的线索。生产工具是生产力发展的重要组成部分,记者如果能够用好“大数据”这个强有力的工具,那新闻生产的效率将会大大的提升。
发明内容
本发明目的在于提供一种基于智能文稿分析的个性化新闻线索推荐方法,可实现电视台内部资源再利用,深度挖掘新闻文稿系统中的记者属性,新闻线索实时推送,提升记者找寻新闻线索的效率。
为达成上述目的,本发明的技术方案是:基于智能文稿分析的个性化新闻线索推荐方法,通过智能分析新闻(电视台、广播台等)文稿系统中的线索、报题、文稿及播出串联的线索信息,提取对应的标签并存入系统;
通过互联网采集系统收集全网信息(包括网站,微博微信,论坛,app,pgc,ugc,地方通联,电话热线系统等等),这些线索信息通过连接器接入数据分析引擎,经过数据预处理,语义分析,聚类分析形成线索标签存入系统;同时结合电视台或广播台文稿系统,分析出记者的新闻工作属性;提取记者新闻工作属性的“词条”即新闻工作属性标签,通过比对记者新闻工作属性标签及线索标签,推荐相匹配的线索给记者使用;
数据分析引擎采用HP Autonomy引擎结合Spark开源算法,HP Autonomy核心保证对任何形式的信息:文本文件或基于语音、视频、非结构化或结构化的实际内容的基本理解;Autonomy创建了一个新的信息层:智能信息操作层IDOL,自动把各个信息源和各种文件格式统一在一个智能的信息操作系统之下,这个智能信息操作系统能够提供多种信息操作的功能,包括信息的实施自动链接,信息自动分类,内容概括,信息聚类等;
Autonomy在系统内创建一个新层,即智能数据操作层即操作平台(intelligentdata operating layer,IDOL),从而使媒体单位即企业系统“以数据为中心”;该操作平台后端与各种数据源相连,能够根据任何语言和格式进行内容搜索,不论内容存放在哪里,自动实时地将总结以及与其类似信息的链接呈现出来。由于autonomy的技术是建立在概率性建模之上,因此不依赖任何语言进行分析,无需维护任何繁琐的词表,IDOL将此看成是意义的抽象符号,它通过词出现时的上下文环境而不是通过严格的语法定以来形成对该词的理解,从而识别进入到并利用autonomy架构中的任何数据的语言特性。另外,autonomy还具有分类和聚类功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏省广播电视总台,未经江苏省广播电视总台许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810189147.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:异构数据库内容同步方法、装置及中间件
- 下一篇:一种数据库的分库分表扩容方法





