[发明专利]一种基于互联网的人物传记自动提取方法无效

申请号：	201110386585.1	申请日：	2011-11-29
公开（公告）号：	CN102567463A	公开（公告）日：	2012-07-11
发明（设计）人：	周文;李辉	申请（专利权）人：	上海大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	上海上大专利事务所(普通合伙) 31205	代理人：	陆聪明
地址：	200444***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于互联网的人物传记自动提取方法，它的步骤如下：1、获取预置的与人物传记相关的网站集合，以数组保存，该数组记为传记类网站数组A；2、输入待检索的人物姓名搜索后得到的每个网站的超文本标记语言HTML脚本保存在数组中，该数组记为传记类网页脚本数组B；3、采用标签过滤工具对传记类网页脚本数组B中的各元素进行处理，将各网页的正文保存在传记数组中，该数组记为传记数组C；4、输入待生成的人物传记长度的字数，从传记数组C中提取一篇人物传记。该方法不仅能即时获取互联网上的信息用于人物传记生成，还能利用构建的人物信息相关文本库提取人物传记信息用于生成人物传记。
搜索关键词：	一种基于互联网人物传记自动提取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于互联网的人物传记自动提取方法，它包括如下步骤：步骤1、获取预置的与人物传记相关的网站集合，将该集合以数组的形式保存，记该数组为传记类网站数组A；步骤2、输入待检索的人物姓名，对传记类网站数组A中的每一个网站分别对该姓名进行搜索，将搜索后得到的每个网站的超文本标记语言HTML脚本保存在数组中，该数组记为传记类网页脚本数组B；步骤3、采用超文本标记语言HTML标签过滤工具对传记类网页脚本数组B中的各元素进行处理，将各网页的正文保存在传记数组中，该数组记为传记数组C；步骤4、输入待生成的人物传记长度的字数，根据输入的人物传记的字数从传记数组C中提取一篇人物传记。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海大学，未经上海大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201110386585.1/，转载请声明来源钻瓜专利网。

上一篇：家庭网络设备的遥控方法、装置及系统
下一篇：一种计算机系统的备份、还原方法、装置及计算机系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于互联网的人物传记自动提取方法无效

专利文献下载