[发明专利]基于众包的中文旅游领域知识服务平台知识库更新方法在审
| 申请号: | 201911283226.6 | 申请日: | 2019-12-13 |
| 公开(公告)号: | CN110990417A | 公开(公告)日: | 2020-04-10 |
| 发明(设计)人: | 曹菡;张威震 | 申请(专利权)人: | 陕西师范大学 |
| 主分类号: | G06F16/23 | 分类号: | G06F16/23;G06F16/29;G06Q50/14 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 房鑫 |
| 地址: | 710119 陕西*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 中文 旅游 领域 知识 服务 平台 知识库 更新 方法 | ||
1.一种基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于,包括步骤:
通过旅游实体名称构建出旅游实体库;
通过与结构化中文百科类数据集进行实体匹配抽取出旅游知识,构建出旅游知识库;
在旅游知识库的基础上搭建中文旅游领域知识服务平台;所述中文旅游领域知识服务平台的搭建方法包括旅游实体知识图谱的可视化方法以及旅游实体知识卡片展示中的实体链接方法;所述的旅游实体知识卡片包括Infobox属性和实体百科标签;
通过众包的方法统计出不同用户在中文旅游领域知识服务平台上的旅游实体搜索记录定时获取新的旅游实体;再通过抽取出的新的旅游知识来更新旅游知识库。
2.根据权利要求1所述基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于:采用网页爬取方法从现有的旅游网站上爬取旅游实体名称来构建出旅游实体库;
所述的旅游实体名称包括全国34个省、直辖市、自治区、特别行政区的旅游景点。
3.根据权利要求1或2所述基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于,旅游实体库的具体构建方法为:使用Python编程语言编写网页爬虫程序,通过程序模拟浏览器请求站点的行为,把站点返回的HTML代码爬到本地,进而提取所需要的旅游实体名称数据,将旅游实体名称数据存储到本地设备中来构建出旅游实体库。
4.根据权利要求1所述基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于:所述的结构化中文百科类数据集从互联网中获取三元组Dump数据组成,Dump数据包括CN-DBpedia、Zhishi.me提供的数据,将获取得到的数据集存储到本地设备;当进行实体匹配时编写Python脚本将旅游实体库与三元组Dump数据进行匹配抽取出旅游知识。
5.根据权利要求4所述基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于:所述的三元组Dump数据包含实体名称、属性名称、属性值,中间用tab分隔;
旅游知识库中的旅游知识数据对语料以标签进行标注。
6.根据权利要求1所述基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于,所述的旅游实体知识图谱的可视化方法如下:
使用Ajax交互技术,通过XmlHttpRequest对象向服务器发出获取本实体相关知识的异步请求,服务器按照请求从本地设备存储的旅游知识库中获得相关知识数据并以JSON格式返回给前台,利用JavaScript脚本将JSON数据部署到Echarts.js配置项的各个节点上,从而最终实现将旅游实体知识图谱在前台JSP页面中展示在用户面前。
7.根据权利要求1所述基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于,所述旅游实体知识卡片展示中的实体链接方法如下:
获取JSON格式的相关知识数据并返回给前台,利用JavaScript脚本,通过对数据中实体不同属性的判断,将数据在前台JSP页面中分别展示到知识卡片区域中的简介、Infobox、百科标签位置,并将有标注的JSON数据对应的实体实现识别和链接。
8.根据权利要求1所述基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于,通过众包的方法获取新的旅游实体具体步骤如下:
1)获取不同用户在中文旅游领域知识服务平台上的旅游实体搜索记录;
2)将用户旅游实体搜索记录与旅游实体库进行比较;
3)判断旅游实体库中是否存在用户搜索实体;
4)如果旅游实体库中没有用户搜索实体,则将该实体加入旅游实体库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911283226.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于片上网络结构的柔性电子系统
- 下一篇:一种饮料生产用废水再利用装置





