[发明专利]一种基于VBScript的酒类语料检索方法在审
| 申请号: | 201910418333.9 | 申请日: | 2019-05-20 |
| 公开(公告)号: | CN110321406A | 公开(公告)日: | 2019-10-11 |
| 发明(设计)人: | 云虹;李亮;闫杨;田学梅;但雨珂 | 申请(专利权)人: | 四川轻化工大学 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F17/22 |
| 代理公司: | 广州市红荔专利代理有限公司 44214 | 代理人: | 吝秀梅 |
| 地址: | 644000 四*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 酒类 语料检索 语料库 语料 文本文件 检索 源代码 字符编码格式 组件对象模型 兼容性问题 语料库检索 编程技术 编程软件 创建文件 杀毒软件 文件读写 文件格式 记事本 主流 新软件 误报 下载 操作系统 调用 编程 外语 开发 | ||
本发明公开了一种基于VBScript的酒类语料检索方法,创建文件扩展名为VBS的文本文件,借助Windows记事本写出VBScript源代码,调用Windows组件对象模型的“Scripting.FileSystemObject”对象及“ADODB.Stream”对象,实现对ANSI、Unicode及UTF‑8字符编码格式的txt文件格式的酒类语料文件读写。本发明提供了适合文科背景人士开发语料检索软件的一种新方法,基于VBScript对酒类语料进行检索,无需下载安装专门编程软件,无需担忧与操作系统的兼容性问题,无需担心新软件被杀毒软件误报,无需编程者具备复杂高级的编程技术,大幅度节省开发时间,解决了酒类语料库往往涉及到多种非主流语料库文件格式(即doc、docx、htm及xml)无法被外语界主流语料库检索软件进行检索的难题。
技术领域
本发明涉及预语料检索技术领域,具体是一种基于VBScript的酒类语料检索方法。
背景技术
语料库指经科学取样和加工的大规模电子文本库。借助计算机分析工具,科研和企业单位可开展相关的语言理论及应用研究。中国是酒的故乡,可以说五千年的历史就是一部飘散着酒香的历史。从《诗经》到《楚辞》,从先秦诸子散文到唐诗宋词,无不飘逸着酒的芬芳,翻开《二十五史》有关酒的记载更是无处不在。
借助酒类语料库的数据挖掘而进行中西方酒文化及酒技术的术语挖掘、词典编纂、文化教育及教材编写就愈发重要。但是,中国外语界目前所使用的主流语料检索软件主要是AntConc和WordSmith Tools,这两款软件只支持纯文本文件的语料,并不支持对酒类语料库建设经常遇到的doc、docx、htm及xml这四种格式的文件进行检索,因而面对上述格式的文件检索问题时,需要批量转换为纯文本文件需要搜索、下载、安装及使用专门的转换软件,这一系列操作往往使得文科背景人士难以掌握。
发明内容
本发明的目的在于提供一种基于VBScript的酒类语料检索方法,以解决目前所使用的(酒类)语料检索软件品种极少,只支持纯文本文件的语料,语料建设往往采集到“doc、docx、htm及xml”这四种常见格式,要批量转换为纯文本文件时需要搜索、下载、安装及使用专门的转换软件,操作困难的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于VBScript的酒类语料检索方法,包括以下步骤:
1.创建独立的语料库文件夹,放入txt、doc、docx、htm、html及xml格式的酒类语料文件;
2.创建独立的VBScript源码脚本文件夹,根据需求创建一个或多个以vbs为扩展名的文本文件,并且用VBScript语法进行源代码编制;
3.调用Windows组件对象模型的“Scripting.FileSystemObject”对象对文件夹所含文件的扩展名进行识别,属于doc、docx、htm、html及xml格式文件的调用相应的Windows组件对象模型进行解析,然后提取全部内容串到内存或者提取全部内容串到本地临时文件再进行检索;
4.调用Windows组件对象模型的“ADODB.Stream”对象对txt文件头的前3个字节进行文件字符编码的判断,启用相应的字符读写模式。
作为本发明进一步的方案:步骤3中,调用Windows组件对象模型的“Word.Application”对象,对 doc及docx文件格式的微软Office文件进行酒类语料文件读写。
作为本发明进一步的方案:步骤3中,调用Windows组件对象模型的“htmlfile”对象,对htm及html文件格式进行酒类语料文件读写。
作为本发明进一步的方案:步骤3中,调用Windows组件对象模型的“MSXML2.DOMDocument”对象,对xml文件格式进行酒类双语平行语料文件读写。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川轻化工大学,未经四川轻化工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910418333.9/2.html,转载请声明来源钻瓜专利网。





