[发明专利]文档分类系统、文档分类方法及文档分类程序无效
申请号: | 201380011864.7 | 申请日: | 2013-02-28 |
公开(公告)号: | CN104160395A | 公开(公告)日: | 2014-11-19 |
发明(设计)人: | 守本正宏;白井喜胜;武田秀树;莲子和巳 | 申请(专利权)人: | UBIC股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/18 |
代理公司: | 北京瑞盟知识产权代理有限公司 11300 | 代理人: | 刘昕 |
地址: | 日本国东京都港区港*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 分类 系统 方法 程序 | ||
技术领域
本发明涉及一种文档分类系统、文档分类方法及文档分类程序,尤其是涉及与诉讼相关文档信息的文档分类系统、文档分类方法及文档分类程序。
背景技术
现有技术中,已提出一种在发生非法访问(illegal access)或机密信息泄露等与计算机相关的犯罪或法律纠纷时,对原因查明或搜查所需的仪器、数据或电子记录进行收集/分析,并明确其法律上的证据性的装置或技术。
尤其在美国民事诉讼中,由于需要eDiscovery(电子证据公开)等,该诉讼的原告及被告的任何一方均需要承担作为证据提交全部相关数字信息的义务。因此,必须将计算机或服务器中所记录的数字信息作为证据提交。
另一方面,由于随着IT业迅速发展及普及,在当今商务世界中几乎所有的信息均由计算机制作,因此即使在同一企业内部,也充斥着大量的数字信息。
因此,在为了向法庭提交证据材料而进行准备工作的过程中,容易产生在证据材料中还包含了未必与该诉讼相关的机密数字信息的失误。存在提交与该诉讼无关的机密文档信息的问题。
近几年来,在专利文献1~专利文献3中提出一种与取证系统的文档信息相关的技术。在专利文献1中公开一种取证系统,从使用者信息中所包含的至少1人以上的使用者中指定特定人,并根据与被指定的特定人相关的访问履历信息,仅抽取特定人所访问的数字文档信息,并设定表示各所抽取的数字文档信息的文档文件是否与诉讼相关的附带信息,并且根据附带信息,输出与诉讼相关的文档文件。
另外,在专利文献2中公开一种取证系统,显示所记录的数字信息,对多个文档文件的每一个设定表示是否与包含于使用者信息的使用者中任意的使用者相关的使用者特定信息,并将该被设定的使用者特定信息记录在存储部中,而进行设定,并指定至少一个以上的使用者,对设定有与所指定的使用者相对应的使用者特定信息的文档文件进行检索,并借助显示部,设定表示所检索的文档文件是否与诉讼相关的附带信息,根据附带信息,输出与诉讼相关的文档文件。
另外,在专利文献3中公开一种取证系统,接受数字文档信息中所包含的至少一个以上的文档文件的指定,并接受是否将所指定的文档文件翻译为任意一种语言的指定,将接受所指定的文档文件翻译为接受指定的语言,从记录部所记录的数字文档信息抽取与所指定的文档文件显示同一内容的共同文档文件,并生成翻译关联信息,该翻译关联信息表示所抽取的共同的文档文件因引用被翻译的文档文件的翻译内容而被翻译,根据翻译关联信息输出与诉讼相关的文档文件。
专利文献1:日本专利特开2011-209930号公报
专利文献2:日本专利特开2011-209931号公报
专利文献3:日本专利特开2012-32859号公报
然而,例如专利文献1~3中所公开的取证系统,需要使用多台计算机及服务器以收集使用者的庞大的文档信息。
通过被称为查阅者的用户阅读确认,进行分辨将上述的数字化的庞大的文档信息作为诉讼的证据材料是否合适的操作,必须对该文档信息逐个进行分辨,这样需要消耗大量的人力。
发明内容
有鉴于此,本发明提供一种文档分类系统、文档分类方法及文档分类程序,使在收集数字化的文档信息后,通过对该文档信息自动赋予分类符号,能够减轻诉讼中对所使用的文档信息分类作业的负担。
本发明的文档辨别系统获取记录在多个计算机或服务器中的数字信息,并对该获取的数字信息中所包含的文档信息进行分析,然后进行分类以易于在诉讼中使用,该文档辨别系统具有:抽取部,其从所述文档信息中抽取作为数据组而包含规定数量文档的文档群;文档显示部,其将所述抽取的文档群显示在画面上;分类符号接受部,其接受用户根据与所述诉讼之间的关联性对所述显示的文档群赋予的分类符号;选定部,其根据所述分类符号,按每个分类符号对所述抽取的文档群进行分类,解析并选定在该被分类的文档群中共同出现的关键词;数据库,其记录所述被选定的关键词;搜索部,其从所述文档信息中搜索记录在所述数据库中的关键词;得分计算部,其利用所述搜索部的搜索结果和所述选定部的解析结果,计算表示分类符号和文档之间的关联性的得分;以及自动分类部,其根据所述得分的结果自动赋予分类符号。
在本发明中,“文档”是指包含1个以上关键词的数据。例如为电子邮件、企划案材料、表计算材料、商洽材料、合同书、组织图、事业企划书等。
在本发明中,在为某种语言下,“关键词”是指具有一定意义的语句的概括。例如,在从“将文档分类”的文章选定关键词时,可选“文档”、“分类”为关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于UBIC股份有限公司,未经UBIC股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380011864.7/2.html,转载请声明来源钻瓜专利网。