[发明专利]信息处理装置、信息处理方法及程序在审
申请号: | 202080005003.8 | 申请日: | 2020-03-11 |
公开(公告)号: | CN112654991A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 小岛圭子;高桥宏成;金儿裕美;贞田洋明 | 申请(专利权)人: | NTT通信公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F40/151 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 何立波;张天舒 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 装置 方法 程序 | ||
本发明提供一种能够简易地将文档数据中的机密信息隐匿化的技术。实施方式所涉及的文档处理装置具有:文档数据取得部,其取得包含由字符信息构成的语句在内的第1文档数据;语句分割部,其将所述第1文档数据分割为语句;隐匿对象判定部,其针对在所述第1文档数据中包含的分割后的每个语句,基于预先设定的规则,判定该语句是否是隐匿化对象;隐匿化处理部,其在判定为是隐匿化对象的情况下,对该语句执行隐匿化处理;以及输出部,其输出包含被执行了由所述隐匿化处理部进行的隐匿化处理的语句在内的第2文档数据。
技术领域
本发明的一个方式涉及对文档数据进行处理的信息处理装置、信息处理方法及程序。
背景技术
提出有使用了语音识别技术、语言解析技术的文档数据的创建辅助服务。例如,已知如下技术,即,通过运用语音识别引擎将会议中的发言等的语音文本化,从而对会议记录创建进行辅助(例如,参照非专利文献1)。另外,还已知对会议中的会话语音赋予识别说话者的信息的技术(例如,参照非专利文献2、3)。
非专利文献1:NTT東日本News Release、「会議録作成支援システム「VoiceAir」の提供開始について」,平成22年11月30日、インターネット<URL:https://www.ntt-east.co.jp/release/detail/20101130_01.html>
非专利文献2:堀貴明ほか、「みんなの会話を聞き取るコンピュータを目指して」、NTT技術ジャーナル2013.9、インターネット<http://www.ntt.co.jp/journal/1309/files/jn201309018.pdf>
非专利文献3:NTT RD FORUM2015,音声コラボレーションV-15「リアルタイム会議音声認識技術(会議中の発言を記録し、効率的に振り返る)」,インターネット<http://www.ntt.co.jp/RD/active/201502/jp/ap/pdf/V-15_j.pdf>
发明内容
但是,会议记录在其性质上包含有很多机密信息。另外,在通过语音识别技术将会议中的会话自动进行了文本化的情况下,生成的文档有时也包含希望仅向会议参加者保持公开的内容、与议题无关的离题的话。
在要将这样的文档以多人能够阅览的方式共享的情况下,需要预先确认有没有不希望公开的地方、删除不希望公开的地方等作业,这会成为负担。另外,在与职务、所属部门相应地应隐匿的地方不同的情况下,必须创建例如向董事会分发的文档和向其他职员分发的文档等针对每个阅览者组而不同的文档数据,非常繁杂。
本发明是着眼于上述情况而提出的,其目的在于提供一种能够简易地将文档数据中的机密信息隐匿化的技术。
为了解决上述课题,本发明的第1方式是一种信息处理装置,其具有:文档数据取得部,其取得包含由字符信息构成的语句在内的第1文档数据;语句分割部,其将所述第1文档数据分割为语句;隐匿对象判定部,其针对所述第1文档数据所包含的分割后的每个语句,基于预先设定的规则,判定该语句是否是隐匿化对象;隐匿化处理部,其在判定为是隐匿化对象的情况下,对该语句执行隐匿化处理;以及输出部,其输出包含由所述隐匿化处理部执行了隐匿化处理的语句在内的第2文档数据。
在本发明的第2方式中,当在特定的语句中包含大于或等于一定数量或者一定比例的隐匿化对象词的情况下,所述隐匿对象判定部判定为该语句是隐匿化对象。
在本发明的第3方式中,在特定的语句与特定的说话者相关联的情况下,所述隐匿对象判定部判定为该语句是隐匿化对象。
在本发明的第4方式中,当在特定的语句中包含表示需要隐匿化的语句的情况下,所述隐匿对象判定部将作为与所述特定的语句是同一说话者的讲话而被识别的、与所述特定的语句连续的一连串语句判定为是隐匿化对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于NTT通信公司,未经NTT通信公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080005003.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:冷点
- 下一篇:一种用于多级双支撑泵的油封结构设计方法