[发明专利]一种基于Gloss的手语视频相似度计算方法在审
申请号: | 201910028610.5 | 申请日: | 2019-01-11 |
公开(公告)号: | CN109858395A | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 李晗静;吴蕊珠;吕会华 | 申请(专利权)人: | 北京联合大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100101 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手语视频 语料 相似度计算 手语 预处理 自然语言处理 余弦相似性 算法计算 噪声消除 转写信息 相似度 导出 转写 标注 文本 多媒体 | ||
一种基于Gloss的手语视频相似度计算方法属于自然语言处理领域。首先通过多媒体标注软件ELAN软件对手语语料进行转写,然后进行手语语料的预处理,包括将转写信息导出成文本和语料噪声消除,最后使用基于VSM的余弦相似性算法计算手语视频A和手语视频B的相似度。本发明具有操作简单,易于实现,效果显著。
技术领域:
本发明是一种基于Gloss的手语视频相似度计算方法,属于自然语言处理领域。
背景技术:
手语是一种视觉语言,它是通过手的动作、面部表情的变化和身体的运动进行交流的语言,没有书面形式,更多的是通过视频录制的方式进行记录。视频的相似度研究为手语语料相似度研究提供了参考。国内外在研究视频相似度问题时,一部分是提取视频的文本信息,Crawler系统可以从视频的URL和主页HTML文件中提取视频的文本信息,比如字幕、视频的题目、摘要、类别、主题,以及相关的人物信息等。还有视频经过文字检测、文字分割、字符识别,使用OCR软件识别,完成由数字图像到字符编码的转化,最终可以将视频相似度转化为文本相似度的计算。
另一部分,是将视频作为图像进行处理,即关键帧之间的相似度计算,转化成图像的相似度计算。以两个视频间对应帧的平均距离作为相似度,条件是视频帧序列遵守时间顺序。采用常见的颜色直方图进行计算比较,但不是直接将两幅图像的直方图进行比较,而是先将视频的关键帧进行区域划分。
而本发明用到的手语汉语平行语料库中Gloss层(手语转写),是借用汉字和其他字符按照手语顺序记录手语表达的内容和方式,没有翻译加工,写出的是原始的手语句子,并非翻译的汉语句子。转写层(词语级别,不涉及语法信息)是对手语视频内容的转写,可以将手语视频转化为文本来处理。本发明和上述提到的视频的文本信息是不同的,一般视频的文本信息是非常有限的,而且视频语义方面的文本信息很少,所以在视频相似度处理方面是不利的。而本发明用到的语料库的词语转写层,是对整段手语视频中语义描述,对其进行手语相似度的计算,为准确性提供了保障。我们使用基于VSM的余弦相似性来进行手语视频相似度的计算,还可以用此算法确定标注者的标注质量是否合格。
发明内容:
本发明的目的是使用手语视频相似度的计算方法帮助大型手语语料库进行语料的去重和手语视频的分类,以及保证手语语料库标注质量问题等。
为了实现上述目的,本发明采取了如下的技术方案:
步骤1:使用ElAN软件对手语视频进行转写
步骤2-1:将手语转写层语料导出成文本;
步骤2-2:对手语转写文本语料进行噪声消除,分词及去除相应的停用词;
步骤3-1:对手语视频A的转写层文本语料和手语视频B的转写层文本语料的所有词进行列举
步骤3-2:计算手语视频A和手语视频B各自的词频
步骤3-3:确定手语视频A和手语视频B各自的词频向量A=(a1,a2,…,an)和B=(b1,b2,…,bn)
步骤3-4:利用公式(1)计算手语视频A和手语视频B两个词频向量对应的夹角,夹角越大,相似度越小;夹角越小,相似性越大;最终来确定手语视频A和手语视频B的相似度。
其中,||A||和||B||表示向量的模。由于A和B均大于等于0,所以(1)式的值是一个0到1的值,0表示两段手语视频的相似度为零,1表示两段手语视频完全相似。
上述方案需要特别说明是的:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京联合大学,未经北京联合大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910028610.5/2.html,转载请声明来源钻瓜专利网。