[发明专利]基于半自动校正的语音关键信息记录装置及方法有效
| 申请号: | 201110243379.5 | 申请日: | 2011-08-23 |
| 公开(公告)号: | CN102956231A | 公开(公告)日: | 2013-03-06 |
| 发明(设计)人: | 叶英;孔吉;刘佩林 | 申请(专利权)人: | 上海交通大学;富士通株式会社 |
| 主分类号: | G10L15/26 | 分类号: | G10L15/26;G06F17/30 |
| 代理公司: | 上海交达专利事务所 31201 | 代理人: | 王锡麟;王毓理 |
| 地址: | 200240 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 半自动 校正 语音 关键 信息 记录 装置 方法 | ||
1.一种基于半自动校正的语音关键信息记录装置,其特征在于,包括:关键信息提取单元和与之相连的信息校正单元,其中:关键信息提取单元获取未经校正的文本信息并提取出关键信息后输出至信息校正单元,信息校正单元输出用户反馈确认后的文本信息。
2.根据权利要求1所述的基于半自动校正的语音关键信息记录装置,其特征是,所述的信息校正单元包括:冗余信息校正模块、时间信息校正模块、特殊名词校正模块和用户反馈确认模块,其中:冗余信息校正模块的输入端与关键信息提取单元相连,输出端与时间信息校正模块相连并将冗余信息校正后的关键信息传输给输出端;时间信息校正模块的输入端与冗余信息校正模块相连,输出端与特殊名词校正模块相连并将冗余信息校正、时间信息校正后的关键信息传递给输出端;特殊名词校正模块的输入端与时间信息校正模块相连,输出端与用户反馈确认模块相连并将冗余信息校正、时间信息校正、特殊名词校正后的关键信息传递给输出端。用户反馈确认模块的输入端与特殊名词校正模块相连并将冗余信息校正、时间信息校正、特殊名词校正后的关键信息经用户反馈确认后输出。
3.根据权利要求1所述的基于半自动校正的语音关键信息记录装置,其特征是,所述的关键信息提取单元包括:句法分析器模块和分类器模块,其中:句法分析器模块的输入端与语音识别单元相连,输出端与分类器模块相连并将经句法分析后的词语、短语传输给输出端;分类器模块的输入端与句法分析器模块相连,输出端与信息校正单元相连并将分类后的信息中的关键信息传输给输出端。
4.一种基于半自动校正的语音关键信息记录方法,其特征在于,包括以下步骤:
第一步,由用户处获得的语音信息通过语音识别软件获得语音信号所表达的未经校正的文本信息;
第二步,关键信息提取单元依次对未经校正的文本信息进行句法分析和分类分析得到时间信息、关键信息词类及特殊名词信息并作为关键信息传输至输出端;
第三步,信息校正单元对关键信息依次进行冗余信息校正、时间信息校正以及特殊名词校正并最终得到校正后的关键信息;
第四步、信息校正单元将校正后的关键信息传输给用户反馈确认模块,由用户进行最终确认。
5.根据权利要求4所述的语音关键信息记录方法,其特征是,所述的句法分析是指:对所获得的未经校正的文本信息采用句法分析器进行句法分析,实现对文本信息中语句的分词,从而将文本信息中的连续语句转化为各种词语和/或短语。
6.根据权利要求4所述的语音关键信息记录方法,其特征是,所述的分类分析是指:对分类器采用汉语词性标注语料库进行训练后,采用分类器先从上述词语和/或短语中分类出时间信息及关键信息词类;此后再采用常用词库对分类器进行训练,并用分类器对关键信息词类中的名词部分,进一部分类获得常用词信息与非常用词信息;其中的非常用词信息即为特殊名词信息。
7.根据权利要求6所述的语音关键信息记录方法,其特征是,所述的分类器采用贝叶斯文本分类器。
8.根据权利要求6所述的语音关键信息记录方法,其特征是,所述的关键信息词类是指:名词、动词、数词、形容词、副词、介词以及代词;所述的特殊名词信息是指:名词中的非常用词信息部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学;富士通株式会社,未经上海交通大学;富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110243379.5/1.html,转载请声明来源钻瓜专利网。





