[发明专利]一种中文评论分析方法有效
| 申请号: | 201911372086.X | 申请日: | 2019-12-27 | 
| 公开(公告)号: | CN111046651B | 公开(公告)日: | 2023-04-28 | 
| 发明(设计)人: | 董君 | 申请(专利权)人: | 淄博职业学院 | 
| 主分类号: | G06F40/211 | 分类号: | G06F40/211;H04N21/435;H04N21/488 | 
| 代理公司: | 深圳紫晴专利代理事务所(普通合伙) 44646 | 代理人: | 陈映辉 | 
| 地址: | 255000 山东*** | 国省代码: | 山东;37 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 中文 评论 分析 方法 | ||
1.一种中文评论分析方法,其特征在于:包括如下步骤
获取中文评论的第一文字信息和第一时间信息;
根据流媒体的字幕数据的第二文字信息和第二时间信息而关联第二时间的预设时间范围内的第一时间信息对应的中文评论;
根据所述字幕数据的第二文字信息和中文评论的第一文字信息的组成部分,将其分为主语、谓语、宾语、其他语;
将所述第二文字信息和第一文字信息的主语、谓语、宾语、其他语拆分成汉语拼音,并将主语、谓语、宾语、其他语中按每项匹配的汉语拼音的字母个数构建图表;
根据所述图表框选的面积而确定匹配值,若匹配值大于等于预设阈值,则判定所述中文评论与所述字幕数据匹配,并将所述中文评论与所述流媒体合成并输出至用户终端,若小于预设阈值,则判定所述中文评论与所述字幕数据不匹配,而删除所述中文评论;
确定所述预设阈值的方式为:
将所述主语、谓语、宾语、其他语的汉语拼音的字母个数设置为a1、a2、a3、a4,按如下公式输出预设阈值b: 。
2.一种中文评论分析方法,其特征在于:包括如下步骤
获取中文评论的第一文字信息和第一时间信息;
根据流媒体的字幕数据的第二文字信息和第二时间信息而关联第二时间的预设时间范围内的第一时间信息对应的中文评论;
根据所述字幕数据的第二文字信息和中文评论的第一文字信息的组成部分,将其分为主语、谓语、宾语、其他语;
将所述第二文字信息和第一文字信息的主语、谓语、宾语、其他语拆分成对应的字形,并将主语、谓语、宾语、其他语中按每项匹配的字形输入法对应的字母的个数构建图表;
根据所述图表框选的面积而确定匹配值,若匹配值大于等于预设阈值,则判定所述中文评论与所述字幕数据匹配,并将所述中文评论与所述流媒体合成并输出至用户终端,若小于预设阈值,则判定所述中文评论与所述字幕数据不匹配,而删除所述中文评论;
确定所述预设阈值的方式为:
将所述主语、谓语、宾语、其他语的汉语拼音的字母个数设置为a1、a2、a3、a4,按如下公式输出预设阈值b:。
3.根据权利要求1或2所述的一种中文评论分析方法,其特征在于:所述构建图表的方式为:
将其按照主语、谓语、宾语、其他语的顺序构建柱状图,其中,所述柱状图的宽度为1,柱状图的高度与每个主语、谓语、宾语、其他语的汉语拼音的字母个数相同。
4.根据权利要求1或2所述的一种中文评论分析方法,其特征在于:所述构建图表的方式为:
按照谓语、宾语、主语、其他语的顺序构建折线图,其中,每组数据的间距为1,每组数据的高度为匹配个数,以所述折线为图像的顶部边界,将穿过折线的左端点的竖直直线输出为图像的左侧边界,将穿过折线的右端点的竖直直线输出为图像的右侧边界,以x轴为图像的底部边界,所述图像面积为匹配值。
5.根据权利要求1所述的一种中文评论分析方法,其特征在于:所述预设阈值优选为[3,100)。
6.根据权利要求1所述的一种中文评论分析方法,其特征在于:所述预设阈值优选为3。
7.根据权利要求2所述的一种中文评论分析方法,其特征在于:所述字形输入法为五笔输入法。
8.根据权利要求2所述的一种中文评论分析方法,其特征在于:所述字形输入法为数字王码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淄博职业学院,未经淄博职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911372086.X/1.html,转载请声明来源钻瓜专利网。





