[发明专利]一种在主观答题文本中抽取核心观点的方法在审
| 申请号: | 202110178549.X | 申请日: | 2021-02-09 |
| 公开(公告)号: | CN112905766A | 公开(公告)日: | 2021-06-04 |
| 发明(设计)人: | 封黎 | 申请(专利权)人: | 长沙冉星信息科技有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
| 代理公司: | 北京七夏专利代理事务所(普通合伙) 11632 | 代理人: | 刘毓珍 |
| 地址: | 410000 湖南省长沙市高新开发*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 主观 答题 文本 抽取 核心 观点 方法 | ||
1.一种在主观答题文本中抽取核心观点的方法,其特征在于,包括以下步骤:
S1:输入数据,获取问卷标题、主观题题目、答题文本数据;
S2:行业分类;
S3:文本抽取观点;
S4:合并统计观点。
2.根据权利要求1所述的一种在主观答题文本中抽取核心观点的方法,其特征在于,所述S2步骤中,根据S1步骤中获取的问卷标题、主观题题目进行行业分类,分为餐饮酒店、医疗卫生、大学教育、其他教育、企业管理以及其他行业。
3.根据权利要求1所述的一种在主观答题文本中抽取核心观点的方法,其特征在于,所述S3步骤的具体步骤如下:
a、对文本数据做预处理,删除一些无效文本,包括空文本、内容无意义的文本;
b、根据行业选择对应模型,模型批量对文本进行序列标注;模型训练的流程是用一部分数据训练序列标注模型作为预训练模型,对预训练模型分行业训练序列标注模型,两组数据不重合;
c、处理序列标注的结果,整合观点。
4.根据权利要求1所述的一种在主观答题文本中抽取核心观点的方法,其特征在于,S4步骤中,对抽取的观点做相似度计算,合并相似度较高的观点,统计观点的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙冉星信息科技有限公司,未经长沙冉星信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110178549.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:应用程序的启动方法、装置和电子设备
- 下一篇:一种具有手动开关功能的蒸蛋器





