[发明专利]用于购物网页的短文本分类方法、装置、设备及其介质在审
申请号: | 201810413709.2 | 申请日: | 2018-05-03 |
公开(公告)号: | CN110443661A | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | 包喆元 | 申请(专利权)人: | 上海媒科锐奇网络科技有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F17/27 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 肖华 |
地址: | 200135 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及信息技术领域,公开了一种用于购物网页的短文本分类方法、装置、设备及其介质。本发明的用于购物网页的短文本分类方法包括:从购物网页获取待分类短文本;对待分类短文本进行分词处理得到待分类短文本的第一分词集;对第一分词集进行去噪声处理得到待分类短文本的第二分词集;基于第二分词集提取对应待分类短文本的关键词;根据提取的关键词和商品领域词集,将待分类短文本进行分类。本发明能够针对购物网页中短文本数据的类型特点,通过去噪声和领域词集的使用,提高对短文本分类的准确性。 | ||
搜索关键词: | 短文本 短文本分类 分类 分词 购物 网页 去噪声 信息技术领域 分词处理 商品领域 网页获取 | ||
【主权项】:
1.一种用于购物网页的短文本分类方法,其特征在于,包括:从购物网页获取待分类短文本;对所述待分类短文本进行分词处理得到所述待分类短文本的第一分词集;对所述第一分词集进行去噪声处理得到所述待分类短文本的第二分词集;基于所述第二分词集提取对应所述待分类短文本的关键词;根据提取的所述关键词和商品领域词集,将所述待分类短文本进行分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海媒科锐奇网络科技有限公司,未经上海媒科锐奇网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810413709.2/,转载请声明来源钻瓜专利网。