[发明专利]一种从文本中挖掘和定位个人能力的方法有效
| 申请号: | 201910538161.9 | 申请日: | 2019-06-20 |
| 公开(公告)号: | CN110263341B | 公开(公告)日: | 2023-06-20 |
| 发明(设计)人: | 吴漾;王鹏宇;缪新萍;杨箴;周玲;田钺 | 申请(专利权)人: | 贵州电网有限责任公司 |
| 主分类号: | G06F40/284 | 分类号: | G06F40/284 |
| 代理公司: | 贵阳中新专利商标事务所 52100 | 代理人: | 胡绪东 |
| 地址: | 550002 贵*** | 国省代码: | 贵州;52 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文本 挖掘 定位 个人 能力 方法 | ||
1.一种从文本中挖掘和定位个人能力的方法,其特征在于:该方法包括以下步骤:
(1)数据入库:通过将文档数据以及多封邮件数据入库,将word的文件生成html然后进行爬取入库,邮件数据直接入库;
(2)利用文档数据和邮件数据生成的数据库生成人名词库以及系统词库文件,系统词库指公司的应用系统的词库;
(3)根据生成的人名词库以及系统词库分词并去掉停用词;
(4)提取出所有谓词并生成谓词文件;
(5)利用谓词文件人工标注出能力词并形成能力词库文件;
(6)利用能力词库文件、人名词库以及系统词库分词并去掉停用词,分析文档每句话,根据正则和规则判断能力、人名之间是不是并列的关系,若是,则生成能力和所有人员对应关系,不是,则根据距离计算最近的,然后将生成对应人员能力并存入数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州电网有限责任公司,未经贵州电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910538161.9/1.html,转载请声明来源钻瓜专利网。





