[发明专利]一种识别符号的数据处理系统有效
申请号: | 202210856545.7 | 申请日: | 2022-07-21 |
公开(公告)号: | CN115169319B | 公开(公告)日: | 2023-02-07 |
发明(设计)人: | 刘羽;张正义;刘宸;傅晓航 | 申请(专利权)人: | 中科雨辰科技有限公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F40/295 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 安娜 |
地址: | 100093 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 符号 数据处理系统 | ||
1.一种识别符号的数据处理系统,其特征在于,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库包括:事件的目标文本集A={A1,……,Ai,……,An},Ai是指第i个事件对应的目标文本列表,i=1……n,n为事件数量,当所述计算机程序被处理器执行时,实现以下步骤:
S100、获取Ai对应的第一文本列表Ci={Ci1,……,Cix,……,Cip},Cix是指第i个目标事件的第x个第一文本,x=1……p,p为第i个目标事件的第一文本数量,以及Ai对应的第二文本列表Di={Di1,……,Diy,……,Diq},Diy是指第i个目标事件的第y个第二文本,y=1……q,q为第i个目标事件的第二文本数量,其中,在S100步骤中通过如下步骤获取第一文本和第二文本:
S101、从数据库中,获取Ai={Ai1,……,Aij,……,Aimi},Aij是指第i个事件对应的第j目标文本,j=1……mi,mi是指第i个事件对应的目标文本数量;
S103、对Aij进行分词处理,获取Aij对应的目标词字符串Bij={B1ij,……,Brij,……,BSjij},Brij是指Aij对应的第r个目标词,r=1……Sj,Sj是指Aij对应的目标词数量;
S105、当Brij不为符号时,确定Aij为第一文本;
S107、当Brij为符号时,确定Aij为第二文本;
S200、根据每一Cix,获取Ci对应的目标三元组C'i={C'i1,C'i2,C'i3},其中,C'i1是指Ci的第一目标实体,C'i2是指Ci的第二目标实体,C'i3是指C'i1和C'i2之间的目标关系,其中,在S200步骤中还包括如下步骤:
S201、获取Cix对应的中间三元组C'ix={C1ix,C2ix,C3ix},其中,C1ix是指Cix的第一中间实体,C2ix是指Cix的第二中间实体,C3ix是指C1ix和C2ix之间的中间关系,
S203、根据所有的C'ix,获取Ci对应的第一数据列表G1i={C1i1,……,C1ix,……,C1ip}、Ci对应的第二数据列表G2i={C2i1,……,C2ix,……,C2ip}和Ci对应的第三数据列表G3i={C3i1,……,C3ix,……,C3ip};
S205、根据G1i、G2i和G3i,获取C'i;
S300、根据Diy,获取Diy对应的关键三元组Hiy={H1iy,H2iy,H3iy},H1iy是指Diy的第一关键实体,H2iy是指Diy的第二关键实体,H3iy是指H1iy和H2iy之间的关键关系;
S400、当Hgiy=null时,获取Diy对应的的相似度Fiy,其中,Hgiy为H1iy,H2iy和H3iy中任意一个;
S500、当Fiy≥预设的相似度阈值时,确定Hgiy=C'ig,其中,C'ig为C'i1,C'i2和C'i3中任意一个;
S600、当Fiy<预设的相似度阈值时,将Hgiy标记为异常符号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科雨辰科技有限公司,未经中科雨辰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210856545.7/1.html,转载请声明来源钻瓜专利网。