[发明专利]一种语义识别方法、装置、终端设备和存储介质在审
申请号: | 201811533269.0 | 申请日: | 2018-12-14 |
公开(公告)号: | CN109635091A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 潘晶;高再荣;沈满;崔瑶;陈彦品;董超;薛长城 | 申请(专利权)人: | 上海钛米机器人科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 201203 上海市浦东新区自由*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预设 反馈信息 词句 知识库 存储介质 目标词句 文本信息 语义识别 预设信息 终端设备 分词 分词处理 信息对应 自动识别 申请 匹配 文本 | ||
本申请实施例公开了一种语义识别方法、装置、终端设备和存储介质,该方法包括:获取待处理文本信息;对所述待处理文本信息进行分词处理,以确定分词信息;将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息;将所述目标词句信息对应的预设信息确定为反馈信息。本申请实施例可以对用户输入的文本进行自动识别,确定对应的反馈信息,用户可以通过反馈信息了解到想要知道的信息。
技术领域
本申请实施例涉及语义识别技术,尤其涉及一种语义识别方法、装置、终端设备和存储介质。
背景技术
病人去医院看病时,有时候需要咨询一些与医疗相关的问题,但是医院往往有很多病人,如果医护人员需要一一解答病人的咨询问题,会给医护人员增加很多工作量,降低医护人员的工作效率。
发明内容
本申请实施例提供一种语义识别方法、装置、终端设备和存储介质,可以自动识别用户的咨询问题并提供对应的信息。
第一方面,本申请实施例提供了一种语义识别方法,包括:
获取待处理文本信息;
对所述待处理文本信息进行分词处理,以确定分词信息;
将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息;
将所述目标词句信息对应的预设信息确定为反馈信息。
进一步地,对所述待处理文本信息进行分词处理,以确定分词信息包括:
对所述待处理文本信息进行分词处理以得到分解词语,并确定每个分解词语的权重值;
将所述分解词语和对应的权重值确定为分词信息。
进一步地,所述将所述分解词语和对应的权重值确定为分词信息之前,还包括:
依据预设的频用词列表调整每个分解词语的权重值,以使属于频用词列表的分解词语的权重降低。
进一步地,所述将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,包括:
将所述分解词语与预设知识库中的预设词句信息进行匹配,并根据每个分解词语的权重值确定所述分词信息与所述预设词句信息的匹配值;
确定所述分词信息与所有预设词句信息的匹配值,将匹配值最高的预设词句信息确定为目标词句信息。
进一步地,所述对所述待处理文本信息进行分词处理以得到分解词语包括:
依据预设的关键词列表对所述待处理文本信息进行分词处理;
如果所述待处理文本信息中所包括的连续词语属于所述关键词列表,则确定所述连续词语为一个分解词语。
进一步地,所述将所述分词信息与预设知识库中的预设词句信息进行匹配之前,还包括:
依据所述连续词语从预设知识库中确定对应的预设词句信息,并确定为待匹配词句信息;
所述将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,包括:
将所述分词信息与所述待匹配词句信息进行匹配,以从所述待匹配词句信息中确定目标词句信息。
进一步地,所述获取待处理文本信息之前,还包括:
获取用户输入的语音信息,对所述语音信息进行文本识别以获取待处理文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海钛米机器人科技有限公司,未经上海钛米机器人科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811533269.0/2.html,转载请声明来源钻瓜专利网。