[发明专利]OTA酒店的点评与回复的相关度的检测方法及系统有效
| 申请号: | 201910909573.9 | 申请日: | 2019-09-25 |
| 公开(公告)号: | CN110674256B | 公开(公告)日: | 2023-05-12 |
| 发明(设计)人: | 江小林;罗超;胡泓 | 申请(专利权)人: | 携程计算机技术(上海)有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06Q50/14 |
| 代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 薛琦;张冉 |
| 地址: | 200335 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | ota 酒店 点评 回复 相关 检测 方法 系统 | ||
1.一种OTA酒店的点评与回复的相关度的检测方法,其特征在于,所述检测方法包括:
获取对所述OTA酒店的点评及回复;
将所述点评及所述回复分别转换为点评向量序列与回复向量序列;
对所述点评向量序列中向量间的语义关系进行编码以得到每一时刻的编码点评向量;
对所述回复向量序列中向量间的语义关系进行编码以得到每一时刻的编码回复向量;
匹配所述每一时刻的编码点评向量与所述每一时刻的编码回复向量以获得多个匹配向量,所述多个匹配向量构成一匹配向量序列;
捕获所述向量序列中匹配向量间的关系并根据所述关系将所述匹配向量序列聚合为拼接向量;
将所述拼接向量输入至全连接层以得到目标向量,所述目标向量的维度与预设类别的数量相同;
根据所述目标向量计算所述点评与所述回复的相关度概率;
匹配所述每一时刻的编码点评向量与所述每一时刻的编码回复向量以获得多个匹配向量的步骤包括:
从第一点评时刻开始,依次匹配当前时刻的编码点评向量与最后一时刻的编码回复向量以获得每一时刻的第一匹配向量;
从第一回复时刻开始,依次匹配当前时刻的编码回复向量与最后一时刻的编码点评向量以获得每一时刻的第二匹配向量;
所述多个匹配向量包括所述第一匹配向量及所述第二匹配向量;
匹配所述每一时刻的编码点评向量与所述每一时刻的编码回复向量以获得多个匹配向量的步骤还包括:
从第一点评时刻开始,依次计算当前时刻的编码点评向量与每一时刻的编码回复向量以得到每一回复时刻的余弦相似度;
根据当前点评时刻的每一回复时刻的余弦相似度计算加权编码回复向量;
从第一点评时刻开始,匹配每一点评时刻的编码点评向量与对应的加权编码回复向量以以获得每一时刻的第三匹配向量;
从第一回复时刻开始,依次计算当前时刻的编码回复向量与每一时刻的编码点评向量以得到每一点评时刻的余弦相似度;
根据当前回复时刻的每一点评时刻的余弦相似度计算加权编码点评向量;
从第一回复时刻开始,匹配每一回复时刻的编码点评向量与对应的加权编码点评向量以以获得每一时刻的第四匹配向量;
所述多个匹配向量包括所述第三匹配向量及所述第四匹配向量。
2.如权利要求1所述的检测方法,其特征在于,
将所述拼接向量输入至全连接层以得到目标向量的步骤前还包括:
计算每一回复与其他回复的文本相似度以得到相似度序列;
根据所述相似度序列获得相似度平均值;
将所述相似度平均值作为所述拼接向量中的一个维数与所述拼接向量进行拼接;
将所述拼接向量输入至全连接层以得到目标向量的步骤包括:
将与所述相似度平均值拼接后的拼接向量输入至全连接层以得到目标向量;
和/或,
匹配所述每一时刻的编码点评向量与所述每一时刻的编码回复向量以获得多个匹配向量的步骤包括:
根据所述每一时刻的每一维度的加权编码点评向量与所述每一时刻的对应维度的加权编码回复向量的余弦相似度以获得多个匹配向量。
3.如权利要求1所述的检测方法,其特征在于,
对点评向量序列中向量间的语义关系进行编码以得到每一时刻的编码点评向量的步骤中,
所述编码点评向量包括正向编码点评向量及反向编码点评向量;
对回复向量序列中向量间的语义关系进行编码以得到每一时刻的编码回复向量的步骤中,
所述编码回复向量包括正向编码回复向量及反向编码回复向量;
捕获所述向量序列中匹配向量间的关系并根据所述关系将所述向量序列中聚合为拼接向量的步骤包括:
将所述匹配向量序列输入至双向LSTM模型中;
根据所述双向LSTM模型获得每一时刻的所述多个匹配向量间的关系,并截取所述LSTM模型中最后一时刻的点评正向关系向量、点评反向关系向量、回复正向关系向量及回复反向关系向量;
将所述正向关系向量、点评反向关系向量、回复正向关系向量及回复反向关系向量聚合为所述拼接向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程计算机技术(上海)有限公司,未经携程计算机技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910909573.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文本内容审核方法及装置
- 下一篇:评估网络空间中文本信息真实性的方法





