[发明专利]数据处理方法、装置、电子设备及存储介质在审

申请号：	201910517906.3	申请日：	2019-06-14
公开（公告）号：	CN112084297A	公开（公告）日：	2020-12-15
发明（设计）人：	孙中武;董长阳	申请（专利权）人：	百度（中国）有限公司
主分类号：	G06F16/33	分类号：	G06F16/33;G06F40/242
代理公司：	北京同立钧成知识产权代理有限公司 11205	代理人：	朱颖;刘芳
地址：	200041 上海市张江高***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	数据处理方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种数据处理方法、装置、电子设备及存储介质，其中，该方法包括：获取待读取此表文件；根据待读取词表文件的类型，获取待读取词表文件对应的读取向量，并将读取向量存储至互斥队列中，其中，待读取词表文件的类型为独立读取的词表文件或者具有依赖关系的词表文件；调用空闲线程依次读取互斥队列中按照预设顺序排列的读取向量，以使空闲线程根据读取到的读取向量读取词表文件。通过将独立读取的词表文件对应的读取向量和具有依赖关系的词表文件对应的读取向量分别作为整体存储至互斥队列中，有效提高了词表文件读取效率，进一步，通过采用互斥队列结构，有效保证了信息的准确性。

技术领域

本发明涉及计算机应用技术领域，尤其涉及一种数据处理方法、装置、电子设备及存储介质。

背景技术

在当今的互联网领域中，为了加快信息访问速度，大量的信息都是存放在词表文件中，词表文件通常包含多列，且具有一定的存放规则。在现有技术中，读取词表文件是按照可扩展标记语言(Extensible Markup Language，XML)文件中定义的读取顺序依次读取词表文件。

但是，随着后期需求迭代变更，词表文件的数量越来越多，采用上述顺序读取的方式所需时间较长，导致词表文件读取效率较低。

发明内容

本发明提供一种数据处理方法、装置、电子设备及存储介质，以提高词表文件的读取效率。

第一方面，本发明提供一种数据处理方法，该方法包括：

获取待读取词表文件；

根据所述待读取词表文件的类型，获取所述待读取词表文件对应的读取向量，并将所述读取向量存储至互斥队列中，其中，所述待读取词表文件的类型为独立读取的词表文件或者具有依赖关系的词表文件；

调用空闲线程依次读取所述互斥队列中按照预设顺序排列的读取向量，以使所述空闲线程根据读取到的读取向量读取词表文件。

可选地，所述预设顺序为读取向量存放至互斥队列中的时间先后顺序。