[发明专利]一种构建乳腺超声领域本体的方法有效
| 申请号: | 201910506556.0 | 申请日: | 2019-06-12 |
| 公开(公告)号: | CN110263336B | 公开(公告)日: | 2023-06-23 |
| 发明(设计)人: | 陈德华;刘淑君;乐嘉锦;张敬谊;王晔;张鑫金 | 申请(专利权)人: | 东华大学;万达信息股份有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295;G06F40/30;G06F40/242;G06N3/0442;G06N3/047;G06N3/045;G06N3/08 |
| 代理公司: | 上海泰能知识产权代理事务所(普通合伙) 31233 | 代理人: | 宋缨;钱文斌 |
| 地址: | 201620 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 构建 乳腺 超声 领域 本体 方法 | ||
本发明涉及一种构建乳腺超声领域本体的方法,包括以下步骤:对乳腺超声文本数据进行预处理;对预处理后的乳腺超声文本数据中的句子进行实体词的识别,并根据实体关系抽取算法获取实体关系三元组;将得到的实体关系三元组添加到乳腺超声领域本体的基础框架对应的节点下得到乳腺超声领域本体。本发明能够有效提高乳腺超声报告中的结构化水平。
技术领域
本发明涉及医学领域本体构建技术领域,特别是涉及一种构建乳腺超声领域本体的方法。
背景技术
随着经济的发展、科技的进步,人们在不断追求物质生活水平提升的同时,因生活压力、工作忙碌等多种因素带来的健康问题也日益显著。对于女性而言,绝经期延后、晚生育、焦虑、不良情绪、高热量及高脂肪饮食等不健康的生活方式、外源性雌激素摄入增多(某些药物、保健品)等生活环境因素,使得乳腺疾病的发病率逐年上升,如乳腺增生、乳腺炎症、乳腺良性肿瘤、乳腺恶性肿瘤等疾病。其中,乳腺癌是全球女性最常见的癌症之一,占所有女性癌症的16%。每年全球新发乳腺癌的病例达到167.1万,死亡率高达52.2万,大多数乳腺癌死亡病例(69%)发生在发展中国家。
近年来,随着人工智能的兴起,深度学习已成为研究热点,许多学者和研究人员将深度学习的方法应用于非结构化医疗文本上,以构建疾病分类模型和预测模型。随着学者对结构化领域的不断深入研究,他们发现本体(Ontology)作为信息传播和交换的载体,能够清晰地表示概念语义和它们之间的关系,从而使本体驱动系统从非结构化文本中抽取出与模型匹配的数据,最终以本体的形式输出。本体驱动的信息抽取作为一大研究热点,逐渐受到越来越多的关注。
领域本体的构建是本体驱动信息抽取的核心,领域本体的好坏直接影响信息抽取和结构化结果的质量。医学领域本体描述了医学领域中的概念和关系,便于计算机理解语义信息,促进医学知识共享。目前,国内外研究人员对医学领域本体的构建进行了深入研究和实践,研究成果越来越丰富。在医学领域本体构建的研究上,国外的工作主要集中在术语制定和英文本体构建。美国国立医学图书馆研发了医学一体化语言系统(Unified MedicalLanguage System,UMLS),该系统是医学领域最著名的概念语义模型之一,包含了不同领域的各种命名法和本体论的概要。美国病理学家学会创建了医学系统术语(SystematizedNomenclature ofMedicine-Clinical Terms),该综合性临床术语集覆盖了有关临床医学的重要信息,包括疾病、临床表现、治疗等。国内对医学领域本体构建的研究工作,大多是借鉴国外已有的本体构建思想和理论,对中文医疗开展相关的研究。张巍和张绚等人提出了基于本体和案例推理的高血压诊疗系统模型,以辅助诊断和治疗高血压疾病。杨青等人采用斯坦福七步法构建了高血压本体并应用于智能检索。牟冬梅和范轶等人构建了心电图领域本体,用于对心脏病的诊断。刘智锋等人以国内糖尿病领域相关临床指南和领域专家知识为依据,抽取概念以及概念之间的关系,借鉴七步法和骨架法,构建了糖尿病领域本体库。浙江大学陈云志以肝炎疾病作为主要研究领域,探讨本体的构建方法和流程,利用本体构建工具实现肝炎本体构建。
发明内容
本发明所要解决的技术问题是提供一种构建乳腺超声领域本体的方法,有效提高乳腺超声报告中的结构化水平。
本发明解决其技术问题所采用的技术方案是:提供一种构建乳腺超声领域本体的方法,包括以下步骤:
(1)对乳腺超声文本数据进行预处理;
(2)对预处理后的乳腺超声文本数据中的句子进行实体词的识别,并根据实体关系抽取算法获取实体关系三元组;
(3)将得到的实体关系三元组添加到乳腺超声领域本体的基础框架对应的节点下得到乳腺超声领域本体。
所述步骤(1)包括以下子步骤:
(11)构建乳腺医学自定义词典,并使用该自定义词典对超声文本数据进行中文分词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学;万达信息股份有限公司,未经东华大学;万达信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910506556.0/2.html,转载请声明来源钻瓜专利网。





