
2019-TF21-医渡云-闫峻-医疗知识图谱构建中的真实世界数据挑战与方法.pdf
5星
- 浏览量: 0
- 大小:None
- 文件类型:PDF
简介:
本论文由医渡云闫峻于2019年撰写,探讨了在构建医疗知识图谱过程中遇到的真实世界数据挑战,并提出相应的解决策略和方法。
近期,在医疗健康领域构建与应用知识图谱引起了学术界及工业界的广泛关注。医疗知识图谱的创建可以基于指南、书籍或文献进行知识抽取,也可以依靠领域专家的知识编辑来完成;而另一重要来源则是通过真实世界数据中的挖掘获得新知。
本次报告的重点在于探讨以临床电子病历为代表的真实世界数据在构建医疗知识图谱过程中遇到的主要问题与挑战,并提出相应的解决策略。我们将从讨论临床电子病历的数据质量问题入手,介绍如何建立医学常识库来确保知识源头的质量。接下来会深入讲解实体识别及标准化技术在处理医疗文本时的特殊性和面临的挑战,并通过实际案例展示更为有效的解决方案。
报告还将简要概述真实世界数据挖掘过程中其它遇到的技术难题及其对应的算法框架。最后,我们将分享一些具体的应用实例和成果。
闫峻,医渡云公司的首席人工智能科学家,在这一主题上进行了深入探讨并分享了构建此类知识图谱的关键技术和应对策略。医疗知识图谱的创建主要依赖于两种类型的数据来源:一种是传统的文献、指南及书籍;另一种则是临床电子病历等真实世界数据。后者由于其实时性和广泛性,为知识图谱提供了丰富的素材,但同时也带来了挑战。
例如,在处理临床数据的质量问题上(包括不完整性、错误性和格式一致性),需要建立医学常识库来确保知识的准确度和可靠性。医疗文本中的实体识别及标准化是构建知识图谱的重要环节;由于医学领域的术语复杂且专业,因此在这一过程中需采用特定技术,如自然语言处理(NLP)。实际操作中可能还需结合专家知识与机器学习算法以提高效率和准确性。
此外,在数据应用层面,医疗知识图谱的应用场景多样,包括但不限于医疗管理、科研工作、临床诊疗以及教学培训等。然而,用户需求的个性化及专业化要求加之对数据安全性和合规性的严格规定,则进一步提升了构建高质量医疗知识图谱的技术难度。医渡云公司为此开发了一系列解决方案和技术手段,如智能集成系统和区域或院级主索引机制,以确保患者信息的一致性与准确性,在跨系统、跨地域的数据共享中发挥重要作用。
为应对上述挑战,医渡云还研发了智能数据融合技术,能够高效处理大量分散且增长迅速的非结构化医疗数据,并通过分布式计算实现快速检索。同时,采用多粒度推理和人机协同等方法进一步提升了知识图谱的认知能力和信息整合效率,以适应不断变化的医学环境及用户需求。
综上所述,在构建基于真实世界数据的高质量医疗知识图谱过程中面临着复杂且具有挑战性的任务;唯有综合运用包括但不限于数据质量治理、自然语言处理与数据分析在内的多种技术手段,并结合专业知识和创新平台,方能打造出兼具实用性和高可用性特点的知识图谱系统,从而更好地服务于整个医疗卫生行业的多元化需求。
全部评论 (0)


