跳转至

医疗知识图谱项目背景介绍

学习目标

  • 了解项目的开发背景.
  • 了解知识图谱的相关基础概念.

1 项目背景

  • 知识图谱(Knowledge Graph)是人工智能的重要分支技术,它在2012年由谷歌提出,成为建立大规模知识的杀手锏应用,在搜索、自然语言处理、智能助手、电子商务等领域发挥着重要作用。知识图谱与大数据、深度学习,这三大“秘密武器”已经成为推动互联网和人工智能发展的核心驱动力之一。

  • 传智教育的AI引领IT教育前沿, 特此推出关于医疗方面的知识图谱项目, 带着同学们完整的学习知识图谱相关技术, 并扎实的掌握核心内容和代码能力.
  • 医疗知识图谱的意义:医疗知识图谱不仅能够整合和表示医学领域的大量知识,还能够为医疗决策支持系统、疾病诊断、药物研发等领域提供有力的支持,对知识图谱的研究以及在医疗领域的应用具有重要的现实意义和广泛的应用场景。
  • 本项目图谱结果展示:


2 什么是知识图谱

  • 什么是知识图谱呢?
    • 在这里我们分开讨论一下什么是知识,什么是图谱.

  • 什么是知识?
    • 知识是人类在实践中认识客观世界的成果,它包括事实、信息、描述以及在教育和实践中获得的技能. 知识是人类从各个途径中获得的经过提升、总结与凝炼的系统的认识.
    • 举一个简单的例子: 226.1厘米,229厘米,都是客观存在的单独数据. 此时,数据不具有任何意义,仅表达一个客观表达事实. 而如果我们说"姚明的臂展为226.1厘米"、"姚明的身高是229厘米"则称为是事实型的陈述,属于信息的范畴. 那么所谓知识,就是对信息层面的抽象和归纳,如果我们把姚明的身高、臂展,及其他属性整合起来, 就得到了对于姚明的一个认知, 进一步可以了解到姚明的身高比普通人要高.

  • 什么是图谱

    • 图谱的英文是Graph,直译过来就是“图”的意思. 在图论(数学的一个研究分支)中,图表示一些事物与另一些事物之间相互连接的结构.
    • 图通常由节点(Vertex)和边(Edge)来构成,多关系图一般包含多种类型的节点和多种类型的边. 实体(节点)指的是现实世界中的事物比如人、地名、公司等,关系(边)则用来表达不同实体之间的某种联系,比如张三-“出生于”-上海、小明和小红是“朋友”等等. 下面是个非常简单的图,它由4个节点和5条边组成.

  • 从字面上看,知识图谱就是用图的形式将知识表示出来. 图中的结点代表语义实体或概念,边代表结点间的各种语义关系.
  • 如果我们将上述姚明的一些基本信息用计算机所能理解的语言表示出来,那么我们可以构建一个简单的知识图谱来实现. 比如,<姚明,职业,篮球运动员>表示姚明的职业是篮球运动员,其中“姚明”和“篮球运动员”是两个节点 (即实体),而节点间边(即关系)是“职业”. 这是一种常用的基于符号的知识表示方式——资源描述框架(Resource Description Framework,RDF),它把知识表示为一个包含主语(Subject)、谓语(Predicate)和宾语(Object)的三元组.
  • 从上述内容描述我们可以总结出,知识图谱(Knowledge Graph)以结构化的形式描述客观世界中概念、实体及其关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。

3 知识图谱的典型应用

  • 知识图谱技术已发展多年,相关产业也日趋成熟,下面是几种典型的知识图谱应用形式:
  • 商业知识图谱:
    • 下图为:**公司利用全量工商股权数据,抽取企业间的股权投资关系,搭建知识图谱。基于图谱分析有助于企业识别潜在的商业机会和风险,对于提高决策的科学性和针对性具有重要意义。

  • 教育知识图谱:
    • 下图是**公司根据学生的教材、教师笔记等数据,构建教育方面的知识图谱,帮助师生从大量的教学资源和知识点中提取出核心内容,实现知识的有效管理与组织,并且该知识图谱可以作为教育领域智能问答系统的基础,通过对知识点之间关系的理解,实现更加准确和高效的自动化答疑和教学辅助,减轻教师的工作量。

  • 政务信息图谱:
    • 下图是***公司和政府合作,结合政府机关提供的日常工作和生产过程中产生的各种数据(去敏),构建了政务知识图谱,一方面实现海量政务数据自动化分析监测的手段,另一方面可以提高政务人员工作的效率.


小节总结

  • 本章节主要介绍了医疗知识图谱的项目背景,梳理知识图谱的相关概念,了解图谱在企业里的真实的用场景.
  • 知识图谱领域广泛, 涉及到的细分方向和知识点非常多, 在后续课程学习中我们会带着同学们一步步掌握.