跳转至

2.4 Neo4j图数据库

Neo4j 介绍

学习目标

  • 了解Neo4j图数据库的简介、版本说明
  • 了解节点, 关系, 属性, 标签的有关概念
  • 掌握Cypher语句的基本命令和语法
  • 掌握py2neo工具对Neo4j图数据库的操作

Neo4j 介绍

  • Neo4j是由Java实现的开源NoSQL图数据库. 自从2003年开始研发, 到2007年发布第一版. neo4j现如今已经被各行各业的数十万家公司和组织采用.
  • Neo4j实现了专业数据库级别的图数据模型的存储. 与普通的图处理或内存级数据库不同, neo4j提供了完整的数据库特性, 包括ACID事物的支持, 集群支持, 备份与故障转移等. 这使其适合于企业级生产环境下的各种应用.
  • Neo4j的版本说明:
    • 企业版: 需要高额的付费获得授权, 提供高可用, 热备份等性能.
    • 社区开源版: 免费使用, 但只能单点运行.

Neo4j 图数据库概念

  • 节点
    • 节点是主要的数据元素, 节点通过关系连接到其他节点, 节点可以具有一个或多个属性 (即存储为键/值对的属性), 节点有一个或多个标签, 用于描述其在图表中的作用. 示例: Person>节点.
    • 可以将节点类比为关系型数据库中的表, 对应的标签可以类比为不同的表名, 属性就是表中的列.
  • 关系
    • 关系连接两个节点, 关系是方向性的, 关系可以有一个或多个属性(即存储为键/值对的 属性).
  • 属性
    • 属性是命名值, 其中名称(或键)是字符串, 属性可以被索引和约束, 可以从多个属性创 建复合索引.
  • 标签
    • 标签用于组节点到集, 节点可以具有多个标签, 对标签进行索引以加速在图中查找节点

Neo4j 图数据库的安装

  • 这里主要介绍windows下Neo4j图数据库是如何安装的

  • 下载安装完之后, 打开windows终端, 输入java --version检查是否安装好

  • 下载好后, 解压到自己想放的盘里(注意, 路径不要出现中文, 以免报错). 例如: C:\Program Files (x86)\neo4j-community-4.4.18

  • 第三步: 对Neo4j进行环境变量配置
    • 创建系统环境变量

      • 过程: 电脑--->属性--->高级系统设置--->环境变量--->新建
      • 手动添加变量名称和变量值(注意变量值是你存放文件的路径)
  • 在path路径中将变量添加进去

第四步: 启动neo4j数据库

  • 打开cmd, 输入: neo4j console
  • 浏览器页面展示

    • 注意: 如果你是第一次安装登录成功, 需要输入用户名和密码(默认用户名和密码一致都是: neo4j). 第一次登录需要更改密码.

Cypher介绍与使用

1 create命令

  • 创建图数据中的节点
  • 演示:
# 创建命令格式: 
# 此处create是关键字, 创建节点名称node_name, 节点标签Node_Label, 放在小括号里面()
# 后面把所有属于节点标签的属性放在大括号'{}'里面, 依次写出属性名称: 属性值, 不同属性用逗号','分隔
# 例如下面命令创建一个节点e, 节点标签是Employee, 拥有id, name, salary, deptnp四个属性: 
CREATE (e:Employee{id:222, name:'Bob', salary:6000, deptnp:12})
  • 效果

2 match命令

  • 匹配(查询)已有数据
  • 演示:
# match命令专门用来匹配查询, 节点名称: 节点标签, 依然放在小括号内, 然后使用return语句返回查询结果, SQL很相似. 
MATCH (e:Employee) RETURN e.id, e.name, e.salary, e.deptno

MATCH (n) return n # 查询所有结点
  • 效果

3 merge命令

  • 若节点存在, 则等效与match命令; 节点不存在, 则等效于create命令.
  • 演示:

MERGE (e:Employee {id:146, name:'Lucer', salary:3500, deptno:16})
- 效果:

  • 然后再次用merge查询, 发现数据库中的数据并没有增加, 因为已经存在相同的数据了, merge匹配成功.
  • 演示:

MERGE (e:Employee {id:146, name:'Lucer', salary:3500, deptno:16})
- 效果:


4 使用create创建关系

  • 必须创建有方向性的关系, 否则报错.
  • 演示:
# 创建一个节点p1到p2的有方向关系, 这个关系r的标签为Buy, 代表p1购买了p2, 方向为p1指向p2
CREATE (p1:Profile1)-[r:Buy]->(p2:Profile2)
  • 效果:

5 使用merge创建关系

  • 可以创建有/无方向性的关系.
  • 演示:

# 创建一个节点p1到p2的无方向关系, 这个关系r的标签为miss, 代表p1-miss-p2, 方向为相互的
MERGE (p1:Profile1)-[r:miss]-(p2:Profile2)
- 效果:


6 where命令

  • 类似于SQL中的添加查询条件.
  • 演示:

# 查询节点Employee中, id值等于123的那个节点
MATCH (e:Employee) WHERE e.id=123 RETURN e
- 效果:


7 delete命令

  • 删除节点/关系及其关联的属性.
  • 演示:

# 注意: 删除节点的同时, 也要删除关联的关系边
MATCH (p1:Profile1)-[r]-(p2:Profile2) DELETE p1, r, p2
- 效果:


8 sort命令

  • Cypher命令中的排序使用的是order by.
  • 演示:

# 匹配查询标签Employee, 将所有匹配结果按照id值升序排列后返回结果
MATCH (e:Employee) RETURN e.id, e.name, e.salary, e.deptno ORDER BY e.id

# 如果要按照降序排序, 只需要将ORDER BY e.salary改写为ORDER BY e.salary DESC
MATCH (e:Employee) RETURN e.id, e.name, e.salary, e.deptno ORDER BY e.salary DESC
- 效果:


9 字符串函数:

1 toUpper()函数
  • 将一个输入字符串转换为大写字母.
  • 演示:
MATCH (e:Employee) RETURN e.id, toUpper(e.name), e.salary, e.deptno
  • 效果:

2 toLower()函数
  • 将一个输入字符串转换为小写字母.
  • 演示:

MATCH (e:Employee) RETURN e.id, toLower(e.name), e.salary, e.deptno
- 效果:


3 substring()函数
  • 返回一个子字符串.
  • 演示:

# 输入字符串为input_str, 返回从索引start_index开始, end_index-1结束的子字符串
substring(input_str, start_index, end_index)

# 示例代码, 返回员工名字的前两个字母
MATCH (e:Employee) RETURN e.id, substring(e.name,0,2), e.salary, e.deptno
- 效果:


4 replace()函数
  • 替换掉子字符串.
  • 演示:

# 输入字符串为input_str, 将输入字符串中符合origin_str的部分, 替换成new_str
replace(input_str, origin_str, new_str)

# 示例代码, 将员工名字替换为添加后缀_HelloWorld
MATCH (e:Employee) RETURN e.id, replace(e.name,e.name,e.name + "_HelloWorld"), e.salary, e.deptno
# 还原
MATCH (e:Employee) RETURN e.id, replace(e.name, "_HelloWorld", ""), e.salary, e.deptno
- 效果:


10 聚合函数

1 count()函数
  • 返回由match命令匹配成功的条数.
  • 演示:

# 返回匹配标签Employee成功的记录个数
MATCH (e:Employee) RETURN count( * )
- 效果:


2 max()函数
  • 返回由match命令匹配成功的记录中的最大值.
  • 演示:

# 返回匹配标签Employee成功的记录中, 最高的工资数字
MATCH (e:Employee) RETURN max(e.salary)
- 效果:


3 min()函数
  • 返回由match命令匹配成功的记录中的最小值.
  • 演示:

# 返回匹配标签Employee成功的记录中, 最低的工资数字
MATCH (e:Employee) RETURN min(e.salary)
- 效果:


4 sum()函数
  • 返回由match命令匹配成功的记录中某字段的全部加和值.
  • 演示:

# 返回匹配标签Employee成功的记录中, 所有员工工资的和
MATCH (e:Employee) RETURN sum(e.salary)
- 效果:


5 avg()函数
  • 返回由match命令匹配成功的记录中某字段的平均值.
  • 演示:

# 返回匹配标签Employee成功的记录中, 所有员工工资的平均值
MATCH (e:Employee) RETURN avg(e.salary)
- 效果:


11 索引index

  • Neo4j支持在节点或关系属性上的索引, 以提高查询的性能.
  • 可以为具有相同标签名称的所有节点的属性创建索引.
1 创建索引
  • 使用create index on来创建索引.
  • 演示:

# 创建节点Employee上面属性id的索引
CREATE INDEX ON:Employee(id)
- 效果:


2 删除索引
  • 使用drop index on来删除索引.
  • 演示:

# 删除节点Employee上面属性id的索引
DROP INDEX ON:Employee(id)
- 效果:



小节总结

  • 学习了 Neo4j 图数据库的相关概念和产品介绍, 以及 Neo4j 图数据库的安装和使用
  • 学习了Cypher语句的基本用法 (一种用于neo4j图数据库的查询语言)