2.4 Neo4j图数据库

Neo4j 介绍¶

学习目标¶

了解Neo4j图数据库的简介、版本说明
了解节点, 关系, 属性, 标签的有关概念
掌握Cypher语句的基本命令和语法

掌握py2neo工具对Neo4j图数据库的操作

Neo4j 介绍¶

Neo4j是由Java实现的开源NoSQL图数据库. 自从2003年开始研发, 到2007年发布第一版. neo4j现如今已经被各行各业的数十万家公司和组织采用.
Neo4j实现了专业数据库级别的图数据模型的存储. 与普通的图处理或内存级数据库不同, neo4j提供了完整的数据库特性, 包括ACID事物的支持, 集群支持, 备份与故障转移等. 这使其适合于企业级生产环境下的各种应用.
Neo4j的版本说明:
- 企业版: 需要高额的付费获得授权, 提供高可用, 热备份等性能.
- 社区开源版: 免费使用, 但只能单点运行.

Neo4j 图数据库概念¶

节点
- 节点是主要的数据元素, 节点通过关系连接到其他节点, 节点可以具有一个或多个属性 (即存储为键/值对的属性), 节点有一个或多个标签, 用于描述其在图表中的作用. 示例: Person>节点.
- 可以将节点类比为关系型数据库中的表, 对应的标签可以类比为不同的表名, 属性就是表中的列.
关系
- 关系连接两个节点, 关系是方向性的, 关系可以有一个或多个属性(即存储为键/值对的属性).
属性
- 属性是命名值, 其中名称(或键)是字符串, 属性可以被索引和约束, 可以从多个属性创建复合索引.
标签
- 标签用于组节点到集, 节点可以具有多个标签, 对标签进行索引以加速在图中查找节点

Neo4j 图数据库的安装¶

这里主要介绍windows下Neo4j图数据库是如何安装的

第一步: 安装JAVA SE 的 JDK
- 下载地址: https://www.oracle.com/java/technologies/downloads/#java11 (注意: 在点击下载的过程中, 可能需要需要oracle账户, 直接注册登录即可下载)

下载安装完之后, 打开windows终端, 输入java --version检查是否安装好

第二步: 下载安装Neo4j
- 从官网下载社区版本, 下载地址: https://neo4j.com/download-center/#community
- 这里注意, 因为JDK为11版本, 所以我们这里对应下载Neo4j 4.0版本

下载好后, 解压到自己想放的盘里（注意, 路径不要出现中文, 以免报错）. 例如: C:\Program Files (x86)\neo4j-community-4.4.18

第三步: 对Neo4j进行环境变量配置
- 创建系统环境变量
  - 过程: 电脑--->属性--->高级系统设置--->环境变量--->新建
  - 手动添加变量名称和变量值（注意变量值是你存放文件的路径）

在path路径中将变量添加进去

第四步: 启动neo4j数据库

打开cmd, 输入: neo4j console

浏览器页面展示
- 注意: 如果你是第一次安装登录成功, 需要输入用户名和密码（默认用户名和密码一致都是: neo4j）. 第一次登录需要更改密码.

Cypher介绍与使用¶

1 create命令¶

创建图数据中的节点
演示:

# 创建命令格式: 
# 此处create是关键字, 创建节点名称node_name, 节点标签Node_Label, 放在小括号里面()
# 后面把所有属于节点标签的属性放在大括号'{}'里面, 依次写出属性名称: 属性值, 不同属性用逗号','分隔
# 例如下面命令创建一个节点e, 节点标签是Employee, 拥有id, name, salary, deptnp四个属性: 
CREATE (e:Employee{id:222, name:'Bob', salary:6000, deptnp:12}）

效果

2 match命令¶

匹配(查询)已有数据
演示:

# match命令专门用来匹配查询, 节点名称: 节点标签, 依然放在小括号内, 然后使用return语句返回查询结果, 和SQL很相似. 
MATCH (e:Employee) RETURN e.id, e.name, e.salary, e.deptno

MATCH (n) return n # 查询所有结点

效果

3 merge命令¶

若节点存在, 则等效与match命令; 节点不存在, 则等效于create命令.
演示:

MERGE (e:Employee {id:146, name:'Lucer', salary:3500, deptno:16})

- 效果:

然后再次用merge查询, 发现数据库中的数据并没有增加, 因为已经存在相同的数据了, merge匹配成功.
演示:

MERGE (e:Employee {id:146, name:'Lucer', salary:3500, deptno:16})

- 效果:

4 使用create创建关系¶

必须创建有方向性的关系, 否则报错.
演示:

# 创建一个节点p1到p2的有方向关系, 这个关系r的标签为Buy, 代表p1购买了p2, 方向为p1指向p2
CREATE (p1:Profile1)-[r:Buy]->(p2:Profile2)

效果:

5 使用merge创建关系¶

可以创建有/无方向性的关系.
演示:

# 创建一个节点p1到p2的无方向关系, 这个关系r的标签为miss, 代表p1-miss-p2, 方向为相互的
MERGE (p1:Profile1)-[r:miss]-(p2:Profile2)

- 效果:

6 where命令¶

类似于SQL中的添加查询条件.
演示:

# 查询节点Employee中, id值等于123的那个节点
MATCH (e:Employee) WHERE e.id=123 RETURN e

- 效果:

7 delete命令¶

删除节点/关系及其关联的属性.
演示:

# 注意: 删除节点的同时, 也要删除关联的关系边
MATCH (p1:Profile1)-[r]-(p2:Profile2) DELETE p1, r, p2

- 效果:

8 sort命令¶

Cypher命令中的排序使用的是order by.
演示:

# 匹配查询标签Employee, 将所有匹配结果按照id值升序排列后返回结果
MATCH (e:Employee) RETURN e.id, e.name, e.salary, e.deptno ORDER BY e.id

# 如果要按照降序排序, 只需要将ORDER BY e.salary改写为ORDER BY e.salary DESC
MATCH (e:Employee) RETURN e.id, e.name, e.salary, e.deptno ORDER BY e.salary DESC

- 效果:

9 字符串函数:¶

1 toUpper()函数¶

将一个输入字符串转换为大写字母.
演示:

MATCH (e:Employee) RETURN e.id, toUpper(e.name), e.salary, e.deptno

效果:

2 toLower()函数¶

将一个输入字符串转换为小写字母.
演示:

MATCH (e:Employee) RETURN e.id, toLower(e.name), e.salary, e.deptno

- 效果:

3 substring()函数¶

返回一个子字符串.
演示:

# 输入字符串为input_str, 返回从索引start_index开始, 到end_index-1结束的子字符串
substring(input_str, start_index, end_index)

# 示例代码, 返回员工名字的前两个字母
MATCH (e:Employee) RETURN e.id, substring(e.name,0,2), e.salary, e.deptno

- 效果:

4 replace()函数¶

替换掉子字符串.
演示:

# 输入字符串为input_str, 将输入字符串中符合origin_str的部分, 替换成new_str
replace(input_str, origin_str, new_str)

# 示例代码, 将员工名字替换为添加后缀_HelloWorld
MATCH (e:Employee) RETURN e.id, replace(e.name,e.name,e.name + "_HelloWorld"), e.salary, e.deptno
# 还原
MATCH (e:Employee) RETURN e.id, replace(e.name, "_HelloWorld", ""), e.salary, e.deptno

- 效果:

10 聚合函数¶

1 count()函数¶

返回由match命令匹配成功的条数.
演示:

# 返回匹配标签Employee成功的记录个数
MATCH (e:Employee) RETURN count( * )

- 效果:

2 max()函数¶

返回由match命令匹配成功的记录中的最大值.
演示:

# 返回匹配标签Employee成功的记录中, 最高的工资数字
MATCH (e:Employee) RETURN max(e.salary)

- 效果:

3 min()函数¶

返回由match命令匹配成功的记录中的最小值.
演示:

# 返回匹配标签Employee成功的记录中, 最低的工资数字
MATCH (e:Employee) RETURN min(e.salary)

- 效果:

4 sum()函数¶

返回由match命令匹配成功的记录中某字段的全部加和值.
演示:

# 返回匹配标签Employee成功的记录中, 所有员工工资的和
MATCH (e:Employee) RETURN sum(e.salary)

- 效果:

5 avg()函数¶

返回由match命令匹配成功的记录中某字段的平均值.
演示:

# 返回匹配标签Employee成功的记录中, 所有员工工资的平均值
MATCH (e:Employee) RETURN avg(e.salary)

- 效果:

11 索引index¶

Neo4j支持在节点或关系属性上的索引, 以提高查询的性能.
可以为具有相同标签名称的所有节点的属性创建索引.

1 创建索引¶

使用create index on来创建索引.
演示:

# 创建节点Employee上面属性id的索引
CREATE INDEX ON:Employee(id)

- 效果:

2 删除索引¶

使用drop index on来删除索引.
演示:

# 删除节点Employee上面属性id的索引
DROP INDEX ON:Employee(id)

- 效果:

小节总结¶

学习了 Neo4j 图数据库的相关概念和产品介绍, 以及 Neo4j 图数据库的安装和使用
学习了Cypher语句的基本用法 (一种用于neo4j图数据库的查询语言)