七的博客

PostgreSQL11快速入门(四)-数据库对象基本概念

PostgreSQL

PostgreSQL11快速入门(四)-数据库对象基本概念

这一节主要讲解数据库相关的基础概念,包括数据库、模式、表、行、列等。

1. 数据库、模式、表、行和列

首先先用一张图来大概了解下 PG 的数据库对象的结构:

PG数据库对象结构

这里先给出层级关系定义:

  • 一个 PG 服务器实例 可以包含多个 数据库 database
  • 每个 数据库 database 可以包含多个 模式 schema
  • 每个 模式 schema 可以包含多个 表 table(当然也包括其他对象,比如视图、函数等,这里先不展开)。

1.1 数据库 database

定义:数据库是一个按照数据结构来组织、存储和管理数据的仓库。 在 PG 中 , 一个数据库服务器实例可以管理多个数据库 , 每个数据库都是相互独立的,有自己的表、视图、函数等对象。 这里需要搞清楚的是, database 指的是一个数据库实例底下的仓库,不是指的数据库实例本身。

创建数据库的 SQL 语法如下:

CREATE DATABASE database_name;

用途: 通常一个项目或一个应用会使用一个数据库,但是如果项目非常大,或者需要隔离不同的业务线,可能会使用多个数据库。

**特点: **每个数据库都是隔离的,不同数据库之间默认不能直接进行交叉查询( 除非使用特定的扩展如 dblink)。

**举例: ** 假设图书馆是一个数据库实例 ( database instance ),那么数据库 (database) 就类似于图书馆的一个分馆。每个分馆都是独立管理的,有自己的书籍集合和规章制度。

PgAdmin中database图形界面展示

1.2 模式 schema

定义: 模式 (Schema) 是一个命名空间 , 用于组织数据库对象 , 如表、视图、函数等。一个数据库可以包含多个模式 , 而一个模式可以包含多个数据库对象。模式可以用于将数据库对象分组 , 提高可管理性和安全性。

创建模式的 SQL 语法如下:

CREATE SCHEMA schema_name;

用途: 模式用来组织和分隔数据库中的数据,可以根据功能、应用模块或访问权限来组织数据。一个数据库可以包含多个模式。PG 默认每个数据库底下有一个 public 的模式,各个用户都可以访问。

**特点: **模式可以用来控制数据的访问权限,常用于在同一个数据库中实现逻辑上的分组和隔离。

**举例: ** 如果数据库(database) 是图书馆的一个分馆 ,那么模式( schema ) 图书馆内的不同部门或区域(例如,科学、文学、儿童区)。每个区域管理着特定类型的书籍,并且这些区域帮助管理和组织图书馆内的空间。

pgAdmin中模式展示

1.3 表 table

定义: 表是数据库中最基本的对象,用于存储结构化数据。一个表由行 (Row) 和列 (Column) 组成 , 每一列都有一个特定的数据类型。表可以位于某个模式下,也可以位于公共模式(public)下。

创建表的 SQL 语法如下:

CREATE TABLE table_name (
  column1 datatype,
  column2 datatype,
  ...
);

用途: 表用来具体存储数据,每个表都属于某个模式,表中的数据按照定义的列结构来组织。

**特点: **每个表都有一个或多个列,每列有特定的数据类型和大小。表可以通过主键、外键等约束来维护数据的完整性。

举例: 数据库表 ( table ) 就是具体的书架,每个书架上放置着具体的书籍,这些书籍按照一定的顺序和分类存放。

数据库表定义

1.4 行 row

定义: 行(也称为元组或记录)是表中的一条数据 , 表示一个实体的信息。一行数据包含了表中每一列的值。

插入行的 SQL 语法如下:

INSERT INTO table_name (column1, column2, ...)
VALUES (value1, value2, ...);

用途: 每一行代表一个单独的数据实体或记录。例如,在一个员工数据库的表中,每一行将代表一个员工的完整记录,包括他们的姓名、部门、职位等。

**特点: **数据库中的每一行可以通过一个唯一标识符(如主键)进行识别,确保每条记录的独立性。

举例: 每一行就像是图书馆的一本书。每本书都是一个单独的实体,包含了描述这本书的所有详细信息(在数据库中,这些详细信息是通过列来定义的)。

数据库行定义

1.5 列 column

定义: 列(也称为字段或属性)是表中的一个数据项,用于描述实体的某个属性。每个列都有一个名称和数据类型,列的值在每一行中都有一个对应的值。

**举例: ** 每一列就像是图书馆书籍记录表中的一个属性或特征,例如”书名”、”作者”或”出版年份”。所有的书都会在这些特定的属性下记录相应的信息。

数据库列定义

2. 主键、外键和索引

2.1 主键

定义:主键 (Primary Key) 是表中的一列或多列,用于唯一标识表中的每一行数据。主键的值不能为空,也不能重复。一个表只能有一个主键。

定义主键的 SQL 语法如下:

CREATE TABLE table_name (
  column1 datatype PRIMARY KEY,
  column2 datatype,
  ...
);

或者:

CREATE TABLE table_name (
  column1 datatype,
  column2 datatype,
  ...,
  PRIMARY KEY (column1)
);

用途:

  • 唯一标识: 主键的主要用途是唯一标识表中的每一行。这是数据完整性的关键部分。同时可以通过主键快速找到一行数据。
  • 关联表: 在数据库中,主键也用来与其他表的外键建立关系,进行数据关联查询。

举例: 假设每本书在图书馆中都有一个独一无二的编号,就像每本书的身份证。这个编号是书籍的主键。无论图书馆有多少本相同的书,每本书的编号都是唯一的,确保你能准确找到特定的一本书。在数据库中,主键的作用就是这样,它保证每条记录都可以被唯一标识和快速找到。

2.2 外键

定义:外键(Foreign Key)是一个表中的一列或多列,用于引用另一个表的主键,建立表之间的关联关系。外键的值必须在被引用的表的主键中存在,或者为空。

定义外键的 SQL 语法如下:

CREATE TABLE table_name (
  column1 datatype,
  column2 datatype,
  ...,
  FOREIGN KEY (column1) REFERENCES other_table (other_column)
);

用途: 外键约束确保对应的主键数据存在,防止出现悬挂数据。 在一些传统项目中用的比较多,最近几年流行在应用层进行外键关联以及数据约束,所以慢慢的外键就会用的越来越少。

举例: 想象一下,学校的图书馆一般都会刷校园卡去进入图书馆。每当学生借书时,借阅记录里不仅会记录书籍的编号,还会记录学生卡卡号。这个学生卡卡号就类似于数据库中的外键,它连接了学生信息表和借阅记录表。通过外键,你可以轻松查到哪个学生借了哪本书,确保借阅记录的准确性和完整性。

2.3 索引

**定义 **:索引 (Index) 是一种数据库对象,用于提高表中数据的查询速度。索引可以在表的一列或多列上创建,提供了一种快速访问数据的方法。PG 支持多种类型的索引 , 如 B-tree、Hash、GiST 等。

创建索引的 SQL 语法如下:

CREATE INDEX index_name ON table_name (column1, column2, ...);

用途:

  • 提高查询效率:索引使数据库查询操作更快,尤其是在大数据量的表中。
  • 排序和分组优化:索引还可以加快排序和分组查询的处理速度。

举例: 如果图书馆的书籍是随机摆放的,找一本特定的书可能需要花费大量时间。图书馆通常会根据书名、作者或类别等来对书籍进行排序和编排,这样你就能快速找到你需要的书。在数据库中,索引的作用就像图书馆的排列顺序,它帮助你快速通过特定的信息(如作者名、书名)找到数据记录,显著提升查询效率。

3. 参考链接