写点什么

SQLite 简介

作者:网易云信
  • 2022 年 3 月 25 日
  • 本文字数:4732 字

    阅读完需:约 16 分钟

SQLite简介

常见的关系型数据库有 SQLite,MySQL,SQL Server 等,通常学习关系型数据库时不会使用 SQLite,但是 SQLite 是世界上使用最广泛的数据库引擎。SQLite 内置于所有手机和大多数计算机中,并捆绑在人们每天使用的无数其他应用程序中。SQLite 是一个由 C 语音开发的嵌入式库,具有小型、 快速、 自包含、 高可靠、 功能齐全等特点。


文章以3.32.2版本为例讲述 SQLite 的一些基本知识

SQLite 常用命令和示例

在命令行中使用 SQLite 命令,需要先执行sqlite3命令,进入SQLite提示符

创建或打开数据库

有两种方法可以创建或打开数据库,一个是在sqlite3命令后面加上数据库路径,另一个是使用点命令.open

sqlite3 /.../xxx.db 法

通过执行这个命令进入SQLite提示符时,如果数据库文件已经存在,则直接打开对应数据库,否则不会立即在对应路径创建 xxx.db 文件。要等到执行了添加数据表,视图等数据库对象的命令之后。


  • 示例

  • 先执行如下命令,此时没有创建出comms_ease.db文件


sqlite3 comms_ease.db
复制代码


​ 再执行如下命令创建一张表,在当前目录出现comms_ease.db文件

.open /.../xxx.db 法

使用.open是一个点命令,使用它需要先执行sqlite3命令进入SQLite提示符.open命令的使用方式也是在命令后面追加数据库路径,不过和sqlite3 /.../xxx.db法不同的是,执行.open命令后,数据库文件会被直接创建出来,不需要再创建数据库对象。

创建表

SQLite 的创建语句为CREATE TABLE,完整的创建表语句内容丰富,除了创建普通表外,还能具备判断表是否已经存在,创建临时表等能力。常见的创建普通表的句式为。


CREATE TABLE 表名 (        列1名称 列类型 以空格隔开的一个或多个列约束,         列2名称 列类型 以空格隔开的一个或多个列约束,        ...);
复制代码


默认情况下,一张表的最大列数为 2000,每一行能存下的最大字节数为十亿,能满足绝大多数的需求,创建普通表的示例如下


CREATE TABLE table_comms_ease (    id INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT,    value VARCHAR);
复制代码


例子中,创建了一个名为table_comms_ease的数据表,包含两列,第一列是id,类型是整形,不能为空,而且是表的主键,并可以自动生成; 第二列是value,类型为字符串


在表名已经存在的情况下,调用CREATE TABLE 表名语句会报错,要避免,可以使用CREATE TABLE IF NOT EXISTS 表名语句。如果不存在,则创建表,如果存在,则什么都不做。示例如下


CREATE TABLE IF NOT EXISTS table_comms_ease (    id INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT,    value VARCHAR);
复制代码


如果希望临时存储一些数据,而且只对当前连接有效,可以试试临时表。临时表的创建语句为CREATE TEMP TABLE。临时表只对当前数据库连接有效,重新建立连接或者同时存在的其他连接都无法访问到。示例如下


CREATE TEMP TABLE temp_table_comms_ease (    id INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT,    value VARCHAR);
复制代码

其它常用点命令

点命令是SQLite数据库独特的命令形式,它们通常比较简单,而且不需要以分号结尾,常见的点命令如下表所示


向表内添加一行,即为每一列构建一个值,并填入新的一行中。添加行的命令是INSERT,添加方式有三种,一种是指定值添加;二是添加 Select 语句的结果;三是默认添加。


  1. 指定值添加就是指定部分或者所有列的值,剩下列使用默认值的方式,对于没有通过DEFAULTEAUTOINCREMENT等方式声明默认值的列,如果没有指定NOT NULL则填入NULL,否则报错。至少需要指定一列的值,如需全部填写默认值,可以使用默认添加方式。需要注意的是,值的顺序要和列的顺序保持一致。示例如下:


    INSERT INTO table_comms_ease (value) VALUES ('value of 1');    INSERT INTO table_comms_ease (value, id) VALUES ('value of 2', 2);
复制代码


如果需要指定填入所有列的值,也可以不把列名列举出来,将值按创建表时各个列的顺序列举出来即可。示例如下:
复制代码


    INSERT INTO table_comms_ease VALUES (3, 'value of 3');
复制代码


  1. 通过添加加 Select 语句的结果添加一行的格式为INSERT INTO 表名 SELECT ...通过此方法添加一行时,默认值不会被自动填充,SELECT 语句查出的数据量必须和表的列数一致。假设已经存在表operator包含列keydescription而且某一行的key为'.backup',description备份数据库到文件,给出示例如下:


    INSERT INTO table_comms_ease SELECT  4, description FROM operator WHERE key IS '.backup';
复制代码


  1. 默认添加的格式为INSERT INTO 表名 DEFAULT VALUES;为每一列都填入默认值,如果没有特别声明默认值,则填入 NULL。示例如下:


    INSERT INTO table_comms_ease DEFAULT VALUES;
复制代码


通过创建表章节的示例语句创建出数据表,再依次调用上述示例语句,则数据表内会出现 5 行数据,如下


删除表内的一行,命令是DELETE,常用格式为


DELETE FROM 表名 WHERE 过滤语句
复制代码


删除命令本身比较简单,指定表名和删除条件即可删除一列,如下示例表示如果value列中的值有value of开头,则删除。


DELETE FROM table_comms_ease WHERE value LIKE 'value of %';
复制代码


如上命令操作后,table_comms_ease表还剩的数据为


修改表内数据的命令为UPDATE,其常用格式为


UPDATE 表名 SET 一个或多个列的赋值 WHERE 过滤语句
复制代码


修改多列内容时可以采用先写出列名,再按顺序赋值的方式,也可以采用一列一列修改的方式。如果要更新 id 为 4 的所在行的值,设置id123valuenew value,两种修改方式分别如下


UPDATE table_comms_ease SET (id, value)= (123, 'new value') WHERE id = 4;
复制代码


或者


UPDATE table_comms_ease SET id=123, value='new value' WHERE id = 4;
复制代码


修改后,table_comms_ease表中的数据为



修改单列的方法和修改多列的方法相似,比如将id为 5 这一行的value也修改为new value,可以如下操作


UPDATE table_comms_ease SET (value)=('new value') WHERE id = 5;
复制代码


或者


UPDATE table_comms_ease SET value='new value' WHERE id = 5;
复制代码


修改后,table_comms_ease表中的数据为


查询语句的命令是SELECT,它不会修改数据库,结果的行数在自然数范围内,每一行代表一个查询结果。SELECT命令的常用格式为


SELECT 去重策略 列名列表 FROM 表名或者子查询语句 WHERE 过滤语句 ORDER BY 排序策略 LIMIT 数量限制
复制代码


查询语句中可用的配置比较多,但是大都不是必须的。查询table_comms_ease表的所有内容只需要如下命令即可


SELECT * FROM table_comms_ease;
复制代码


上面命令中的*表示所有列,命令相当于


SELECT id,value FROM table_comms_ease;
复制代码


结果为



另外,可以通过VALUES语句构建一个查询结果,结果的列名为column1, column2, column3等等。比如


VALUES (1,2,3),('a','b','c');
复制代码


的结果为


去重策略

去重策略有两种,一种是默认策略ALL,代表不去重;另一种是DISTINCT,代表去重。table_comms_ease表中value列的值相同,使用ALLDISTINCT分别查询 value 列时,命令和结果如下:


ALL 命令


SELECT ALL * FROM table_comms_ease;
复制代码


结果为



DISTINCT 命令


SELECT DISTINCT value FROM table_comms_ease;
复制代码


结果为



可以看出在有重复结果时,ALL 策略会保留所有结果,而 DISTINCT 策略只保留其中一个

表名或者子查询语句

查询语句的FROM关键字后面可以跟表名或者子查询语句,用于限制查询范围。当填写表名时,可以填写多个表名,用逗号或者连接运算符分隔。当填写查询语句时,可以视为先查询出一张表,再从此表中查询出数据。


假设还有一张表table_comms_ease_1,列信息和table_comms_ease表相同,值为



则此字段填写table_comms_ease,table_comms_ease_1时得到如下命令


SELECT * FROM table_comms_ease, table_comms_ease_1;
复制代码


结果为



当此字段填写两个子查询语句,如一个是 id 为 5,另一个是 id 为 123 时,则得到如下命令


SELECT * FROM (SELECT * FROM table_comms_ease WHERE iD=5), (SELECT * FROM table_comms_ease WHERE iD=123);
复制代码


结果为



将子查询语句的结果视为一张表,则可以统一对两种填写格式的理解。另外查询命令也支持混合填写表名和查询语句。

排序条件

排序条件决定了结果的排列顺序,常用格式如下


ORDER BY 列名 COLLATE 比较方式 排序方式 NULL值的排序方式
复制代码


比较方式有三种,分别为BINARY, NOCASERTRIM


  • BINARY:使用标准 C 库中的 memcmp()函数逐字节比较

  • NOCASE:先把 ASC II 码中的大写字母转为小写字母,再按照 BINARY 方式比较

  • RTRIM:去掉末尾空格后按照 BINARY 方式比较


通过下面命令为表table_comms_ease添加几条数据,


INSERT INTO table_comms_ease VALUES (6, 'A'), (7, 'new value '), (8, 'Z');
复制代码


则表中的数据变为



注意:id 为 7 的一行对应的 value 的末尾有一个空格


如下示例展示了三种不同比较方式的区别


BINARY 命令


SELECT * FROM table_comms_ease ORDER BY table_comms_ease.value COLLATE BINARY;
复制代码


结果:



NOCASE 命令


SELECT * FROM table_comms_ease ORDER BY table_comms_ease.value COLLATE NOCASE;
复制代码


结果:



RTRIM 命令


SELECT * FROM table_comms_ease ORDER BY table_comms_ease.value COLLATE RTRIM;
复制代码


结果:


数量限制

数量限制语句可以限制查询结果的行数,常用格式如下


LIMIT 数量 OFFET 偏移量
复制代码


设数量为 n,偏移量为 o,则上面格式的意义是从第o+1条开始,取最多n条数据,如果没有符合条件的数据,则结果为空。


限制数量为 3,得到如下表达式


SELECT * FROM table_comms_ease LIMIT 3;
复制代码


结果为



由于表的总行数是 5,所以如果限制数量≥5,则会查出整张表。


如果限制数量为 3,同时指定偏移量为 1,得到如下表达式


SELECT * FROM table_comms_ease LIMIT 3 OFFSET 1;
复制代码


结果过滤掉第一条数据(5, newvalue),并向后取 3 条,得到



如果限制数量为 3,同时指定偏移量为 3,得到如下表达式


SELECT * FROM table_comms_ease LIMIT 3 OFFSET 3;
复制代码


结果过滤掉前三条数据,并向后取 3 条,但是后面只有 2 条,所以得到



如果偏移量≥5,则什么都查不到

SQLite常见限制

数据库中的B树

B 树与 B+树简介

B 树是一种平衡多路查找树,每个结点包含三个部分:键,值,指向子结点的指针。假设一个 B 树结点中有n个键,则它同时有n个值。如果这是一个叶子结点,则它没有指向子结点的指针,否则有n+1个指向子结点的指针。下图为n==2时的结点情况。



图中键1键2两个值需要满足键1<键2值1值2分别与键1键2对应;三个指向子结点的指针,分别指向具有不同范围的的子结点。子结点1中的都小于键1子结点2中的都大于键1,且小于键2子结点3中的都大于键2。如下图提供了一个 3 路 B 树的示例。


上图中每个结点有三排,第一排是;第二排是;第三排是指向子结点的指针。根节点有50100两个,因此它的左子树中结点的都小于50;中子树中结点的都大于50且小于100;右子树中结点的都大于100


B+树和 B 树类似,但是 B+树的内部结点中只有指向子结点的指针,而叶子结点具有指向下一组值的指针,即只在叶子结点上存储数据。因此父结点中的键还会再出现在子结点上。而且 B+树的叶子结点的指向下一组值的指针,将所有都串成了一个链表。由于内部结点不需要存储,B+树可以存储更多的。下图用 5 路 B+树存储了上面 3 路 B 树的内容。


B树页

数据库文件由一页或多页组成。同一个数据库中,每页的大小相同,都是 在 512 和 65536 之间,并且为 2 的整数次幂。数据库的页分为锁定字节(lock-byte)页、freelist 页、B 树页、负载溢出页和指针映射页。


B 树算法为 SQLite 提供了键值存储模式,而且保证了键的有序性和唯一性。SQLite 数据库中 B 树的结点就是一个页面,所以指向的子结点的指针实际上是对应页面的页码。SQLite 数据库使用了两种 B 树变体,在叶子节点存储数据的表B树和不存储数据的索引B树。一颗完整的树只能是完全的表B树或者完全的索引B树

表 B 树和索引 B 树

表 B 树类似 B+树,只将值存放在叶子结点中;索引 B 树是一颗没有值的树,键就是数据本身,因此索引 B 树其实类似于 B 树。下表列出了它们之间的一些差异。



发布于: 刚刚阅读数: 2
用户头像

网易云信

关注

还未添加个人签名 2021.03.12 加入

来自网易云信,专注音视频技术,全面负责网易实时音视频、互动白板、直播、互动直播、传输网等项目的架构设计与研发,对音视频、高性能服务器以及网络通讯等领域均有多年的工作与项目经验 。

评论

发布
暂无评论
SQLite简介_sqlite_网易云信_InfoQ写作平台