Python 数据持久化 - Sqlite3 模块

CSV、JSON、XML 等文件的**一个主要缺点**是它们对于随机访问和事务处理不是很有用，因为它们本质上是无结构的。因此，修改内容变得非常困难。

这些平面文件不适合客户端-服务器环境，因为它们缺乏异步处理能力。使用无结构数据文件会导致数据冗余和不一致。

这些问题可以通过使用关系数据库来克服。数据库是组织好的数据集合，用于消除冗余和不一致，并维护数据完整性。关系数据库模型非常流行。

其基本概念是将数据排列在实体表（称为关系）中。实体表结构提供一个属性，其值对于每一行都是唯一的。此类属性称为**“主键”**。

当一个表的主键出现在其他表的结构中时，它被称为**“外键”**，这构成了这两个表之间关系的基础。基于此模型，目前有许多流行的关系数据库管理系统（RDBMS）产品可用 -

GadFly
mSQL
MySQL
PostgreSQL
Microsoft SQL Server 2000
Informix
Interbase
Oracle
Sybase
SQLite

SQLite 是一种轻量级关系数据库，广泛用于各种应用程序。它是一个自包含的、无服务器的、零配置的事务性 SQL 数据库引擎。整个数据库是一个单个文件，可以放置在文件系统中的任何位置。它是一个开源软件，占用空间非常小，并且零配置。它广泛用于嵌入式设备、物联网和移动应用程序。

所有关系数据库都使用 SQL 来处理表中的数据。但是，早些时候，每个数据库都通过特定于数据库类型的 Python 模块连接到 Python 应用程序。

因此，它们之间缺乏兼容性。如果用户想要更改到不同的数据库产品，将被证明是困难的。此兼容性问题通过提出“Python 增强提案 (PEP 248)”来解决，该提案建议对关系数据库使用一致的接口，称为 DB-API。最新的建议称为**DB-API** 版本 2.0。（PEP 249）

Python 的标准库包含 sqlite3 模块，这是一个符合 DB-API 的模块，用于通过 Python 程序处理 SQLite 数据库。本章介绍 Python 与 SQLite 数据库的连接。

如前所述，Python 以 sqlite3 模块的形式对 SQLite 数据库提供了内置支持。对于其他数据库，需要使用 pip 实用程序安装相应的符合 DB-API 的 Python 模块。例如，要使用 MySQL 数据库，我们需要安装 PyMySQL 模块。

pip install pymysql

DB-API 中建议以下步骤 -

使用**connect()** 函数建立与数据库的连接并获取连接对象。
调用连接对象的**cursor()** 方法获取游标对象。
形成由要执行的 SQL 语句组成的查询字符串。
通过调用**execute()** 方法执行所需的查询。
关闭连接。

import sqlite3
db=sqlite3.connect('test.db')

这里，db 是表示 test.db 的连接对象。请注意，如果数据库尚不存在，则会创建它。连接对象 db 具有以下方法 -

序号	方法和描述
1	cursor() 返回使用此连接的游标对象。
2	commit() 显式地将任何挂起的交易提交到数据库。
3	rollback() 此可选方法导致事务回滚到起始点。
4	close() 永久关闭与数据库的连接。

游标充当给定 SQL 查询的句柄，允许检索结果的一行或多行。从连接中获取游标对象以使用以下语句执行 SQL 查询 -

cur=db.cursor()

游标对象定义了以下方法 -

序号	方法和描述
1	execute() 执行字符串参数中的 SQL 查询。
2	executemany() 使用元组列表中的一组参数执行 SQL 查询。
3	fetchone() 从查询结果集中获取下一行。
4	fetchall() 从查询结果集中获取所有剩余的行。
5	callproc() 调用存储过程。
6	close() 关闭游标对象。

以下代码在 test.db 中创建一个表：-

import sqlite3
db=sqlite3.connect('test.db')
cur =db.cursor()
cur.execute('''CREATE TABLE student (
StudentID INTEGER PRIMARY KEY AUTOINCREMENT,
name TEXT (20) NOT NULL,
age INTEGER,
marks REAL);''')
print ('table created successfully')
db.close()

数据库中所需的数据完整性通过连接对象的**commit()** 和**rollback()** 方法实现。SQL 查询字符串可能包含不正确的 SQL 查询，这可能会引发异常，应正确处理。为此，execute() 语句放置在 try 块中，如果成功，则使用 commit() 方法永久保存结果。如果查询失败，则使用 rollback() 方法撤消事务。

以下代码在 test.db 中的 student 表上执行 INSERT 查询。

import sqlite3
db=sqlite3.connect('test.db')
qry="insert into student (name, age, marks) values('Abbas', 20, 80);"
try:
   cur=db.cursor()
   cur.execute(qry)
   db.commit()
print ("record added successfully")
except:
   print ("error in query")
   db.rollback()
db.close()

如果希望 INSERT 查询的 values 子句中的数据由用户输入动态提供，请使用 Python DB-API 中推荐的参数替换。? 字符用作查询字符串中的占位符，并以元组的形式在 execute() 方法中提供值。以下示例使用参数替换方法插入记录。姓名、年龄和分数作为输入。

import sqlite3
db=sqlite3.connect('test.db')
nm=input('enter name')
a=int(input('enter age'))
m=int(input('enter marks'))
qry="insert into student (name, age, marks) values(?,?,?);"
try:
   cur=db.cursor()
   cur.execute(qry, (nm,a,m))
   db.commit()
   print ("one record added successfully")
except:
   print("error in operation")
   db.rollback()
db.close()

sqlite3 模块定义了**executemany()** 方法，该方法能够一次添加多条记录。要添加的数据应以元组列表的形式给出，每个元组包含一条记录。列表对象是 executemany() 方法的参数，以及查询字符串。但是，某些其他模块不支持 executemany() 方法。

**UPDATE** 查询通常包含由 WHERE 子句指定的逻辑表达式。execute() 方法中的查询字符串应包含 UPDATE 查询语法。要将“Anil”的“age”值更新为 23，请将字符串定义如下

qry="update student set age=23 where name='Anil';"

为了使更新过程更具动态性，我们使用上面描述的参数替换方法。

import sqlite3
db=sqlite3.connect('test.db')
nm=input(‘enter name’)
a=int(input(‘enter age’))
qry="update student set age=? where name=?;"
try:
   cur=db.cursor()
   cur.execute(qry, (a, nm))
   db.commit()
   print("record updated successfully")
except:
   print("error in query")
   db.rollback()
db.close()

类似地，DELETE 操作通过调用 execute() 方法来执行，该方法带有一个包含 SQL 的 DELETE 查询语法的字符串。顺便说一句，**DELETE** 查询也通常包含**WHERE** 子句。

import sqlite3
db=sqlite3.connect('test.db')
nm=input(‘enter name’)
qry="DELETE from student where name=?;"
try:
   cur=db.cursor()
   cur.execute(qry, (nm,))
   db.commit()
   print("record deleted successfully")
except:
   print("error in operation")
   db.rollback()
db.close()

数据库表上的重要操作之一是从中检索记录。SQL 提供**SELECT** 查询来实现此目的。当将包含 SELECT 查询语法的字符串传递给 execute() 方法时，会返回一个结果集对象。游标对象有两个重要方法，可以使用它们从结果集中检索一条或多条记录。

fetchone()

从结果集中获取下一条可用记录。它是一个元组，包含已获取记录的每一列的值。

fetchall()

以元组列表的形式获取所有剩余的记录。每个元组对应一条记录，并包含表中每一列的值。

以下示例列出 student 表中的所有记录

import sqlite3
db=sqlite3.connect('test.db')
37
sql="SELECT * from student;"
cur=db.cursor()
cur.execute(sql)
while True:
   record=cur.fetchone()
   if record==None:
      break
   print (record)
db.close()

如果您计划使用 MySQL 数据库而不是 SQLite 数据库，则需要如上所述安装**PyMySQL** 模块。数据库连接过程中的所有步骤都相同，因为 MySQL 数据库安装在服务器上，connect() 函数需要 URL 和登录凭据。

import pymysql
con=pymysql.connect('localhost', 'root', '***')

唯一可能与 SQLite 不同的方面是 MySQL 特定的数据类型。类似地，通过安装 pyodbc 模块，任何与 ODBC 兼容的数据库都可以与 Python 一起使用。

打印页面