- Python 基础
- Python - 首页
- Python - 概述
- Python - 历史
- Python - 特性
- Python vs C++
- Python - Hello World 程序
- Python - 应用领域
- Python - 解释器
- Python - 环境搭建
- Python - 虚拟环境
- Python - 基本语法
- Python - 变量
- Python - 数据类型
- Python - 类型转换
- Python - Unicode 系统
- Python - 字面量
- Python - 运算符
- Python - 算术运算符
- Python - 比较运算符
- Python - 赋值运算符
- Python - 逻辑运算符
- Python - 位运算符
- Python - 成员运算符
- Python - 身份运算符
- Python - 运算符优先级
- Python - 注释
- Python - 用户输入
- Python - 数字
- Python - 布尔值
- Python 控制语句
- Python - 控制流
- Python - 决策
- Python - if 语句
- Python - if else
- Python - 嵌套 if
- Python - Match-Case 语句
- Python - 循环
- Python - for 循环
- Python - for-else 循环
- Python - while 循环
- Python - break 语句
- Python - continue 语句
- Python - pass 语句
- Python - 嵌套循环
- Python 函数与模块
- Python - 函数
- Python - 默认参数
- Python - 关键字参数
- Python - 仅关键字参数
- Python - 位置参数
- Python - 仅位置参数
- Python - 可变参数
- Python - 变量作用域
- Python - 函数注解
- Python - 模块
- Python - 内置函数
- Python 字符串
- Python - 字符串
- Python - 字符串切片
- Python - 修改字符串
- Python - 字符串连接
- Python - 字符串格式化
- Python - 转义字符
- Python - 字符串方法
- Python - 字符串练习
- Python 列表
- Python - 列表
- Python - 访问列表元素
- Python - 修改列表元素
- Python - 添加列表元素
- Python - 删除列表元素
- Python - 遍历列表
- Python - 列表推导式
- Python - 排序列表
- Python - 复制列表
- Python - 合并列表
- Python - 列表方法
- Python - 列表练习
- Python 元组
- Python - 元组
- Python - 访问元组元素
- Python - 更新元组
- Python - 解包元组
- Python - 遍历元组
- Python - 合并元组
- Python - 元组方法
- Python - 元组练习
- Python 集合
- Python - 集合
- Python - 访问集合元素
- Python - 添加集合元素
- Python - 删除集合元素
- Python - 遍历集合
- Python - 合并集合
- Python - 复制集合
- Python - 集合运算符
- Python - 集合方法
- Python - 集合练习
- Python 字典
- Python - 字典
- Python - 访问字典元素
- Python - 修改字典元素
- Python - 添加字典元素
- Python - 删除字典元素
- Python - 字典视图对象
- Python - 遍历字典
- Python - 复制字典
- Python - 嵌套字典
- Python - 字典方法
- Python - 字典练习
- Python 数组
- Python - 数组
- Python - 访问数组元素
- Python - 添加数组元素
- Python - 删除数组元素
- Python - 遍历数组
- Python - 复制数组
- Python - 反转数组
- Python - 排序数组
- Python - 合并数组
- Python - 数组方法
- Python - 数组练习
- Python 文件处理
- Python - 文件处理
- Python - 写入文件
- Python - 读取文件
- Python - 重命名和删除文件
- Python - 目录
- Python - 文件方法
- Python - OS 文件/目录方法
- Python - OS 路径方法
- 面向对象编程
- Python - OOPs 概念
- Python - 类与对象
- Python - 类属性
- Python - 类方法
- Python - 静态方法
- Python - 构造函数
- Python - 访问修饰符
- Python - 继承
- Python - 多态
- Python - 方法重写
- Python - 方法重载
- Python - 动态绑定
- Python - 动态类型
- Python - 抽象
- Python - 封装
- Python - 接口
- Python - 包
- Python - 内部类
- Python - 匿名类和对象
- Python - 单例类
- Python - 包装类
- Python - 枚举
- Python - 反射
- Python 错误与异常
- Python - 语法错误
- Python - 异常
- Python - try-except 代码块
- Python - try-finally 代码块
- Python - 抛出异常
- Python - 异常链
- Python - 嵌套 try 代码块
- Python - 用户自定义异常
- Python - 日志记录
- Python - 断言
- Python - 内置异常
- Python 多线程
- Python - 多线程
- Python - 线程生命周期
- Python - 创建线程
- Python - 启动线程
- Python - 线程连接
- Python - 线程命名
- Python - 线程调度
- Python - 线程池
- Python - 主线程
- Python - 线程优先级
- Python - 守护线程
- Python - 线程同步
- Python 同步
- Python - 线程间通信
- Python - 线程死锁
- Python - 中断线程
- Python 网络编程
- Python - 网络编程
- Python - 套接字编程
- Python - URL 处理
- Python - 泛型
- Python 库
- NumPy 教程
- Pandas 教程
- SciPy 教程
- Matplotlib 教程
- Django 教程
- OpenCV 教程
- Python 杂项
- Python - 日期与时间
- Python - 数学
- Python - 迭代器
- Python - 生成器
- Python - 闭包
- Python - 装饰器
- Python - 递归
- Python - 正则表达式
- Python - PIP
- Python - 数据库访问
- Python - 弱引用
- Python - 序列化
- Python - 模板
- Python - 输出格式化
- Python - 性能测量
- Python - 数据压缩
- Python - CGI 编程
- Python - XML 处理
- Python - GUI 编程
- Python - 命令行参数
- Python - 文档字符串
- Python - JSON
- Python - 发送邮件
- Python - 扩展进阶
- Python - 工具/实用程序
- Python - GUI
- Python 高级概念
- Python - 抽象基类
- Python - 自定义异常
- Python - 高阶函数
- Python - 对象内部
- Python - 内存管理
- Python - 元类
- Python - 使用元类进行元编程
- Python - 模拟和存根
- Python - 猴子补丁
- Python - 信号处理
- Python - 类型提示
- Python - 自动化教程
- Python - Humanize 包
- Python - 上下文管理器
- Python - 协程
- Python - 描述符
- Python - 诊断和修复内存泄漏
- Python - 不可变数据结构
- Python 有用资源
- Python - 问答
- Python - 在线测验
- Python - 快速指南
- Python - 参考
- Python - 速查表
- Python - 项目
- Python - 有用资源
- Python - 讨论
- Python 编译器
- NumPy 编译器
- Matplotlib 编译器
- SciPy 编译器
Python - 扩展进阶
使用任何编译语言(如 C、C++ 或 Java)编写的任何代码都可以集成或导入到另一个 Python 脚本中。此代码被视为“扩展”。
Python 扩展模块只不过是一个普通的 C 库。在 Unix 机器上,这些库通常以.so(共享对象)结尾。在 Windows 机器上,您通常会看到.dll(动态链接库)。
编写扩展的先决条件
要开始编写扩展,您将需要 Python 头文件。
在 Unix 机器上,这通常需要安装特定于开发人员的软件包。
Windows 用户在使用二进制 Python 安装程序时,会将这些头文件作为软件包的一部分获得。
此外,假设您精通 C 或 C++,可以使用 C 编程编写任何 Python 扩展。
首先了解 Python 扩展
要首次了解 Python 扩展模块,您需要将代码分成四个部分:
头文件Python.h。
您希望公开为模块接口的 C 函数。
一个表,将 Python 开发人员看到的函数名称映射到扩展模块内的 C 函数。
一个初始化函数。
头文件 Python.h
您需要在 C 源文件中包含 Python.h 头文件,这使您可以访问用于将模块挂接到解释器的内部 Python API。
确保在任何其他可能需要的头文件之前包含 Python.h。您需要在包含之后跟着您想从 Python 中调用的函数。
C 函数
C 函数实现的签名始终采用以下三种形式之一:
static PyObject *MyFunction(PyObject *self, PyObject *args); static PyObject *MyFunctionWithKeywords(PyObject *self, PyObject *args, PyObject *kw); static PyObject *MyFunctionWithNoArgs(PyObject *self);
前面每个声明都返回一个 Python 对象。Python 中没有像 C 中那样的 void 函数。如果您不希望函数返回值,则返回 Python 的None值的 C 等价物。Python 头文件定义了一个宏 Py_RETURN_NONE,它为我们执行此操作。
C 函数的名称可以是您喜欢的任何名称,因为它们永远不会在扩展模块之外可见。它们被定义为静态函数。
您的 C 函数通常通过组合 Python 模块和函数名称来命名,如下所示:
static PyObject *module_func(PyObject *self, PyObject *args) { /* Do your stuff here. */ Py_RETURN_NONE; }
这是一个名为 func 的 Python 函数,位于模块 module 中。您将把指向 C 函数的指针放入模块的方法表中,该方法表通常位于源代码的下一部分。
方法映射表
此方法表是 PyMethodDef 结构的简单数组。该结构看起来像这样:
struct PyMethodDef { char *ml_name; PyCFunction ml_meth; int ml_flags; char *ml_doc; };
以下是此结构成员的描述:
ml_name - 这是函数的名称,当 Python 解释器在 Python 程序中使用时,它会显示该名称。
ml_meth - 这是具有任何一个签名的函数的地址,如上一节所述。
ml_flags - 这告诉解释器 ml_meth 使用哪三个签名。
此标志通常的值为 METH_VARARGS。
如果要允许关键字参数进入函数,则可以将此标志与 METH_KEYWORDS 进行按位或运算。
这也可能具有 METH_NOARGS 的值,表示您不想接受任何参数。
mml_doc − 这是函数的文档字符串,如果您不想编写,可以为 NULL。
此表需要以哨兵结束,哨兵由相应成员的 NULL 和 0 值组成。
示例
对于上面定义的函数,我们有以下方法映射表:
static PyMethodDef module_methods[] = { { "func", (PyCFunction)module_func, METH_NOARGS, NULL }, { NULL, NULL, 0, NULL } };
初始化函数
扩展模块的最后一部分是初始化函数。当加载模块时,Python 解释器会调用此函数。要求函数名为 initModule,其中 Module 是模块的名称。
初始化函数需要从您将要构建的库中导出。Python 头文件定义 PyMODINIT_FUNC 以包含适当的咒语,以便在我们要编译的特定环境中发生这种情况。您所要做的就是在定义函数时使用它。
您的 C 初始化函数通常具有以下总体结构:
PyMODINIT_FUNC initModule() { Py_InitModule3(func, module_methods, "docstring..."); }
以下是 Py_InitModule3 函数的描述:
func − 这是要导出的函数。
module_methods − 这是上面定义的映射表名称。
docstring − 这是您想要在扩展中提供的注释。
将所有这些放在一起,看起来如下所示:
#include <Python.h> static PyObject *module_func(PyObject *self, PyObject *args) { /* Do your stuff here. */ Py_RETURN_NONE; } static PyMethodDef module_methods[] = { { "func", (PyCFunction)module_func, METH_NOARGS, NULL }, { NULL, NULL, 0, NULL } }; PyMODINIT_FUNC initModule() { Py_InitModule3(func, module_methods, "docstring..."); }
示例
一个简单的示例,它利用了上述所有概念:
#include <Python.h> static PyObject* helloworld(PyObject* self) { return Py_BuildValue("s", "Hello, Python extensions!!"); } static char helloworld_docs[] = "helloworld( ): Any message you want to put here!!\n"; static PyMethodDef helloworld_funcs[] = { {"helloworld", (PyCFunction)helloworld, METH_NOARGS, helloworld_docs}, {NULL} }; void inithelloworld(void) { Py_InitModule3("helloworld", helloworld_funcs, "Extension module example!"); }
这里 Py_BuildValue 函数用于构建 Python 值。将上述代码保存在 hello.c 文件中。我们将了解如何编译和安装此模块以便从 Python 脚本中调用。
构建和安装扩展
distutils 包使以标准方式分发 Python 模块(纯 Python 模块和扩展模块)变得非常容易。模块以源代码形式分发,通过通常称为 setup.pyas 的安装脚本进行构建和安装。
对于上述模块,您需要准备以下 setup.py 脚本:
from distutils.core import setup, Extension setup(name='helloworld', version='1.0', \ ext_modules=[Extension('helloworld', ['hello.c'])])
现在,使用以下命令,它将执行所有必要的编译和链接步骤,使用正确的编译器和链接器命令和标志,并将生成的动态库复制到适当的目录中:
$ python setup.py install
在基于 Unix 的系统上,您很可能需要以 root 身份运行此命令才能有权写入 site-packages 目录。这在 Windows 上通常不是问题。
导入扩展
安装扩展后,您将能够在 Python 脚本中导入和调用该扩展,如下所示:
import helloworld print helloworld.helloworld()
这将产生以下输出:
Hello, Python extensions!!
传递函数参数
由于您很可能希望定义接受参数的函数,因此您可以为 C 函数使用其他签名之一。例如,以下接受一些参数的函数将这样定义:
static PyObject *module_func(PyObject *self, PyObject *args) { /* Parse args and do something interesting here. */ Py_RETURN_NONE; }
包含新函数条目的方法表将如下所示:
static PyMethodDef module_methods[] = { { "func", (PyCFunction)module_func, METH_NOARGS, NULL }, { "func", module_func, METH_VARARGS, NULL }, { NULL, NULL, 0, NULL } };
您可以使用 API PyArg_ParseTuple 函数从传递到 C 函数的一个 PyObject 指针中提取参数。
PyArg_ParseTuple 的第一个参数是 args 参数。这是您将要解析的对象。第二个参数是格式字符串,描述了您期望参数出现的格式。每个参数在格式字符串中由一个或多个字符表示,如下所示。
static PyObject *module_func(PyObject *self, PyObject *args) { int i; double d; char *s; if (!PyArg_ParseTuple(args, "ids", &i, &d, &s)) { return NULL; } /* Do something interesting here. */ Py_RETURN_NONE; }
编译模块的新版本并导入它使您可以使用任意数量的任意类型的参数来调用新函数:
module.func(1, s="three", d=2.0) module.func(i=1, d=2.0, s="three") module.func(s="three", d=2.0, i=1)
您可能还可以想出更多变化。
PyArg_ParseTuple 函数
re 是PyArg_ParseTuple 函数的标准签名:
int PyArg_ParseTuple(PyObject* tuple,char* format,...)
此函数对于错误返回 0,对于成功返回非 0 值。Tuple 是作为 C 函数第二个参数的 PyObject*。这里的 format 是一个 C 字符串,描述了必选和可选参数。
以下是PyArg_ParseTuple 函数的格式代码列表:
代码 | C 类型 | 含义 |
---|---|---|
c | char | 长度为 1 的 Python 字符串变为 C char。 |
d | double | Python float 变为 C double。 |
f | float | Python float 变为 C float。 |
i | int | Python int 变为 C int。 |
l | long | Python int 变为 C long。 |
L | long long | Python int 变为 C long long。 |
O | PyObject* | 获取对 Python 参数的非 NULL 借用引用。 |
S | char* | 没有嵌入空字符的 Python 字符串到 C char*。 |
s# | char*+int | 任何 Python 字符串到 C 地址和长度。 |
t# | char*+int | 只读单段缓冲区到 C 地址和长度。 |
u | Py_UNICODE* | 没有嵌入空字符的 Python Unicode 到 C。 |
u# | Py_UNICODE*+int | 任何 Python Unicode C 地址和长度。 |
w# | char*+int | 读/写单段缓冲区到 C 地址和长度。 |
z | char* | 类似于 s,也接受 None(将 C char* 设置为 NULL)。 |
z# | char*+int | 类似于 s#,也接受 None(将 C char* 设置为 NULL)。 |
(...) | 根据 ... | Python 序列被视为每个项目一个参数。 |
| | 以下参数是可选的。 | |
: | 格式结束,后跟错误消息的函数名称。 | |
; | 格式结束,后跟完整的错误消息文本。 |
返回值
Py_BuildValue 使用与 PyArg_ParseTuple 非常相似的格式字符串。您不是传入要构建的值的地址,而是传入实际的值。以下是一个示例,展示了如何实现 add 函数。
static PyObject *foo_add(PyObject *self, PyObject *args) { int a; int b; if (!PyArg_ParseTuple(args, "ii", &a, &b)) { return NULL; } return Py_BuildValue("i", a + b); }
如果用 Python 实现,它将如下所示:
def add(a, b): return (a + b)
您可以从函数中返回两个值,如下所示。这将使用 Python 中的列表捕获。
static PyObject *foo_add_subtract(PyObject *self, PyObject *args) { int a; int b; if (!PyArg_ParseTuple(args, "ii", &a, &b)) { return NULL; } return Py_BuildValue("ii", a + b, a - b); }
如果用 Python 实现,它将如下所示:
def add_subtract(a, b): return (a + b, a - b)
Py_BuildValue 函数
以下是Py_BuildValue 函数的标准签名:
PyObject* Py_BuildValue(char* format,...)
这里的 format 是一个 C 字符串,描述了要构建的 Python 对象。Py_BuildValue 的以下参数是构建结果的 C 值。PyObject* 结果是一个新引用。
下表列出了常用的代码字符串,其中零个或多个代码字符串连接成字符串格式。
代码 | C 类型 | 含义 |
---|---|---|
c | char | C char 变为长度为 1 的 Python 字符串。 |
d | double | C double 变为 Python float。 |
f | float | C float 变为 Python float。 |
i | int | C int 变为 Python int |
l | long | C long 变为 Python int |
N | PyObject* | 传递 Python 对象并窃取引用。 |
O | PyObject* | 传递 Python 对象并按正常方式 INCREF。 |
O& | convert+void* | 任意转换 |
s | char* | C 以 0 结尾的 char* 到 Python 字符串,或 NULL 到 None。 |
s# | char*+int | C char* 和长度到 Python 字符串,或 NULL 到 None。 |
u | Py_UNICODE* | C 宽的、以 null 结尾的字符串到 Python Unicode,或 NULL 到 None。 |
u# | Py_UNICODE*+int | C 宽字符串和长度到 Python Unicode,或 NULL 到 None。 |
w# | char*+int | 读/写单段缓冲区到 C 地址和长度。 |
z | char* | 类似于 s,也接受 None(将 C char* 设置为 NULL)。 |
z# | char*+int | 类似于 s#,也接受 None(将 C char* 设置为 NULL)。 |
(...) | 根据 ... | 从 C 值构建 Python 元组。 |
[...] | 根据 ... | 从 C 值构建 Python 列表。 |
{...} | 根据 ... | 从 C 值构建 Python 字典,交替键和值。 |
代码 {...} 从偶数个 C 值构建字典,交替键和值。例如,Py_BuildValue("{issi}",23,"zig","zag",42) 返回类似于 Python 的 {23:'zig','zag':42} 的字典