NumPy 快速指南

NumPy - 简介

NumPy 是一个 Python 包。它代表“Numerical Python”。它是一个包含多维数组对象和用于数组处理的例程集合的库。

Numeric，NumPy 的祖先，由 Jim Hugunin 开发。另一个名为 Numarray 的包也得到了开发，它具有一些额外的功能。2005 年，Travis Oliphant 通过将 Numarray 的功能整合到 Numeric 包中创建了 NumPy 包。许多贡献者参与了这个开源项目。

使用 NumPy 进行的操作

使用 NumPy，开发人员可以执行以下操作：

数组上的数学和逻辑运算。
傅里叶变换和形状操作例程。
与线性代数相关的运算。NumPy 具有用于线性代数和随机数生成的内置函数。

NumPy – MatLab 的替代品

NumPy 通常与 SciPy（科学 Python）和 Mat−plotlib（绘图库）等包一起使用。这种组合被广泛用作 MatLab 的替代品，MatLab 是一个流行的技术计算平台。然而，Python 的 MatLab 替代方案现在被视为一种更现代和完整的编程语言。

它是开源的，这是 NumPy 的一个额外优势。

NumPy - 环境配置

标准 Python 发行版不包含 NumPy 模块。一种轻量级的替代方法是使用流行的 Python 包安装程序 pip 来安装 NumPy。

pip install numpy

启用 NumPy 的最佳方法是使用特定于您操作系统的可安装二进制包。这些二进制文件包含完整的 SciPy 堆栈（包括 NumPy、SciPy、matplotlib、IPython、SymPy 和 nose 包以及核心 Python）。

Windows

Anaconda（来自 https://www.continuum.io）是 SciPy 堆栈的免费 Python 发行版。它也适用于 Linux 和 Mac。

Canopy（https://www.enthought.com/products/canopy/）作为免费和商业发行版提供，包含适用于 Windows、Linux 和 Mac 的完整 SciPy 堆栈。

Python (x,y)：这是一个免费的 Python 发行版，包含 SciPy 堆栈和适用于 Windows 操作系统的 Spyder IDE。（可从 https://www.python-xy.github.io/ 下载）

Linux

各个 Linux 发行版的包管理器用于安装 SciPy 堆栈中的一个或多个包。

对于 Ubuntu

sudo apt-get install python-numpy 
python-scipy python-matplotlibipythonipythonnotebook python-pandas 
python-sympy python-nose

对于 Fedora

sudo yum install numpyscipy python-matplotlibipython 
python-pandas sympy python-nose atlas-devel

从源代码构建

必须安装核心 Python（2.6.x、2.7.x 和 3.2.x 及更高版本），并启用 distutils 和 zlib 模块。

必须提供 GNU gcc（4.2 及更高版本）C 编译器。

要安装 NumPy，请运行以下命令。

Python setup.py install

要测试 NumPy 模块是否已正确安装，请尝试从 Python 提示符导入它。

import numpy

如果未安装，将显示以下错误消息。

Traceback (most recent call last): 
   File "<pyshell#0>", line 1, in <module> 
      import numpy 
ImportError: No module named 'numpy'

或者，可以使用以下语法导入 NumPy 包：

import numpy as np

NumPy - Ndarray 对象

NumPy 中定义的最重要的对象是称为 ndarray 的 N 维数组类型。它描述了相同类型项目的集合。可以使用基于零的索引访问集合中的项目。

ndarray 中的每个项目在内存中占用相同大小的块。ndarray 中的每个元素都是数据类型对象（称为 dtype）的对象。

从 ndarray 对象（通过切片）提取的任何项目都由一个数组标量类型的 Python 对象表示。下图显示了 ndarray、数据类型对象（dtype）和数组标量类型之间的关系：

可以通过后面教程中描述的不同数组创建例程来构造 ndarray 类的实例。使用 NumPy 中的 array 函数创建基本 ndarray，如下所示：

numpy.array

它从任何公开数组接口的对象或返回数组的任何方法创建 ndarray。

numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)

上述构造函数采用以下参数：

序号	参数和描述
1	object 任何公开数组接口方法并返回数组的对象，或任何（嵌套）序列。
2	dtype 所需的数组数据类型，可选
3	copy 可选。默认情况下（true），对象会被复制
4	order C（行主序）或 F（列主序）或 A（任意）（默认）
5	subok 默认情况下，返回的数组强制为基类数组。如果为 true，则子类会传递
6	ndmin 指定结果数组的最小维度

请查看以下示例以更好地理解。

序号	数据类型和描述
1	bool_ 布尔值（True 或 False），存储为字节
2	int_ 默认整数类型（与 C long 相同；通常为 int64 或 int32）
3	intc 与 C int 相同（通常为 int32 或 int64）
4	intp 用于索引的整数（与 C ssize_t 相同；通常为 int32 或 int64）
5	int8 字节（-128 到 127）
6	int16 整数（-32768 到 32767）
7	int32 整数（-2147483648 到 2147483647）
8	int64 整数（-9223372036854775808 到 9223372036854775807）
9	uint8 无符号整数（0 到 255）
10	uint16 无符号整数（0 到 65535）
11	uint32 无符号整数（0 到 4294967295）
12	uint64 无符号整数（0 到 18446744073709551615）
13	float_ float64 的简写
14	float16 半精度浮点数：符号位、5 位指数、10 位尾数
15	float32 单精度浮点数：符号位、8 位指数、23 位尾数
16	float64 双精度浮点数：符号位、11 位指数、52 位尾数
17	complex_ complex128 的简写
18	complex64 复数，由两个 32 位浮点数（实部和虚部）表示
19	complex128 复数，由两个 64 位浮点数（实部和虚部）表示

序号	属性 & 描述
1	C_CONTIGUOUS (C) 数据位于单个、C 样式连续段中
2	F_CONTIGUOUS (F) 数据位于单个、Fortran 样式连续段中
3	OWNDATA (O) 数组拥有其使用的内存或从另一个对象借用它
4	WRITEABLE (W) 数据区域可以写入。将其设置为 False 会锁定数据，使其成为只读
5	ALIGNED (A) 数据和所有元素都针对硬件进行了适当的对齐
6	UPDATEIFCOPY (U) 此数组是其他某个数组的副本。当此数组被释放时，基础数组将使用此数组的内容进行更新

序号	参数和描述
1	buffer 任何公开缓冲区接口的对象
2	dtype 返回的 ndarray 的数据类型。默认为浮点数
3	count 要读取的项目数，默认 -1 表示所有数据
4	offset 开始读取的位置。默认为 0

序号	参数和描述
1	start 区间的起始值。如果省略，则默认为 0
2	stop 区间的结束值（不包括此数字）
3	step 值之间的间距，默认为 1
4	dtype 结果 ndarray 的数据类型。如果未给出，则使用输入的数据类型

序号	参数和描述
1	start 序列的起始值
2	stop 序列的结束值，如果 endpoint 设置为 true，则包含在序列中
3	num 要生成的等间距样本数。默认为 50
4	endpoint 默认为 True，因此 stop 值包含在序列中。如果为 False，则不包含
5	retstep 如果为 True，则返回样本和连续数字之间的步长
6	dtype 输出ndarray的数据类型

序号	参数和描述
1	start 序列的起始点为 base^start
2	stop 序列的最终值为 base^stop
3	num 范围内的值的数量。默认为 50
4	endpoint 如果为 True，则 stop 是范围内的最后一个值
5	base 对数空间的底数，默认为 10
6	dtype 输出数组的数据类型。如果未给出，则取决于其他输入参数

序号	参数和描述
1	c_index 可以跟踪 C 顺序索引
2	f_index 可以跟踪 Fortran 顺序索引
3	multi-index 可以跟踪每次迭代一个的索引类型
4	external_loop 导致给定的值为具有多个值的一维数组，而不是零维数组

序号	形状和描述
1	reshape 在不更改数据的情况下为数组提供新的形状
2	flat 数组上的 1-D 迭代器
3	flatten 返回数组折叠成一维的副本
4	ravel 返回一个连续的扁平数组

序号	操作和描述
1	transpose 置换数组的维度
2	ndarray.T 与 self.transpose() 相同
3	rollaxis 向后滚动指定的轴
4	swapaxes 交换数组的两个轴

序号	维度和描述
1	broadcast 生成模拟广播的对象
2	broadcast_to 将数组广播到新的形状
3	expand_dims 扩展数组的形状
4	squeeze 从数组的形状中移除一维条目

序号	数组和描述
1	concatenate 沿着现有轴连接一系列数组
2	stack 沿着新轴连接一系列数组
3	hstack 水平（列方向）依次堆叠数组
4	vstack 垂直（行方向）依次堆叠数组

序号	数组和描述
1	split 将数组分割成多个子数组
2	hsplit 水平（列方向）将数组分割成多个子数组
3	vsplit 垂直（行方向）将数组分割成多个子数组

序号	元素和描述
1	resize 返回具有指定形状的新数组
2	append 将值追加到数组的末尾
3	insert 在给定轴上的给定索引之前插入值
4	delete 返回一个新数组，其中删除了沿轴的子数组
5	unique 查找数组的唯一元素

序号	操作和描述
1	bitwise_and 计算数组元素的按位 AND 运算
2	bitwise_or 计算数组元素的按位 OR 运算
3	invert 计算按位 NOT
4	left_shift 将二进制表示的位向左移动
5	right_shift 将二进制表示的位向右移动

序号	函数和描述
1	add() 对于两个 str 或 Unicode 数组，返回元素级的字符串连接
2	multiply() 返回字符串的多次连接，元素级
3	center() 返回给定字符串的副本，其中元素在指定长度的字符串中居中
4	capitalize() 返回字符串的副本，其中只有第一个字符大写
5	title() 返回字符串或 unicode 的元素级标题大小写版本
6	lower() 返回一个数组，其中元素转换为小写
7	upper() 返回一个数组，其中元素转换为大写
8	split() 使用分隔符分隔符返回字符串中单词的列表
9	splitlines() 返回元素中行的列表，在行边界处中断
10	strip() 返回一个副本，其中删除了前导和尾随字符
11	join() 返回一个字符串，它是序列中字符串的连接
12	replace() 返回字符串的副本，其中所有出现的子字符串都被新字符串替换
13	decode() 按元素级调用 str.decode
14	encode() 按元素级调用 str.encode

kind	速度	最坏情况	工作空间	稳定
‘quicksort’	1	O(n^2)	0	否
‘mergesort’	2	O(n*log(n))	~n/2	是
‘heapsort’	3	O(n*log(n))	0	否

序号	参数和描述
1	a 要排序的数组
2	axis 要沿其排序数组的轴。如果为 None，则数组会被展平，在最后一个轴上排序
3	kind 默认为 quicksort
4	order 如果数组包含字段，则要排序的字段的顺序

序号	参数和描述
1	n 结果矩阵中的行数
2	M 列数，默认为 n
3	k 对角线的索引
4	dtype 输出的数据类型

序号	函数和描述
1	dot 两个数组的点积
2	vdot 两个向量的点积
3	inner 两个数组的内积
4	matmul 两个数组的矩阵乘积
5	determinant 计算数组的行列式
6	solve 求解线性矩阵方程
7	inv 查找矩阵的乘法逆

序号	字符 & 描述
1	'-' 实线样式
2	'--' 虚线样式
3	'-.' 点划线样式
4	':' 点线样式
5	'.' 点标记
6	',' 像素标记
7	'o' 圆形标记
8	'v' 下三角形标记
9	'^' 上三角形标记
10	'<' 左三角形标记
11	'>' 右三角形标记
12	'1' 向下三角形标记
13	'2' 向上三角形标记
14	'3' 向左三角形标记
15	'4' 向右三角形标记
16	's' 正方形标记
17	'p' 五边形标记
18	*''** 星形标记
19	'h' 六边形1标记
20	'H' 六边形2标记
21	'+' 加号标记
22	'x' X标记
23	'D' 菱形标记
24	'd' 细菱形标记
25	'\|' 垂直线标记
26	'_' 水平线标记

字符	颜色
'b'	蓝色
'g'	绿色
'r'	红色
'c'	青色
'm'	洋红色
'y'	黄色
'k'	黑色
'w'	白色

NumPy 快速指南

NumPy - 简介

使用 NumPy 进行的操作

NumPy – MatLab 的替代品

NumPy - 环境配置

Windows

Linux

对于 Ubuntu

对于 Fedora

从源代码构建

NumPy - Ndarray 对象

示例 1

示例 2

示例 3

示例 4

NumPy - 数据类型

数据类型对象 (dtype)

示例 1

示例 2

示例 3

示例 4

示例 5

示例 6

示例 7

示例 8

NumPy - 数组属性

ndarray.shape

示例 1

示例 2

示例 3

ndarray.ndim

示例 1

示例 2

numpy.itemsize

示例 1

示例 2

numpy.flags

示例

NumPy - 数组创建函数

numpy.empty

示例

numpy.zeros

示例 1

示例 2

示例 3

numpy.ones

示例 1

示例 2

NumPy - 从现有数据创建数组

numpy.asarray

示例 1

示例 2

示例 3

示例 4

numpy.frombuffer

示例

numpy.fromiter

示例 1

示例 2

NumPy - 从数值范围创建数组

numpy.arange

示例 1

示例 2

示例 3

numpy.linspace

示例 1

示例 2

示例 3

numpy.logspace

示例 1

示例 2

NumPy - 索引和切片

示例 1

示例 2

示例 3

示例 4

示例 5

示例 6

示例 7

NumPy - 高级索引