- NumPy 教程
- NumPy - 首页
- NumPy - 简介
- NumPy - 环境
- NumPy 数组
- NumPy - Ndarray 对象
- NumPy - 数据类型
- NumPy 创建和操作数组
- NumPy - 数组创建例程
- NumPy - 数组操作
- NumPy - 从现有数据创建数组
- NumPy - 从数值范围创建数组
- NumPy - 遍历数组
- NumPy - 重塑数组
- NumPy - 连接数组
- NumPy - 堆叠数组
- NumPy - 分割数组
- NumPy - 展平数组
- NumPy - 转置数组
- NumPy 索引和切片
- NumPy - 索引和切片
- NumPy - 高级索引
- NumPy 数组属性和操作
- NumPy - 数组属性
- NumPy - 数组形状
- NumPy - 数组大小
- NumPy - 数组步长
- NumPy - 数组元素大小
- NumPy - 广播
- NumPy - 算术运算
- NumPy - 数组加法
- NumPy - 数组减法
- NumPy - 数组乘法
- NumPy - 数组除法
- NumPy 高级数组操作
- NumPy - 交换数组轴
- NumPy - 字节交换
- NumPy - 副本和视图
- NumPy - 元素级数组比较
- NumPy - 过滤数组
- NumPy - 连接数组
- NumPy - 排序、搜索和计数函数
- NumPy - 搜索数组
- NumPy - 数组的并集
- NumPy - 查找唯一行
- NumPy - 创建日期时间数组
- NumPy - 二元运算符
- NumPy - 字符串函数
- NumPy - 数学函数
- NumPy - 统计函数
- NumPy - 矩阵库
- NumPy - 线性代数
- NumPy - Matplotlib
- NumPy - 使用 Matplotlib 绘制直方图
- NumPy - NumPy 的 I/O
- NumPy 排序和高级操作
- NumPy - 排序数组
- NumPy - 沿轴排序
- NumPy - 使用花式索引排序
- NumPy - 结构化数组
- NumPy - 创建结构化数组
- NumPy - 操作结构化数组
- NumPy - 字段访问
- NumPy - 记录数组
- NumPy - 加载数组
- NumPy - 保存数组
- NumPy - 向数组追加值
- NumPy - 交换数组列
- NumPy - 向数组插入轴
- NumPy 处理缺失数据
- NumPy - 处理缺失数据
- NumPy - 识别缺失值
- NumPy - 删除缺失数据
- NumPy - 填充缺失数据
- NumPy 性能优化
- NumPy - 使用数组进行性能优化
- NumPy - 使用数组进行矢量化
- NumPy - 数组的内存布局
- NumPy 线性代数
- NumPy - 线性代数
- NumPy - 矩阵库
- NumPy - 矩阵加法
- NumPy - 矩阵减法
- NumPy - 矩阵乘法
- NumPy - 元素级矩阵运算
- NumPy - 点积
- NumPy - 矩阵求逆
- NumPy - 行列式计算
- NumPy - 特征值
- NumPy - 特征向量
- NumPy - 奇异值分解
- NumPy - 求解线性方程组
- NumPy - 矩阵范数
- NumPy 元素级矩阵运算
- NumPy - 求和
- NumPy - 求平均值
- NumPy - 求中位数
- NumPy - 求最小值
- NumPy - 求最大值
- NumPy 集合运算
- NumPy - 唯一元素
- NumPy - 交集
- NumPy - 并集
- NumPy - 差集
- NumPy 有用资源
- NumPy 编译器
- NumPy - 快速指南
- NumPy - 有用资源
- NumPy - 讨论
NumPy char.split() 函数
NumPy 的 char.split() 函数用于根据指定的定界符将数组的每个字符串元素拆分为子字符串列表。
默认情况下,split() 函数以空格为分隔符,但我们可以提供自定义定界符。此函数对于标记化或解析文本数据很有用。
此函数单独处理输入数组中的每个字符串,并返回一个形状相同的数组,其中每个元素都是拆分操作产生的子字符串列表。
语法
以下是 NumPy char.split() 函数的语法:
numpy.char.split(a, sep=None, maxsplit=-1)
参数
以下是 NumPy char.split() 函数的参数:
a(类似数组的 str 或 unicode):包含要拆分的字符串的输入数组。
sep(str,可选):要拆分字符串的定界符。如果未提供,则默认为空格。
maxsplit(int,可选):要执行的最大拆分次数。如果未提供或设置为 -1,则拆分次数没有限制。
返回值
此函数返回一个与输入形状相同的数组,其中每个字符串元素都被拆分操作产生的子字符串列表替换。
示例 1
以下是 NumPy char.split() 函数的基本示例,其中输入数组中的每个字符串在出现空格时都会拆分为子字符串列表。结果数组包含从每个原始字符串中提取的单词列表:
import numpy as np arr = np.array(['apple banana cherry', 'date elderberry fig']) split_arr = np.char.split(arr) print(split_arr)
以下是 numpy.char.split() 函数基本示例的输出:
[list(['apple', 'banana', 'cherry']) list(['date', 'elderberry', 'fig'])]
示例 2
我们可以使用 char.split() 函数根据自定义定界符拆分字符串。这在解析或标记化文本数据时提供了更大的灵活性。在此示例中,我们使用定界符 逗号 (,) 来拆分数组中的字符串:
import numpy as np arr = np.array(['apple,banana,cherry', 'date,elderberry,fig']) split_arr = np.char.split(arr, sep=',') print(split_arr)
以下是使用自定义定界符拆分的输出:
[list(['apple', 'banana', 'cherry']) list(['date', 'elderberry', 'fig'])]
示例 3
我们可以使用 char.split() 函数中的 maxsplit 参数来控制执行的拆分次数。当我们想要限制每个字符串元素产生的子字符串数量时,这很有用。以下示例说明了 maxsplit 参数:
import numpy as np arr = np.array(['one-two-three-four', 'five-six-seven']) split_arr = np.char.split(arr, sep='-', maxsplit=2) print(split_arr)
以下是限制拆分次数的输出:
[list(['one', 'two', 'three-four']) list(['five', 'six', 'seven'])]
numpy_string_functions.htm
广告