找到关于 Pandas 的507 篇文章
851 次浏览
要检查 Pandas DataFrame 中是否有任何值为 NaN,我们可以使用 isnull().values.any() 方法。步骤创建一个序列 s,一个具有轴标签(包括时间序列)的一维 ndarray。打印序列 s。检查 NaN 是否存在。创建一个二维、大小可变的、可能异构的表格数据 df。打印输入 DataFrame。检查 NaN 是否存在。示例 实时演示import pandas as pd import numpy as np s = pd.Series([1, np.nan, 3, np.nan, 3, np.nan, 7, np.nan, 3]) print "输入序列为:", s present = s.isnull().values.any() print "序列中存在 NaN:", present df = pd.DataFrame( { "x": [5, ... 阅读更多
296 次浏览
要在 Pandas 中重置分层索引,我们可以使用 reset_index() 方法。步骤创建一个二维、大小可变的、可能异构的表格数据 df。打印输入 DataFrame。使用 groupby 获取分层索引的不同级别并进行计数。打印多分层索引 DataFrame。使用 df.reset_index() 重置多分层索引 DataFrame。打印新的更新后的 DataFrame。示例 实时演示import pandas as pd df = pd.DataFrame({"x": [5, 2, 1, 9], "y": [4, 1, 5, 10]}) print "输入 DataFrame 为:", df df1 = df.groupby(["x", "y"]).count() print "输入 DataFrame 的分层索引为:", df1 df2 = df1.reset_index() print "重置后:", df2输出输入 DataFrame 为: x y 0 5 ... 阅读更多
263 次浏览
要在 Pandas 中创建多索引,我们可以使用列列表的 groupby。步骤创建一个二维、大小可变的、可能异构的表格数据 df。打印输入 DataFrame。打印 DataFrame 计数的索引。使用 groupby 获取分层索引的不同级别并进行计数。打印步骤 4 中设置的多索引。示例 实时演示import pandas as pd df = pd.DataFrame( { "x": [5, 2, 1, 9], "y": [4, 1, 5, 10], "z": [4, 1, 5, 0] } ) print "输入 DataFrame 为:", df print "默认索引:", df.count().index df1 = df.groupby(["x", "y"]).count() ... 阅读更多
626 次浏览
要将 Pandas DataFrame 转换为 NumPy 数组,我们可以使用 to_numpy()。步骤创建一个二维、大小可变的、可能异构的表格数据 df。打印输入 DataFrame。使用 df.to_numpy() 打印给定数组的 NumPy 数组。使用 df['x'].to_numpy() 打印给定数组特定列的 NumPy 数组。示例 实时演示import pandas as pd df = pd.DataFrame( { "x": [5, 2, 1, 9], "y": [4, 1, 5, 10], "z": [4, 1, 5, 0] } ) print "输入 DataFrame 为:", df print "DataFrame 转换为 numpy 为:", df.to_numpy() print "DataFrame 转换为 numpy 为:", df['x'].to_numpy()输出输入 ... 阅读更多
2K+ 次浏览
要在 Pandas DataFrame 的列中统计 NaN 值,我们可以使用 isna() 方法和 sum。步骤创建一个序列 s,一个具有轴标签(包括时间序列)的一维 ndarray。打印序列 s。统计序列中 NaN 的数量。创建一个二维、大小可变的、可能异构的表格数据 df。打印输入 DataFrame。按列查找 NaN 计数。打印计数 DataFrame。示例 实时演示import pandas as pd import numpy as np s = pd.Series([1, np.nan, 3, np.nan, 3, np.nan, 7, np.nan, 3]) print "输入序列为:", s count = s.isna().sum() print "序列中 NaN 计数:", count df = pd.DataFrame( ... 阅读更多
3K+ 次浏览
要基于列值删除 Pandas 中的 DataFrame 行,我们可以执行以下步骤:步骤创建一个二维、大小可变的、可能异构的表格数据 df。打印输入 DataFrame。在这里,我们将删除 DataFrame 中 Z 列包含 0 的行,使用 df=df[df.z != 0]打印更新后的 DataFrame,删除基于列值的行的结果。示例 实时演示import pandas as pd df = pd.DataFrame( { "x": [5, 2, 1, 9], "y": [4, 1, 5, 10], "z": [4, 1, 5, 0] } ) print "输入 DataFrame 为:", df df ... 阅读更多
265 次浏览
让我们举个例子来理解 iloc 和 loc 之间的区别。基本上 loc[0] 返回 0 索引处的值,而 iloc[0] 返回序列第一个位置的值。步骤创建一个具有轴标签(包括时间序列)的一维 ndarray。打印输入序列。使用 loc[0] 打印 0 索引处的值。使用 iloc[0] 打印序列表第一个位置的值。示例 实时演示import pandas as pd s = pd.Series(list("AEIOU"), index=[2, 1, 0, 5, 8]) print "输入序列为:", s print "索引=0 处的值:", s.loc[0] print "序列第一个位置的值:", ... 阅读更多
4K+ 次浏览
要将 Pandas DataFrame 写入 CSV 文件,我们可以执行以下步骤:步骤创建一个二维、大小可变的、可能异构的表格数据 df。打印输入 DataFrame。使用 df.to_csv 将 DataFrame 的值保存到 CSV(逗号分隔值)文件。示例 实时演示import pandas as pd df = pd.DataFrame( { "x": [5, 2, 1, 9], "y": [4, 1, 5, 10], "z": [4, 1, 5, 0] } ) print "输入 DataFrame 为:", df df.to_csv("test.csv", sep='\t')输出输入 DataFrame 为: x y z 0 5 4 4 1 2 1 1 2 1 5 5 3 9 10 0它将创建一个新文件("test.csv")并在其中保存 DataFrame 的值。
2K+ 次浏览
要基于输入值从 Pandas DataFrame 中选择行,我们可以使用 isin() 方法。步骤创建一个二维、大小可变的、可能异构的表格数据 df。打印输入 DataFrame。创建一个用于选择行的值列表。打印具有给定值的选定行。接下来,打印未选定的行。示例 实时演示import pandas as pd df = pd.DataFrame( { "x": [5, 2, 1, 9], "y": [4, 1, 5, 10], "z": [4, 1, 5, 0] } ) print "输入 DataFrame:", df values = [1, 2] print "选定的行:", ... 阅读更多
4K+ 次浏览
要通过一次追加一行来创建 Pandas DataFrame,我们可以迭代一个范围并在其中添加多列数据。步骤创建一个二维、大小可变的、可能异构的表格数据 df。打印输入 DataFrame。迭代范围 10。为不同索引分配数字值。打印创建的 DataFrame。示例 实时演示import pandas as pd import random df = pd.DataFrame( { "x": [], "y": [], "z": [] } ) print "输入 DataFrame:", df for i in range(10): df.loc[i] = [i, random.randint(1, 10), random.randint(1, 10)] print "之后 ... 阅读更多